Selección de Variables Bayesianas en Modelos de Supervivencia con Datos Censurados

Saba Infante 1 , María E. Pérez 2
1Departamento de Matemáticas, Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
2Departamento de Matemáticas, Universidad de Puerto Rico, Recinto de Piedras, Puerto Rico
Autor de Correspondencia: sinfante@uc.edu.ve, meglee@uprrp.edu

Ver Arhivo PDF

Resumen

En este artículo se estudian dos problemas. El primero está relacionado con el modelaje de los datos, se considera el modelo de regresión de riesgo proporcional de Cox (1972) con datos censurados a la derecha. Se propone un método semiparamétrico en el cual una a priori no paramétrica que es especificada por el riesgo base se modela usando un proceso Beta con incrementos independientes no negativos; la parte paramétrica que es representada por los parámetros del modelo de regresión se modela usando una priori paramétrica normal multivariada; y el espacio de los modelos se le asigna una a priori paramétrica informativa que se enfoca sobre los datos mejor que sobre los parámetros. El segundo problema que se considera es la selección de variables en el modelo de supervivencia de Cox. Se proponen dos métodos para calcular las probabilidades a posteriori y los factores de Bayes, se utiliza un algoritmo Monte Carlo por Cadenas de Markov (MCCM) propuesto por (Chib, 1995), y un método de aproximación de Laplace desarrollado por (Tierney & Kadane, 1986). La metodología es ilustrada mediante el reanálisis de los datos del estudio del mieloma múltiple utilizados por (Krall et al., 1975).


Palabras claves:

Bayesian Variables Selection in Survival model with Censored Data

Saba Infante 1 , María E. Pérez , 2
1Departamento de Matemáticas, Facultad de Ciencias y Tecnología (FACYT), Universidad de Carabobo, Carabobo, Venezuela
2Departamento de Matemáticas, Universidad de Puerto Rico, Recinto de Piedras, Puerto Rico
Autor de Correspondencia: sinfante@uc.edu.ve, meglee@uprrp.edu

Ver Arhivo PDF

Abstract

In this paper two problems are studied. The first is related with the modeling of the data using the proportional hazards regression model of Cox (1972) with right censured data. A semiparametric approach is proposed in which a nonparametric prior is specified for the baseline hazard rate, which is modeled using a Beta process prior with nonnegative independent increments; for the parametric prior that is specified for the regression parameters, a parametric multivariate normal prior is proposed; and for the model space a parametric informative prior that focuses on the data rather than the parameters. The second problem that is considered is the variables selection in Cox's survival models. Two methods are proposed for computing the posterior model probabilities and Bayes factor. The first method uses a Markov Chain Monte Carlo algorithm, and the second method uses a Laplace approach a technique developed by (Tierney & Kadane, 1986). The methodology is illustrated by means of reanalysis of the data of the multiple myeloma study used by (Krall et al., 1975).


Keywords: