Análisis de supervivencia (II)

Introducción

El análisis de supervivencia sigue aún en constante desarrollo siendo una de las herramientas más importantes en la investigación clínica. Su uso está muy extendido gracias a la disponibilidad en los ordenadores de programas y paquetes estadísticos que incluyen muchas de las técnicas estadísticas de supervivencia. No obstante, la gran variedad y las distintas posibilidades de los estudios de supervivencia, (eventos recurrentes, riesgos competitivos, etc.) hacen que actualmente vayan apareciendo nuevos métodos y técnicas de análisis de los datos.

Comparación de curvas de supervivencia

Una de las situaciones que podemos encontrarnos es la de comparar la supervivencia de dos o más grupos de individuos y ver si esas diferencias son estadísticamente significativas. Existen diversas pruebas estadísticas, siendo en todas ellas la hipótesis nula la que mantiene que las diferencias no son importantes a lo largo del tiempo, y la alternativa la que dice que al menos uno de los grupos se comporta de forma distinta al resto. Si las curvas de supervivencia se cruzan durante el seguimiento, es muy poco probable que podamos encontrar diferencias.

Imaginemos que tenemos un grupo de 30 pacientes con EPOC dados de alta tras un ingreso originado por su enfermedad, y que deseamos saber si aquellos que tienen insuficiencia cardiaca (IC), reingresan antes. Como podemos ver en la figura 1 aquellos pacientes con IC tienen un mayor número de recaídas a lo largo del periodo de seguimiento.

Figura 1. Curvas de supervivencia en los pacientes con EPOC con y sin insuficiencia cardiaca (IC).

Si estudiamos las medianas de tiempo de reingreso en cada grupo, solo podríamos calcular las del grupo con IC, que sería de 7 meses. En el grupo sin IC, al tener menos del 50% de eventos, no es posible calcular una mediana de tiempo de reingreso. Recordemos que en los estudios de supervivencia, siempre es más conveniente dar las medianas de supervivencia y no las medias, ya que éstas últimas pueden estar distorsionadas por los pacientes con seguimiento más largo y por los pacientes censurados. Si como en el ejemplo no disponemos de mediana de supervivencia, podemos dar la supervivencia del percentil 25, o bien, dar la supervivencia a intervalos regulares de tiempo (por ejemplo cada mes, cada 6 meses, cada año…) dividida por grupos o por el factor de estudio. La función de supervivencia puede obtenerse fácilmente desde cualquier programa estadístico junto con las curvas Kaplan-Meier como un resultado más. Como siempre, es conveniente dar los resultados de la supervivencia acompañados de sus respectivos intervalos de confianza.

Una de las pruebas estadísticas más utilizadas para la comparación entre grupos es el test Log-rank, y al igual que sucede con otras pruebas como el test de Wilcoxon (Breslow) o Taron-Ware, se basa en comparar las muertes observadas en cada grupo con las esperadas si la mortalidad fuese la misma en todos los grupos. Por ejemplo, si comparáramos la mortalidad de dos grupos A y B, siendo cada uno del mismo tamaño, es de esperar que en cada momento del seguimiento, el número de muertes sea aproximadamente igual en un grupo que en otro. Si las diferencias son mucho mayores de lo esperado, entonces rechazaríamos la hipótesis nula. El estadístico utilizado se aproxima a una c²(chi-cuadrado) con tantos grados de libertad como grupos comparados menos uno.

Es posible que al final del seguimiento, tengamos el mismo número de eventos en el grupo A que en el B, siendo el comportamiento en cuanto a la supervivencia en cada grupo totalmente distinto. Imaginemos que en el grupo A, casi todas las muertes se producen al principio del seguimiento mientras que el grupo B, suceden al final del mismo. La supervivencia final podría ser la misma aunque la evolución de los grupos haya sido totalmente diferente. Por ello conviene siempre estudiar la evolución de cada grupo observando las curvas para ver si la aparición de los eventos es homogénea a lo largo del tiempo, o si por el contrario los eventos aparecen concentrados en un determinado periodo de tiempo.

Las diferencias entre los distintos test para comparar las curvas de supervivencia, radica en el peso o importancia que se dé al momento en el que se produce el evento a lo largo del seguimiento. La prueba de Breslow (Wilcoxon) da más peso a los eventos que se producen al inicio del seguimiento, donde hay más sujetos en riesgo. La prueba de Tarone-Ware, es intermedia al Log-rank, dando más peso a los eventos que se producen al principio, aunque no tanto como la de Breslow.

En nuestro ejemplo, la prueba de Log-rank (logaritmo de los rangos o también conocida como prueba de Mantel-Cox y similar a la de Mantel-Haenszel) nos da un valor 4,39 con una p=0,036 lo que indica que la supervivencia, en este caso los tiempos de reingresos, son mayores en el grupo sin IC. Por tanto podemos concluir que los pacientes con insuficiencia cardiaca tienen unos tiempos de reingreso menores que aquellos pacientes sin IC, siendo estas diferencias estadísticamente significativas.

Para realizar los cálculos, se han de ordenar cronológicamente las observaciones de cada grupo de forma combinada y contabilizar el número de sucesos que se producen en cada momento en el tiempo. De no existir diferencias entre los grupos, lo “esperado” a lo largo del tiempo, es que en cada momento tendríamos la misma proporción de eventos en uno y otro grupo. El estadístico c²con un grado de libertad permite contrastar si esto es así:

Esta prueba también nos sirve para comparar más de dos grupos, siendo O_A y O_B los sucesos observados en el grupo A y B, y E_A y E_B los eventos esperados en los grupos A y B respectivamente.

Regresión de Cox

El modelo de regresión de Cox, también conocido como modelo de riesgos proporcionales, es en el análisis de la supervivencia el equivalente a la regresión lineal. La regresión de Cox también guarda cierta similitud con la regresión logística así como en la interpretación de sus resultados, sin embargo a diferencia de la regresión logística, estima tasas de incidencia, o tasas de riesgo (“hazard rate”) en lugar de odds ratios. La regresión de Cox, nos permitirá estudiar de forma simultánea la relación entre un conjunto de variables predictoras o explicativas y la tasa de incidencia del evento de interés. También podremos predecir y describir la evolución de la tasa de riego a lo largo del tiempo a partir de un conjunto de variables predictoras cuyos valores pueden cambiar a lo largo del tiempo. Como siempre, el evento de interés no tiene necesariamente que ser la muerte, pudiéndose estudiar cualquier otro, sin embargo el suceso debe ser irreversible y ocurrir una sola vez, siendo necesaria además la censura no informativa, al igual que sucedía con las curvas Kaplan-Meier.

Muchas veces los eventos pueden ser recurrentes, presentándose más de una vez en un mismo sujeto, dando lugar a observaciones no independientes ya que estas ocurrencias están correlacionadas entre sí. El modelo de regresión de Cox analiza eventos únicos que se sólo se presentan una vez en el tiempo aunque utilizando la estrategia adecuada es posible obtener estimaciones de las tasas de incidencia para cada ocurrencia.

Para entender mejor el significado e interpretación de los resultados de la regresión de Cox, antes se debe comprender el significado de un hazard ratio (tasa instantánea de riesgo). Aunque básicamente su interpretación es similar a la de un riesgo relativo, a diferencia de éste que se calcula como un cociente de proporciones, el hazard ratio (HR) es en realidad un cociente de tasas o de densidades de incidencia. Si el evento de interés que estamos estudiando es supervivencia, un hazard ratio de 2 quiere decir que aquellos que están expuestos al factor de riesgo, “fallecen 2 veces más rápido” que aquellos que no están expuestos al factor, o lo que es lo mismo, la rapidez con la cual fallecen los pacientes expuestos es el doble que la que tienen aquellos pacientes no expuestos. Un HR de 0,5 indicaría por el contrario una disminución a la mitad en la velocidad de ocurrencia de la muerte en los pacientes expuestos. Al igual que el riesgo relativo o la odds ratio, un HR de 1 indica un efecto nulo y por tanto una velocidad similar en la aparición de la muertes en uno y otro grupo. Si nuestra variable o factor de estudio no fuese una variable categórica y fuese cuantitativa como la edad, el HR se interpretaría como el incremento en la tasa de incidencia por cada unidad en la que medimos nuestra variable.

Un supuesto básico que debe cumplir la regresión de Cox para su aplicación es el supuesto de proporcionalidad de riesgos. Si estudiamos la mortalidad entre dos grupos de pacientes, expuestos y no expuestos ha de cumplirse que el cociente de las tasas de riesgo (HR) entre ambos grupos debe ser constante a lo largo del tiempo de seguimiento. Esto quiere decir que si tuviésemos un seguimiento entre dos grupos de pacientes durante 5 años con un HR en el grupo de expuestos de 2 respecto a los no expuestos, su HR debe ser aproximadamente igual a lo largo de los 5 años de seguimiento. Otro supuesto que ha de comprobarse es que la relación entre las variables explicativas o predictoras respecto a la tasa instantánea de riesgo debe ser log-lineal. Aunque existen métodos y técnicas adecuadas para comprobar estos supuestos, su dificultad excede los objetivos de este texto.

Matemáticamente el modelo de Cox está formado por el producto de dos términos. Sin entrar en demasiados detalles, diremos que el primer término depende sólo del tiempo mientras que el segundo depende de las variables predictoras. Su formulación es la siguiente:

§ : Es el riesgo de observar el evento en el instante t en aquellos pacientes que tienen un valor determinado en las variables explicativas/predictoras X_i.

§ : Es la función de riesgo de referencia, equivalente a la tasa de riesgo de un individuo con valor 0 en todas las variables explicativas X_i. Depende exclusivamente del tiempo y se obtiene a partir de los datos.

§ : Función exponencial de las p variables explicativas.

Con la regresión de Cox podemos analizar de forma conjunta la relación entre nuestras variables explicativas y la tasa de incidencia del evento estudiado. Veamos los resultados de nuestro ejemplo (figura 1) en el caso más simple que sería con una sola variable explicativa, para ver si la tasa de reingresos en pacientes con EPOC es diferente según tengan o no insuficiencia cardiaca (IC). Dicha tabla corresponde a los resultados del programa SPSS (Tabla 1).

Tabla 1. Resultados de la regresión de Cox con el programa SPSS.

	B	ET	Wald	gl	Sig.	Exp(B)	Intervalo de confianza 95,0% Exp(B)
Grupo	1,487	0,791	3,536	1	0,060	4,424	0,939	20,842

El resultado de la tabla muestra el coeficiente estimado b así como su error estándar. El valor HR podemos encontrarlo en la columna “Exp(B)” que es de 4,4 lo que indicaría que aquellos pacientes con IC tienen un riesgo 4,4 veces mayor de reingreso que los pacientes sin IC, aunque para ser exactos de lo que realmente estamos realmente hablando, es que la “velocidad” (tasa de incidencia) de reingresos es de 4,4 veces mayor en los pacientes con IC. En nuestro ejemplo, el HR resulta no ser significativo (p=0,060), y por ello el intervalo de confianza incluye el 1.

Bibliografía

1 Martínez González, M. A., A. Sánchez-Villegas y F. J. Faulín Fajardo (2006). Introducción a los modelos de supervivencia. Regresión de Cox. Bioestadística Amigable. 2ª Edición. Ed: Díaz de Santos. 710-717.

2 Molinero, L. M. (2001). http://www.seh-lelha.org/superviv2.htm. Modelos de regresión de Cox para el tiempo de supervivencia. (Alce Ingeniería).

3 Doménech Massons, J. M. (2008). Metodología de investigación en Ciencias de Salud. Análisis de la supervivencia. www.metodo.uab.cat.

4 Walters, S. J. What is a Cox. model? (2001). http://www.medicine.ox.ac.uk/bandolier/painres/download/whatis/COX_MODEL.pdf