Análisis de supervivencia
Este tutorial trata sobre el análisis de supervivencia (análisis del tiempo transcurrido hasta el suceso). Comenzamos con la cuestión de qué es el análisis de supervivencia, después llegamos al importante punto de qué significa censurar, y a continuación tratamos la curva de Kaplan-Meier, la prueba de log-rank y la regresión de Cox (más sobre esto en los tutoriales separados).
¿Qué es un análisis del tiempo de supervivencia?
El análisis del tiempo de supervivencia es un grupo de métodos estadísticos en los que la variable objeto de estudio es el tiempo transcurrido hasta que se produce un acontecimiento. ¿Qué significa "tiempo hasta la aparición de un acontecimiento"?
El análisis del tiempo de supervivencia considera una variable que tiene un tiempo inicial y, cuando se produce un acontecimiento concreto, un tiempo final. El tiempo transcurrido entre el momento inicial y el acontecimiento es el objeto del análisis de supervivencia. Por ejemplo, el tiempo puede medirse en días, semanas o meses.
Casos de uso del análisis del tiempo de supervivencia
Un ejemplo sería analizar el tiempo transcurrido entre la abstinencia de una droga y la recaída de la persona. El tiempo inicial sería entonces el final de la abstinencia y el acontecimiento considerado sería la recaída. Por ejemplo, podría interesarte saber si los distintos tipos de tratamiento tienen un efecto sobre el tiempo hasta la recaída.
Como indica el nombre "análisis del tiempo de supervivencia", también hay un ejemplo clásico: el tiempo hasta la muerte tras una enfermedad. Aquí, el tiempo inicial es el reconocimiento de la enfermedad y el tiempo final es la muerte. A menudo es de gran interés saber si un fármaco concreto tiene un efecto sobre el tiempo de supervivencia.
Por supuesto, el acontecimiento no tiene por qué ser negativo: podrías fijarte en el tiempo que se tarda en volver al trabajo tras un agotamiento, por ejemplo.
Además, el objeto investigado no tiene por qué ser un ser humano. En ingeniería, por ejemplo, una pregunta habitual es cuánto durará un componente en una prueba sin fallar. En este caso, se podrían variar distintos parámetros para ver si tienen algún efecto sobre el tiempo de supervivencia del objeto.
Tiempo de supervivencia (Tiempo hasta el evento)
El tiempo considerado puede no tener nada que ver con el "tiempo de supervivencia" real, pero sigue llamándose tiempo de supervivencia y análisis del tiempo de supervivencia.
Ejemplo de análisis del tiempo de supervivencia
¿Cómo se realiza exactamente un análisis de supervivencia? Veamos un ejemplo. Supongamos que eres protésico dental y quieres analizar el "tiempo de supervivencia" de un empaste en un diente.
Así pues, tu tiempo inicial es el momento en que una persona acude al dentista para que le pongan un empaste. El tiempo final, o evento, es el momento en que se rompe el empaste. Ahora te interesa el tiempo transcurrido entre estos dos acontecimientos.
En primer lugar, por supuesto, necesitas sujetos para tener datos que evaluar. Ahora puedes anotar el tiempo que transcurre hasta que se produce el llenado de cada persona sometida a la prueba.
Probablemente te harás la siguiente pregunta ¿Qué ocurre si el llenado de una persona de prueba no se produce en absoluto? ¿O qué ocurre si una persona se muda, cambia de dentista, y simplemente no se sabe cuándo se romperá el empaste?
Todos estos casos se resumen bajo el término "censura". Veamos qué significa.
Datos censurados
En primer lugar, es importante recordar que un estudio no puede prolongarse indefinidamente, sino que está limitado en el tiempo. Por razones de recursos (tiempo, dinero, etc.) y simplemente porque quieres publicar los resultados en algún momento, cada estudio tiene una fecha clara de inicio y fin.
Si se introduce un empaste dentro de este periodo de tiempo y luego el empaste vuelve a salir dentro de este periodo de tiempo y esto también se documenta, entonces hay un caso válido. El suceso se ha producido.
Sin embargo, también es posible que se inserte un empaste y luego se llegue al final del estudio antes de que se produzca el suceso. O puede ocurrir que un sujeto decida no continuar con el estudio. En ambos casos, no sabes cuándo o si se ha producido el acontecimiento considerado.
Además, puede ocurrir otro acontecimiento que no se tenga en cuenta en el estudio. Por ejemplo, el paciente podría morir o incluso perder todo el diente. En ambos casos, el suceso considerado, que el empaste se rompa, ya no puede ocurrir.
También puede ocurrir que el paciente no se dé cuenta de que el empaste se ha roto y sólo lo descubra en la siguiente revisión rutinaria.
En definitiva, hay muchos casos en los que no se dispone de todos los datos. Estos datos se denominan "datos censurados". Aprenderás a tratar estos datos en el tutorial sobre la curva de Kaplan-Meier. Veamos ahora los métodos más habituales de análisis de supervivencia.
Métodos de análisis del tiempo de supervivencia
Los tres métodos más habituales de análisis del tiempo de supervivencia son (1) las curvas de tiempo de supervivencia de Kaplan Meier, (2) la prueba de rangos logarítmicos y (3) la regresión de Cox.
A continuación cubriremos brevemente estos tres aspectos, y luego te mostraré cómo calcular fácilmente estos métodos en línea utilizando DATAtab. Para cada uno de los tres métodos hay un tutorial detallado independiente con ejemplos de cálculo.
Curvas de tiempo de supervivencia de Kaplan Meier
La curva de Kaplan Meier se utiliza para representar gráficamente la tasa de supervivencia o función de supervivencia. Aquí, el tiempo se representa en el eje x y la tasa de supervivencia en el eje y.
¿Qué es la tasa de supervivencia? En este punto, volvemos al ejemplo del empaste dental. Supongamos que hemos recogido datos sobre el tiempo que tarda en salir un empaste. En la curva de Kaplan Meier, ahora puedes leer qué probabilidad hay de que un empaste dure más de un tiempo determinado.
En este contexto, podría interesarte, por ejemplo, la probabilidad de que tu empaste dure más de 5 años. Para ello, sólo tienes que desplazarte a 5 años en el eje x del gráfico y ver cuál es la tasa de supervivencia (eje y). A los 5 años, la curva de Kaplan Meier te da un valor de 0.7.
Por tanto, es un 70% probable que un empaste dure más de 5 años. Por supuesto, los datos son puramente ficticios. Si te interesa saber cómo se crea la curva de Kaplan Meier a partir de datos existentes, mira mi vídeo. Ahora quizá te interese saber si esta curva difiere para distintos materiales de obturación, por ejemplo, si un material de obturación es mejor que otro. Para responder a esta pregunta te ayudará la prueba de rango logarítmico.
La mediana de supervivencia, que es el tiempo que sobreviven la mitad de los sujetos, puede ser una medida de resumen útil y se suele indicar en los informes de investigación. Puede leerse a partir de la curva de Kaplan-Meier siempre que la curva descienda por debajo del punto "supervivencia 0.50" del eje y, lo que no ocurre con estos datos.
Además, en los informes de investigación se suele indicar la mediana de supervivencia. La mediana de supervivencia es el tiempo que sobreviven la mitad de los sujetos. Esto puede verse en la curva de Kaplan-Meier cuando la curva cae por debajo del punto "0.50 de supervivencia" en el eje y.
Tutorial completo Curva de Kaplan MeierPrueba de rango logarítmico
La prueba de rango logarítmico compara la distribución del tiempo hasta que se produce un suceso de dos o más muestras independientes. Por ejemplo, podrías estar interesado en saber si existe alguna diferencia en el tiempo de supervivencia de dos materiales diferentes. En este ejemplo, utilizas el material A para la mitad de los sujetos y el material B para la otra mitad.
La prueba de rango logarítmico te da ahora una respuesta a la siguiente pregunta: ¿Existe una diferencia significativa entre las dos curvas? O dicho de otro modo: ¿Influye el material de obturación en el "tiempo de supervivencia" de la obturación?
Por tanto, la hipótesis nula es No hay tendencia a que un grupo sobreviva menos que el otro.
Tutorial completo Prueba Log RankRegresión de Cox
¿Y si ahora quieres comprobar si hay otros parámetros que influyan en la curva? Digamos que quieres saber no sólo si el material influye en el tiempo de supervivencia, sino también si influye la edad de los sujetos/problación. Para responder a esta pregunta, la regresión de Cox es el método adecuado.
Tutorial completo Regresión de CoxCalcular el análisis del tiempo de supervivencia con DATAtab
Cargar datos de ejemploCon DATAtab puedes calcular fácilmente un análisis del tiempo de supervivencia en línea. Sólo tienes que ir a la (1) Calculadora de Análisis de Supervivencia, (2) copiar tus propios datos en la tabla, y (3) hacer clic en "Más" y luego en Análisis de Supervivencia.
En el ejemplo anterior, una vez que tenemos una columna con el "tiempo", a continuación una columna que nos dice si el "suceso ocurrió" o no, por lo que el caso está censurado o no. Aquí 1 significa "ocurrido" y 0 "censurado". Luego tenemos la variable "Material" con los dos materiales A y B y tenemos la "Edad". Dependiendo de lo que selecciones aquí, se calcularán los métodos adecuados.
Si seleccionas sólo la variable "Tiempo", se mostrará la Curva de Supervivencia de Kaplan-Meier y obtendrás la tabla de tiempos de supervivencia correspondiente. Si no se especifica ninguna variable con el estado, el cálculo asume que ningún caso está censurado. Si no es así, basta con hacer clic en la variable "Estado", que contiene la información sobre si el suceso se ha producido o no.
Si ahora seleccionas otro factor, por ejemplo el "Material", se calculará la prueba de rangos logarítmicos. Entonces obtendrás la hipótesis nula y la alternativa, así como el valor p de la prueba de rango largo.
La hipótesis nula es No hay diferencia entre los grupos A y B en la distribución del tiempo hasta que se produce el suceso.
Si vas más abajo en la sección de resultados, encontrarás el valor p. Si no sabes exactamente cómo se interpreta, puedes hacer clic en "Resumen en palabras":
Se calculó una prueba de log-rank para ver si había diferencias entre los grupos A y B en cuanto a la distribución del tiempo hasta que se produce el acontecimiento.
Para los datos actuales, la prueba de rangos logarítmicos mostró que existe una diferencia entre los grupos en cuanto a la distribución del tiempo hasta que se produce el acontecimiento, p=<0.001. Por tanto, se rechaza la hipótesis nula.
Por otra parte, en el caso en que se seleccionaron el "material" y la "edad", se calcula la regresión de Cox. Entonces podrás leer si los factores tienen una influencia significativa o no. Puedes encontrar más información al respecto en el tutorial Regresión de Cox.