«Truth is stranger than fiction, but it is because Fiction is obliged to stick to possibilities; Truth isn’t.»
Mark Twain
Introducción
La estimación de la supervivencia esperada para un determinado tipo de pacientes tiene una larga tradición en la medicina, fundamentalmente basándose en tablas actuariales, en las que se estratificaba en función del sexo y la edad del paciente. A un nivel más coloquial estamos habituados a oír hablar de esperanza de vida para un determinado país, distinguiendo entre hombres y mujeres. Con la difusión en la investigación médica de los modelos estadísticos de supervivencia, fundamentalmente los modelos de riesgo proporcional o modelos de Cox, esa práctica se ha generalizado, realizando entonces el propio modelo la función de población de referencia, por así decirlo, a partir de la que se estimará la supervivencia para los pacientes con unas características determinadas.
Los modelos de supervivencia se han revelado como una interesante herramienta de ayuda diagnóstica, y en algunos casos se puede decir que han adquirido un éxito casi universal. En esta sección hemos venido citando como paradigma el modelo de Framingham, o su reciente alternativa europea el modelo Score.
Vamos ahora a revisar brevemente en qué consiste un modelo de supervivencia, qué interpretaciones nos permite, cómo podemos utilizarlo y como podemos valorar si un modelo publicado es consistente con nuestras propias observaciones. Nos centraremos en los modelos de riesgos proporcionales de Cox por ser los más difundidos, aunque en próximos artículos comentaremos otras alternativas.
Un modelo de supervivencia es una fórmula matemática que nos permite cuantificar la probabilidad de supervivencia, dados unos determinados valores de los factores pronóstico en un momento inicial. A partir de ese cálculo podemos estimar una probabilidad de supervivencia para un tiempo determinado (por ejemplo a 3 años) para los pacientes con unas determinadas características. Es posible también calcular riesgos relativos entre dos grupos de pacientes con diferentes valores de las variables pronóstico. Otra alternativa que nos permite la utilización del modelo es ordenar los pacientes de peor a mejor pronóstico de acuerdo con la supervivencia estimada, o clasificarlos en diferentes grupos de pronóstico, siendo la clasificación más sencilla en dos grupos: mal o buen pronóstico.
La utilización de modelos de supervivencia para ordenar a los pacientes puede ser de gran importancia para ayudar a la toma de decisiones. Así por ejemplo, a la hora de asignar un hígado a un paciente de la lista de espera de trasplantes, la utilización de un índice conocido como índice de MELD, que no es más que un modelo de supervivencia de Cox, permite ordenar los pacientes en función de la supervivencia esperada, de tal manera que si se asigna el hígado al paciente con peor pronóstico según esa ordenación, hemos empleado para tomar la decisión una valoración objetiva, repetible, e independiente de quién toma la decisión, ya que se basa únicamente en datos del paciente, y por lo tanto es un proceso auditable. Todas ellas características deseables en un sistema sanitario democrático.
Vamos a recordar, por encima, cuál es el «aspecto» matemático de un modelo de riesgo proporcional, lo que nos ayudará a comprender su utilización. La supervivencia en función del tiempo viene dada por la siguiente ecuación:
Formula 1
donde RR es el cociente de riesgo (hazard ratio), que podemos considerar equivalente al concepto de riesgo relativo. Hemos escrito RR(x), porque depende de los valores de los factores pronóstico o covarientes X:
Formula 2
bi es el coeficiente correspondiente a la variable i del modelo de Cox. Por lo tanto, en base al modelo de supervivencia, la diferencia entre dos grupos de pacientes con diferente perfil de valores de X, viene determinada por el valor del término:
término que vamos a denominar IR o índice de riesgo. Cuanto mayor sea el valor de IR peor supervivencia o peor pronóstico para ese perfil de valores de X.
En la figura 1 vemos un ejemplo de diferentes curvas de supervivencia de acuerdo a un modelo de Cox para distintos valores de IR. El valor IR=0 corresponde a la supervivencia base, cuando en el modelo todos los valores de X son cero y entonces la supervivencia a lo largo del tiempo viene dada por S0(t)
Fig 1. Estimación de la supervivencia para diferentes valores del índice de riesgo
En la mayoría de las ocasiones para alguna de las variables el valor cero no tiene sentido físico (por ejemplo la edad, una determinación analítica, etc), y entonces, aunque esto no es un inconveniente matemático, se prefiere usar la siguiente expresión:
donde IR0 es el valor del índice de riesgo para el «paciente medio» en la serie, es decir el valor del IR (según la fórmula 3) substituyendo todos los valores de las variables X por los valores medios obtenidos en la muestra. Evidentemente en este caso el valor de S0(t) es diferente, ya que ahora corresponde a la supervivencia de ese «paciente medio», que se toma como referencia.
El cálculo del IR para nuestros pacientes, a partir de un determinado modelo publicado, nos permite clasificar de forma relativa esos pacientes, de tal manera que obtenemos así una ordenación de peor a mejor pronóstico. Ese valor puede servirnos, por ejemplo, para formar grupos específicos de pacientes según su pronóstico.
Sin embargo, si lo que deseamos es estimar el valor concreto de la supervivencia para un tiempo determinado, por ejemplo la probabilidad de que el paciente viva al menos 2 años, necesitaremos además conocer el valor de la supervivencia base S0(t=2años) y ya podemos utilizar la fórmula del modelo de Cox:
o la fórmula 4, si se tomó como referencia el «paciente medio».
Quiere esto decir que para que un modelo publicado permita estimar valores absolutos de supervivencia, hay que conocer no sólo los coeficientes del modelo, que nos permiten calcular el IR, sino también el valor de la supervivencia base S0, al menos para algunos valores de tiempo concretos.
¿Cómo podemos verificar si un modelo publicado es consistente con nuestras observaciones?
A la hora de verificar la calidad de un modelo predictivo de supervivencia podemos considerar dos aspectos, uno que se denomina calibración y describe cómo se ajustan los valores numéricos de supervivencia estimados por el modelo a los valores reales de supervivencia observados en nuestra muestra. El otro aspecto, denominado discriminación, cuantifica la capacidad del modelo para clasificar a los pacientes en dos categorías (vivos o muertos) a lo largo del tiempo. Ambos conceptos no son intercambiables.
Cuando se estudia la capacidad diagnóstica de una prueba que se emplea para clasificar a los pacientes en dos grupos (resultado dicotómico), una herramienta ampliamente utilizada es la denominada curva ROC, que ya se describió en un artículo anterior. El área bajo esa curva es un índice que nos permite cuantificar la capacidad diagnóstica de la prueba, y en esencia es un dato que combina sensibilidad y especificidad de la prueba para todos los puntos de corte posibles.
Si se desea evaluar la capacidad predictiva de supervivencia de un modelo de Cox, para un tiempo determinado (por ejemplo a 2 años), podemos considerar el modelo como una prueba diagnóstica y determinar el área de su curva ROC. Para ello determinaremos para cada paciente el valor de supervivencia estimado por el modelo para ese tiempo, y tomando todos los puntos de corte posibles según el valor de supervivencia, calcularemos la sensibilidad y especificidad de ese criterio clasificatorio del paciente como muerto o vivo para ese instante de tiempo. Es decir que consideramos el resultado del modelo de Cox como el criterio para clasificar al paciente como vivo o muerto según que supere o no un punto de corte, y comparándolo con la situación real del paciente (regla de oro) determinamos la sensibilidad y especificidad del criterio. Un área bajo la curva grande indica una buena capacidad diagnóstica del criterio.
Sin embargo, hay que tener en cuenta que en los análisis de supervivencia solemos tener observaciones incompletas o censuradas, que son aquellos pacientes que no se observan suficiente tiempo y por lo tanto sólo sabemos que hasta un cierto momento estaban vivos, y después desconocemos su estado. Evidentemente el análisis propuesto, consistente en calcular la curva ROC para un instante de tiempo determinado, hay que hacerlo cuidadosamente, ya que intervienen sólo los pacientes que o bien se mueren antes de ese tiempo, o están vivos al menos hasta ese momento. Los pacientes con observaciones incompletas antes del tiempo para el que se está calculando la supervivencia, no pueden intervenir en el análisis, ya que desconocemos su estado en el momento para el que se calcula la curva. Por otro lado, los pacientes que se mueren después de ese tiempo, intervienen como vivos en el cálculo de la curva ROC, ya que en ese instante todavía están vivos. Además es posible construir una curva ROC para cada instante de tiempo durante el que se observa la supervivencia de los pacientes…
Algo complicado ¿no es cierto? Pero existe otra alternativa, propuesta por Pencina y D’Agostino, cuya interpretación es bastante comprensible. La idea es la siguiente: para cada paciente disponemos de dos valores, la supervivencia observada y la supervivencia estimada por el modelo. Ordenamos los pacientes desde el tiempo de menor supervivencia observada al de mayor tiempo; si el modelo funcionase perfectamente esa ordenación coincidiría con la que obtendríamos utilizando como criterio la supervivencia estimada por el modelo. Evidentemente, por muy bien que funcione el modelo, será muy difícil que ambas ordenaciones coincidan.
Vamos a formar todas las parejas posibles de pacientes y a compararlos entre sí. Para una pareja cualquiera de pacientes, en ausencia de empates, tenemos cuatro situaciones posibles:
- La supervivencia real del paciente A es mayor que la del paciente B y la probabilidad de supervivencia estimada por el modelo para el paciente A es mayor que para el paciente B.
- La supervivencia real del paciente A es menor que la del paciente B y la probabilidad de supervivencia estimada por el modelo para el paciente A es menor que para el paciente B.
- La supervivencia real del paciente A es mayor que la del paciente B y la probabilidad de supervivencia estimada por el modelo para el paciente A es menor que para el paciente B.
- La supervivencia real del paciente A es menor que la del paciente B y la probabilidad de supervivencia estimada por el modelo para el paciente A es mayor que para el paciente B.
En las dos primeras situaciones lo observado concuerda con lo estimado por el modelo (pares concordantes), mientras que en las dos últimas lo observado es contrario a lo estimado por el modelo (pares discordantes). Podemos calcular un estadístico C que corresponde a la proporción de pares concordantes respecto del total de parejas formadas, cuyo valor medirá por tanto la capacidad discriminatoria de nuestro modelo de supervivencia.
En el cálculo hay que tener en cuenta que no todas las parejas son útiles:
- No se pueden utilizar las parejas formadas por dos observaciones incompletas, ya que no conocemos la supervivencia real de ninguno de los dos pacientes.
- Una pareja formada por una observación incompleta y un paciente fallecido se puede utilizar si el fallecimiento se produce antes del tiempo de la observación incompleta, pues sabemos que el paciente correspondiente a la observación incompleta, al menos ha vivido más tiempo que el fallecido; en el caso contrario no podemos decir nada, pues puede ser que el paciente incompleto haya vivido menos o más tiempo que el que sabemos que falleció.
- Si tenemos dos pacientes fallecidos con el mismo tiempo real de supervivencia, un empate, tampoco se pueden utilizar.
Puesto que en el cálculo de C solo interviene la ordenación relativa de los pacientes, no es necesario conocer el valor de S0(t), ya que es igual para todos los pacientes, y por lo tanto en los cálculos solo interviene el índice de riesgo IR anteriormente descrito.
En el artículo de Pencina y D’Agostino podemos además encontrar una descripción de cómo calcular un error estándar para el valor de C.
En el caso de que nos interese más los valores absolutos de supervivencia, calibración del modelo, podemos calcular las curvas de supervivencia para diferentes perfiles de pacientes mediante el modelo y la supervivencia observada en ese grupo de pacientes en nuestra muestra, mediante el procedimiento de Kaplan-Meier, y comparar ambos grupos de curvas.
Si las variables que intervienen en el modelo de Cox son variables cualitativas es muy fácil definir estratos, si son numéricas lo que podemos hacer es dividir nuestros pacientes en varios grupos de acuerdo con el IR índice de riesgo. Para ello aplicaremos la fórmula 3 a cada uno de los pacientes. Supongamos que estratificamos a nuestros pacientes en cuatro grupos según el valor de IR. Para cada estrato de IR determinamos los valores medios de las variables predictoras en nuestros pacientes, y calculamos la curva de supervivencia estimada por el modelo para esos valores medios. Por otro lado calculamos por el método de Kaplan-Meier la supervivencia real en nuestra muestra en cada uno de los estratos y podemos comparar ambos grupos de curvas como en la siguiente figura:
Fig.2 Las líneas azules corresponden a la supervivencia observada (Kaplan-Meier) y las rojas a la estimada por el modelo
Epílogo
Por su formulación los modelos de riesgos proporcionales son muy sencillos de utilizar para efectuar cálculos relativos: determinación de riesgos relativos u ordenación de la muestra según el pronóstico de supervivencia. La cuestión se complica cuando lo que nos interesa es determinar el valor absoluto de supervivencia, ya que entonces interviene S0(t), sobre la que no se hace ninguna suposición en los modelos de Cox.
Esperamos hablar más del asunto en próximos artículos.
Referencias
Overall C as a measure of discrimination in survival analysis: model specific population value and confidence interval estimation
Michael J. Pencina, Ralph B. D’Agostino
Statistics in Medicine Volume 23, Issue 13 , Pages 2109 – 2123
Luis Miguel Molinero
Septiembre 2004