Publicado en Neumonews (2007)
Introducción
En el capítulo anterior vimos como la p era una medida de azar, la cual nos indica la probabilidad de que el azar pueda explicar las diferencias observadas en nuestro estudio. La significación estadística nos indica por tanto una asociación o diferencia entre variables que difícilmente se puede explicar por el azar, sin embargo no es una medida de asociación. Además, el valor de la p se ve muy influenciado por el tamaño muestral del estudio, ya que resultados estadísticamente significativos no tienen porqué ser clínicamente relevantes por lo que se necesitan otra serie de herramientas que nos ayuden a cuantificar y valorar la relevancia clínica de nuestros descubrimientos 1.
Antes de empezar un trabajo de investigación se debe hacer el esfuerzo por definir la magnitud de lo que vamos a considerar clínicamente importante. Medidas como el número necesario de pacientes a tratar (NNT) o la reducción relativa del riesgo (RRR) nos pueden servir de ayuda para valorar su relevancia clínica.
Un concepto utilizado frecuentemente en los ensayos clínicos aleatorizados es el número necesario de pacientes a tratar para reducir un evento (NNT) el cual es fácil de entender y bastante intuitivo, proporcionando no sólo información estadística sino información clínica. Sin embargo, como veremos más adelante, el NNT hay que manejarlo con cierto cuidado, ya que también tiene sus inconvenientes. Se calcula como el inverso de la reducción absoluta del riesgo (RAR), pero veamos con ejemplos cómo se calcula y de paso repasaremos otras medidas de asociación.
Riesgo relativo (RR)
Supongamos que después de realizar un estudio en 400 pacientes y administrar para una misma enfermedad dos tratamientos distintos, tenemos los resultados de la Tabla I, siendo el tratamiento utilizado de forma habitual y B el tratamiento utilizado de forma experimental. La tasa de muerte en el grupo A (tratamiento A, grupo NO expuesto) fue de 0,3 ó 30% mientras que el grupo B (tratamiento B, grupo expuesto al nuevo tratamiento) fue de 0,2 ó 20%. Una prueba como la Ji-cuadrado adecuada para comparar proporciones nos ofrece como resultado un valor de p=0,021 lo cual nos sugiere que las diferencias observadas son demasiado grandes para poder ser explicadas por el azar. Sin embargo la p nos aporta escasa o nula información sobre la magnitud o relevancia de la asociación.
Tabla I. Estudio I. Resultados en un estudio de 400 pacientes.
Muerte | TratamientoA (No Expuesto) | TratamientoB (Expuesto) | p |
No | 140 (70%) | 160 (80%) | 0,021 |
Sí | 60 (30%) | 40 (20%) | |
Total | 200 | 200 |
Una manera de cuantificar la importancia de la asociación es mediante el riesgo relativo (RR) que se calcula como el cociente entre el riego de muerte entre los dos grupos, que en nuestro ejemplo sería 0,2/0,3=0,67 del grupo B respecto A (riesgo expuestos/riesgo no expuestos), o bien 0,3/0,2=1,5 que sería el RR del grupo A respecto del grupo B. Su valor nos indica cuánto es más probable que ocurra un suceso en el primer grupo frente al segundo 1, 2. Sin embargo el riesgo relativo adecuado para estudios de cohorte no es correcto utilizarlo en estudios caso-control en donde queda fijado a priori el tamaño muestral de cada grupo 2.
Odds ratio (OR)
Otra manera de cuantificar la asociación es mediante la odds ratio (OR), término inglés para el que no existe una traducción al castellano comúnmente aceptada, siendo quizás “razón de ventajas” el término más aceptado. Un odds es el cociente entre el número de veces que ha ocurrido un suceso y el número de veces que no ha ocurrido. Una odds de 2 indica que por cada dos personas que sufran un suceso, tendremos 1 que no lo sufrirá. Del mismo modo, una odds de 0,5, indicaría que por cada persona que sufre un suceso, tendremos 2 que no lo sufren, llámese suceso a una muerte, una curación, etc 2, 3.
En el grupo A (Tabla I), mueren 60 personas y sobreviven 140, por tanto la odds de muerte del grupo A es de 0,43 (60/140) y la odds de muerte del grupo B es 0,25 (40/160). Al igual que el RR es un cociente de riesgos, la odds ratio es un cociente de odds, siendo en el ejemplo la odds ratio del tratamiento B respecto al tratamiento A, considerado como el experimental de 0,25/0,43=0,58.
Al contrario de lo que sucedía con el RR en los estudios caso-control, la OR sí puede calcularse en este tipo de estudios. Cuando los riesgos son pequeños en ambos grupos, tanto la OR como el RR tienen valores similares, siendo en este caso la OR una buena aproximación del RR. Una de las grandes “ventajas” que ofrece el uso de la OR es que el efecto de la asociación puede ajustarse por otras variables (como podrían ser la edad, sexo, etc.) mediante una regresión logística 2.
Número necesario de pacientes a tratar (NNT)
Volviendo a los datos del ejemplo de la Tabla I, la diferencia entre ambas proporciones de mortalidad es lo que se denomina reducción absoluta del riesgo (RAR), que en nuestro caso sería 0,3-0,2=0,1 o lo que es lo mismo del 10%. Si calculásemos el intervalo de confianza del 95% para la diferencia de proporciones, obtendríamos un rango de (0,0157; 0,1843) o si lo expresamos en porcentajes de (1,6%; 18,4%).
Una RAR del 10% nos indica que de cada 100 personas tratadas con el nuevo fármaco B, se evitan 10 muertes respecto a las que se hubieran producido al emplear el fármaco A. Por una simple “regla de tres” podemos calcular cuantos pacientes se necesitarían tratar con el nuevo fármaco para evitar una muerte, que sería 1/RAR 1, 4. En nuestro ejemplo 1/0,1=10. Acabamos de calcular cuantos pacientes son necesarios tratar de manera experimental para evitar que uno de ellos tenga un resultado negativo (no curación, muerte, etc.) siendo este valor conocido como NNT o número de pacientes a tratar. Cuanto mayor sea el efecto del tratamiento experimental, menor será el valor del NNT.
Otra mediada además del RAR y el NNT es la reducción relativa del riesgo (RRR), que se calcula como el complementario del riego relativo, en nuestro caso como 1-0,67=0,33 o lo que es lo mismo, el 33%. El tratamiento experimental B, reduce en un 33% relativo el riesgo a muerte respecto al tratamiento A. Presentar los resultados solo mediante la RRR puede magnificar el efecto de la intervención ya que podemos tener la misma RRR es situaciones muy distintas, por ello es recomendable presentar los resultados con la RAR y el NNT acompañando a la RRR 1.
Como siempre que se den resultados sobre cualquier parámetro, este debe venir acompañado de su correspondiente intervalo de confianza. Para el NNT el intervalo se calcularía invirtiendo los valores del intervalo de confianza para la reducción absoluta del riesgo (RAR) 2, 5. Para el RAR el intervalo de confianza del 95% se calcula como RAR ± 1,96* Error estándar (RAR) siendo el error estándar:
IC95% del RAR: (0,0157; 0,1843) y con el inverso del intervalo para RAR tendríamos el intervalo de confianza del 95% para NNT de (5,4; 63,7) que normalmente se redondea ya que hablamos de pacientes y que habría que interpretar del siguiente modo: para evitar una muerte en nuestra población de pacientes debemos tratar con el fármaco experimental B, entre 5 y 64 pacientes.
En estos enlaces podemos calcular todos estos parámetros con sus intervalos de confianza:
· http://www.infodoctor.org/rafabravo/calcuttodcos.html
· http://www.semergen.es/semergen2/cda/nav/03/3090.jsp#
Al calcular el intervalo de confianza del NNT, podemos llevarnos alguna sorpresa. Veamos lo que pasa en un ejemplo como el de la Tabla II, en el que los resultados son los mismos que en el ejemplo anterior pero con la mitad de pacientes.
Tabla II. Estudio II. Resultados en un estudio de 200 pacientes.
Muerte |
Tratamiento A (No Expuesto) |
Tratamiento B (Expuesto) |
p |
No |
70 (70%) |
80 (80%) |
0,102 |
Sí |
30 (30%) |
20 (20%) |
|
Total | 100 |
100 |
Ahora los resultados no son estadísticamente significativos (p=0,102) y tanto los intervalos de confianza del OR como los del RR incluyen al 1. El NNT es 10 en cada uno de los estudios, pero si observamos sus intervalos de confianza (Tabla III) podemos ver que el intervalo para el NNT en el estudio II es de -52 pacientes a 5. Obtenemos un valor negativo para el número de pacientes y además nuestro intervalo no incluye nuestro parámetro estimado. Esto sucede porque nuestro intervalo de confianza para la reducción absoluta del riesgo (RAR) puede tomar valores negativos y además incluye al 0 ya que nuestros resultados no han sido estadísticamente significativos 6.
Tabla III. Resultados comparativos de ambos estudios.
Estudio I |
Estudio II |
|
N |
400 |
200 |
P |
0,021 |
0,102 |
OR |
0,58 (0,37; 0,92) |
0,58 (0,30; 1.12) |
RR (IC95%) |
0,67 (0,47; 0,94) |
0,67 (0,41; 1,09) |
RRR (IC95%) |
33% (6%; 53%) |
33% (-9%; 59%) |
RAR (IC95%) |
0,1 (0,0157; 0,1843) |
0,1 (-0,0192; 0,2192) |
NNT (IC95%) |
10 (5; 64) |
10 (-52; 5) |
N: número de pacientes. P: significación estadística. OR: Odds Ratio. RR: Riesgo relativo. RRR: Reducción Relativa de Riesgo. RAR: Reducción Absoluta del Riesgo. NNT: Número de pacientes que es Necesario Tratar.
Un valor negativo del RAR indicaría ineficacia, mientras que uno positivo sería eficacia del nuevo tratamiento. Al calcular el NNT calculamos el número de pacientes necesario para obtener un beneficio, pero cuando el valor es negativo, se habla del número de pacientes necesarios para perjudicar NNH (del inglés “harm”, dañar). La terminología puede resultar muy confusa siendo preferible utilizar términos como el número necesario a tratar para producir un beneficio (NNTB) y número necesario a tratar para producir un perjuicio (NNTH) 4.
El intervalo de confianza para los datos del ejemplo del estudio II sería NNTB=5 y NNTH=52, o lo que es lo mismo, podemos hablar del número de pacientes a tratar con el nuevo fármaco para obtener un beneficio: 5, y del número de pacientes que son necesarios tratar para producir un perjuicio que son 52. Este intervalo de confianza, nos indica que para obtener un beneficio podemos necesitar desde 5 pacientes hasta el infinito (no eficacia) pasando por el valor de 10, y que incluso podemos perjudicar a los pacientes5.
Como podemos observar, la utilización del NNT resulta algo confusa cuando no hay un efecto claro del tratamiento experimental por lo que utilizar la RAR con su intervalo de confianza puede ser suficiente 5.
BIBLIOGRAFÍA
1 Pita Fernández, S. y I. López de Ullibarri Galpasoro (1998). http://www.Fisterra.com. Número de pacientes necesario a tratar para reducir un evento. Cad Aten Primaria: 96-98.
2 Molinero, L. M. (2001). http://www.seh-lelha.org/stat1.htm. Odds ratio, riesgo relativo y número necesario a tratar. (Alce Ingeniería).
3 Abraira, V. (2000). Medidas del efecto de un tratamiento (I): reducción absoluta del riesgo, resucción relativa del riesgo y riesgo relativo. SEMERGEN 26: 535-536.
4 Abraira, V. (2000). Medidas del efecto de un tratamiento (II): odds ratio y número necesario para tratar. SEMERGEN 27: 418-420.
5 Molinero, L. M. (2004). http://www.seh-lelha.org/stat1.htm. Número de pacientes que será necesario tratar NNT. (Alce Ingeniería).
6 Altman, D. G. (1998). Confidence intervals for the number needed to treat. Br Med J 317: 1309-1312.