1Facultad de Medicina, Universidad de los Andes.
2División de Bioestadística, Escuela de Salud Pública, Universidad de Chile.
Un tema principal en la lectura y la investigación biomédica son los meta análisis, de hecho un meta análisis hecho sobre ensayos clínicos aleatorizados y enmascarados es el portador de información que entrega el mejor nivel de evidencia. Sin embargo, ¿qué es un meta análisis?, ¿Cuáles son los fundamentos teóricos que permiten la metodología?, son algunas de las preguntas que deberíamos contestar para entender este tipo de análisis.
La paradoja de Simpson
Un problema clásico que se presenta en el análisis estadístico puro es la llamada paradoja de Simpson, este fenómeno es cambio en el sentido de una asociación entre dos variables (numéricas o cualitativas) cuando se controla el efecto de una tercera variable:
Por ejemplo: En un estudio comparativo sobre tolerancia de dos fármacos antihipertensivos se determina la presencia o no de reacciones adversas al medicamento (RAM) leves, al codificar la información en Tratamiento (TTO = 0 ó TTO = 1) y RAM (ram = 0 sin RAM ó ram = 1 con RAM), la información se tabula a continuación:
Como se observa el tratamiento 1 presenta una tasa de RAM de 21,9% y el tratamiento 0 una tasa de 17,3%, el test de independencia de c2 sólo indica una asociación débil (no significativa) con un p-value = 0,062 y se estima un OR = 1,34.
Cuando esta información se desagrega por género, en hombres se obtiene:
El tratamiento 1 presenta una tasa de RAM de 6,15% y el tratamiento 0 una tasa de 13,3%, el test de independencia de c2 sólo indica una asociación significativa un p-value = 0,026 y se estima un OR = 0,43, es decir, el tratamiento 1 es protector al evento de observar una RAM.
Sin embargo para el caso de las mujeres se obtiene:
El tratamiento 1 presenta una tasa de RAM del 27,09% y el tratamiento 0 una tasa de RAM del 30,83%, la asociación no fue significativa (p-value = 0,423) y un OR = 0,83.
Un análisis epidemiológico básico, nos indicaría la precaución de ajustar los resultados por sexo, pues hay una evidente diferencia. Esta diferencia nos lleva a dos conclusiones distintas: la primera es que en ambos sexos el tratamiento 1 protege de hacer RAM, sólo que en las mujeres falta tamaño de muestra para rechazar la hipótesis de independencia. O bien que el tratamiento 1 sólo protege de hacer una RAM a hombres. ¿Cómo saberlo? Si la segunda conclusión fuera la cierta habrían antecedentes clínicos, epidemiológicos o en las ciencias básicas que harían plausible la conclusión. Así es que supongamos que la primera conclusión es la correcta, en este escenario, habría que estimar una asociación (OR) entre RAM y tratamiento, ponderando dichas asociaciones por sus respectivos tamaños de muestras. Una forma de resolver este problema hacer esta estimación del OR mediante el método de Mantel y Haenszel, el que permite construir un OR más “potente” que los conseguidos en la estratificación, pero no se calculan a partir de la primera Tabla, en que no se distinguen los géneros. Los resultados de este OR combinado se muestran a continuación:
El reglón* muestra el OR que se obtiene al combinar los datos mientras que el reglón** muestra el OR se que se obtiene al ponderar los OR por sus respectivos tamaños de muestras, cuando se opta por esta ponderación, la conclusión es que el tratamiento 1 protege de hacer una RAM tanto en hombres como en mujeres.
Este ejemplo, nos hace reflexionar en una metodología que combinara uno o más estudios, con resultados concluyentes (significativos) o no con el fin de obtener una conclusión más “potente”.
La distribución de probabilidades
de un p-value
Un interesante resultado de la teoría de probabilidades para una variable continua, es que cualquiera sea el test estadístico que se utilice la transformación -2nl(F(p)), donde p es el p-value esta tiene una distribución c2 con 2 grados de libertad. Para probar esta afirmación basta recordar que la distribución c2 con dos grados de libertad tiene como función densidad de probabilidades la expresión:
Y que , con lo que es fácil seguir la siguiente cadena de implicaciones:
Una verificación empírica de este resultado es la siguiente, suponga que se obtienen 20 p-values obtenidos de un mismo test estadístico sobre muestras obtenidas de la misma población, como los tamaños de muestra de cada test son distintos, no necesariamente se obtienen p-values significativos, y estos podrían ser:
El siguiente gráfico muestra el histograma de la variable -2ln(p) y la curva corresponde a la función densidad de probabilidades de la c2 con dos grados de libertad:
Este hecho permite calcular la probabilidad de que un p-value sea mayor (o menor) que un determinado valor usando la transformación propuesta. Con ello podemos conocer la probabilidad de que un conjunto de estudios en que cada uno de ellos aporte un p-value, entregue un “meta-p-value” significativo y con ello una medida de asociación significativa.
En el próximo artículo se verá el cómo se hace operativo este resultado.