Rev. chil. endocrinol. diabetes 2014; (2)    Volver a Índice

 

Comentarios de Bioestadística

El meta-análisis, parte II: fundamentos estadísticos

Gabriel Cavada Ch.1,2

The meta-analysis, Part II: statistical foundations

1Facultad de Medicina, Universidad de los Andes.
2División de Bioestadística, Escuela de Salud Pública, Universidad de Chile.

Como se expuso en el artículo anterior (El meta análisis, parte I: Fundamentos estadísticos), el resultado más relevante, es que cuando se tiene una colección de p-values, provenientes de la misma dócima de hipótesis, ensayada sobre la misma población, la expresión: -2ln (F(p)), donde p es el p-value, esta tiene una distribución Chi-cuadrado con 2 grados de libertad. Pero una propiedad que tiene la distribución Chi-cuadrado es que al sumar dos variables aleatorias independientes cada una proveniente de distribuciones Chi- cuadrado con distintos grados de libertad, esta suma es otra variable aleatoria con distribución Chi -cuadrado cuyos grados de libertad son la suma de los grados de libertad de las variables aleatorias que se suman, en símbolos:
Si  y con X1 independiente de X2, entonces. Obviamente este resultado puede extenderse a “k” variables aleatorias independientes, modo que si cada variable aleatoria fuera tal que  entonces:

Por lo tanto si cada p- value tiene una distribución Chi-cuadrado con 2 grados de libertad, la suma de “s” p-values tiene una distribución Chi-cuadrado con 2s grados de libertad. Este es otro resultado relevante pues , con lo que es posible calcular la significación estadística de la expresión a partir de una colección de p-values conocidos. Por ejemplo, al tomar la colección de p -values mostrados en el artículo anterior, se puede completar la siguiente tabla:



Comentarios de Bioestadística

Ahora si se preguntara por la significación de que la suma de estos 20 p-values no superara la significación clásica del 5%, deberíamos proceder como sigue: Calculamos -2ln(0,05)*20 (suponemos que cada uno de los p-values es menor que 0,05), cuyo resultado es 119,8 (valor crítico), como este valor es más grande que 39,78 (valor observado), la conclusión es que con la suma de los p-value dados no es posible acercarse a la significación estadística.

Ahora, si los 20 p-values dados hubieran sido:



La suma total es 206,5 que es mayor al valor crítico de 119,8, por lo tanto la suma (combinación) de estos p-values induciría una conclusión significativa, aun cuando los p-values 19 y 20 están muy por encima de la significación estadística.