Rev. chil. endocrinol. diabetes 2015; 8 (3)    Volver a Índice

 

Comentarios de Bioestadística

Regresión percentílica

Gabriel Cavada Ch.1,2
1Facultad de Medicina, Universidad de los Andes.
2Escuela de Salud Pública, Universidad de Chile.

 

Una pregunta metodológica recurrente, es asociar una respuesta “Y”, con un conjunto de covariables, cuando la respuesta no sigue una distribución normal o gaussiana; si la respuesta es continua y con una distribución de probabilidades conocida la solución está en los modelos lineales generalizados. Pero si la respuesta “Y” no tiene una distribución de probabilidades conocida o si “Y” es de naturaleza ordinal, como por ejemplo la intensidad del dolor medida a través de la escala EVA, o, niveles de desarrollo puberal medidos a través de los tanners, los modelos lineales generalizados no dan una respuesta satisfactoria. Esta última situación justifica conocer la regresión percentílica.

La regresión percentílica intenta explicar un determinado percentil de la respuesta “Y” a través de un conjunto de covariables en forma lineal, es decir, estima los parámetros de una asociación del tipo:

Yk = Xβ

Donde Yk, es el k-ésimo percentil de la respuesta y la expresión Xβ la combinación lineal de covariables que explican esta.

Usualmente se intenta estimar los coeficientes de la relación:

Y0,5 = Xβ

Es decir, explicar el percentil 50 o mediana de la respuesta por la combinación lineal de covariables.

Obviamente el método es robusto, en el sentido que no interesa qué distribución de probabilidades tiene la respuesta “Y”, como ya se dijo sólo se requiere que la respuesta esté medida a lo menos en escala ordinal.

Si se tuviera sólo una covariable y esta identificara grupos, la regresión percentilar sería una excelente alternativa al test de Kruskal-Wallis (ANOVA no paramétrico), con la ventaja que inmediatamente se tendría la evaluación de los p-values asociados a comparaciones múltiples.

Ilustremos con un de ejemplo:

Supongamos que una Unidad de tratamiento paliativo del dolor en pacientes oncológicos, desea saber que pacientes se benefician más respecto de la disminución del EVA, ajustando por edad y género. Si la edad está en años cumplidos y género distingue entre hombres y mujeres, los datos se muestran a continuación:

 

Por género, ¿Quiénes tienen más sensación de dolor? La tabla siguiente muestra los cuartiles de dolor por género:

En hombres la mediana de EVA es 8, mientras que en mujeres es de 3. Esta diferencia, ¿es significativa?

Este modelo de regresión genera la siguiente ecuación para la mediana de EVA:

EVA0,5 = 8 – 5 * sexo

Si la persona es hombre entonces sexo = 0 y la ecuación expresa que la mediana de EVA es 8 y si la persona es mujer entonces sexo = 1 y la ecuación expresa que la mediana de EVA es 8-5=3, como el p-value asociado a sexo es p = 0,003 (en negritas), la diferencia de la mediana de EVA por sexo es significativa.

Si se ajusta por edad, la estimación es:

Como la variable edad no es significativa, la conclusión es que la mediana de EVA solamente es explicada por el género del sujeto.