Rev. chil. endocrinol. diabetes 2015; 8 (4)    Volver a Índice

 

Comentarios de Bioestadística

Regresión de Prais-Winsten: Evaluación de tendencias lineales

Gabriel Cavada Ch.1,2
1Facultad de Medicina, Universidad de los Andes.
2Escuela de Salud Pública, Universidad de Chile.

 

Prais-Winsten regression: lineal trends assessment

 

En toda ocasión que se describe un problema de salud, un problema clásico es medirlo a través de prevalencias, incidencias o tasas, sino también cómo estas medidas evolucionan en el tiempo. En general estos indicadores están disponibles anualmente, por lo tanto disponer de una larga serie de datos, que permita usar metodologías para analizar series de tiempo, resulta prohibitivo. Aún más si nuestra atención se fija en enfermedades como la diabetes I en pacientes pediátricos, cuyo estudio de tendencias tiene un horizonte de unos 20 años. Por ello es útil conocer un método de evaluación de tendencias lineales (cambios temporales).

Por ejemplo, la Tabla 1 muestra las tasas de mortalidad por cáncer de páncreas en Chile desde el año 1997 al 2012 (Fuente: DEIS, Ministerio de Salud de Chile).

Tabla 1

*Por 100 mil habitantes.

Figura 1


La Figura 1 muestra la tendencia de dichas tasas.

Es claro que la evolución de esta tasa es lineal, por lo tanto un incauto analista, encontraría la significación de esta tendencia usando los algoritmos clásicos de la regresión lineal, además agregaría el coeficiente de correlación de Pearson y otras delicadezas. Análisis que estaría incorrecto, pues las tasas no son observaciones independientes en el tiempo, sino que existe una autocorrelación, es decir, que la tasa de un año cualquiera, depende de lo que ocurrió el año anterior. Si este supuesto se obvia, se introduce una heterocedasticidad artificial que impediría conocer en forma certera la velocidad de cambio de esta tasa, pues las varianzas de esta velocidad estarían afectadas por estos residuos cuya variabilidad cambia en el tiempo. Esta situación la corrige la estimación de Prais-Winsten, que es un modelo autoregresivo de orden 1, es decir, lo que pasa ghoyh correlaciona con lo que paso gayerh, en simbolos: Yt = ρYt-1

Donde ρ denota la correlacion y el sub indice el tiempo. Si la tendencia lineal se quisiera estimar mediante la regresion lineal simple, el error cuadratico estaria dado por la expresion: ε2 = (Yt - α - βt)2

Estimando solo los parametros α y β, y este error no se hace cargo de la dependencia gauto regresivah, mientras que al considerar este efecto la expresion del error cuadratico es: ε2 = ( ρYt-1 - α - βt)2 Lo que permite estimar esta dependencia temporal.

En nuestro ejemplo:

Al estimar la tendencia por regresion lineal simple se encuentra:


Es decir, que por cada año se observa un aumento de la tasa de 0,173, pero no se sabe en cuánto influye la tasa anterior.

La regresión de Prais-Winsten entrega los siguientes resultados:


La velocidad de cambio es prácticamente la misma, sin embargo, los intervalos de confianza difieren a partir del tercer decimal, esto es demasiado, si se considera que las tasas están por 100 mil habitantes, es decir, nos debiera interesar una precisión hasta el quinto decimal. Sin considerar la información extra de que la tasa de un año cualesquiera depende un 9,14% de lo que ocurrió en el año inmediatamente anterior (rho). La conclusión es que a veces muy poco es demasiado.