Desviación (medida de bondad de ajuste)

En estadística, la desviación (del inglés deviance) es un estadístico para comprobar la bondad de ajuste para un modelo estadístico mediante contrastes de hipótesis. Es especialmente usado en los modelos de dispersión exponencial y los modelos lineales generalizados, en los que el ajuste se realiza por máxima verosimilitud en vez de por mínimos cuadrados ordinarios.

Definición

Sea $M_{0}$ un modelo lineal generalizado dado por $g(\mathbb {E} ({\boldsymbol {y}}))={\boldsymbol {X}}{\boldsymbol {\beta }}_{0}$ , con ${\boldsymbol {\hat {\mu }}}_{0}$ las predicciones del modelo. La intención de la desviación es determinar la bondad de ajuste, es decir, cuán bien explica el modelo propuesto la distribución de las observaciones. La forma de hacerlo es comparándolo con el modelo saturado, aquel que tiene un parámetro para cada observación y por tanto ofrece el mejor ajuste posible a las observaciones, es decir, ${\boldsymbol {\hat {\mu }}}_{0}={\boldsymbol {y}}$ .

Se plantéa la hipótesis $H_{0}$ de que el modelo propuesto $M_{0}$ explica tan bien las observaciones como el modelo saturado y para contrastarla se usa un estadístico de razón de verosimilitudes: si $\ell _{0}$ es el supremo de la función de verosimilitud del modelo $M_{0}$ , y $\ell _{sat}$ el supremo de la función de verosimimilitud para el modelo saturado, definimos

$\Lambda ={\frac {\ell _{0}}{\ell _{sat}}}$

Se define entonces la desviación de $M_{0}$ como

$D({\boldsymbol {y}},{\boldsymbol {\hat {\mu }}}_{0})=-2\log \Lambda =2(L_{sat}-L_{0})$

donde $L_{sat}=\log(\ell _{sat})$ y $L_{0}=\log(\ell _{0})$ son las log-likelihood.^[1]

Distribución asintótica

Para algunos modelos lineales generalizados y bajo ciertas condiciones^[2]^[3] el estadístico de desviación tiene distribución asintótica chi cuadrado $\chi _{n-p_{0}}^{2}$ con grados de libertad la diferencia en el número de parámetros entre los dos modelos, que es $n$ (el número de observaciones) para el saturado y $p_{0}$ para $M_{0}$ .

Esto se cumple, por ejemplo, para los modelos binomiales con datos agrupados $n_{i}y_{i}\sim b(n_{i},\pi _{i})$ , donde $y_{i}$ se toma como la proporción de éxitos en el grupo $i$ , cuando los $n_{i}$ son grandes y ninguna probabilidad estimada se acerca a 0 o 1, y para los modelos Poisson, cuando los valores estimados son razonablemente grandes, mayores que 2 o 3.

Comparación de modelos

A través de la desviación se pueden comparar dos modelos encajados $M_{0}\subset M_{1}$ para ver si el modelo más general $M_{1}$ con vector de parámetros ${\boldsymbol {\beta }}_{1}$ produce una mejora significativa en el ajuste respecto al modelo más restringido $M_{0}$ . El modelo más simple (con menos parámetros) siempre tiene una desviación mayor, esto es así porque el espacio paramétrico de $M_{0}$ está contenido en el de $M_{1}$ ya que están engajados, de manera que para las verosimilitudes maximizadas $\ell _{0}\leq \ell _{1}$ , y como $\ell _{sat}$ está presente en las dos por igual

$D({\boldsymbol {y}},{\boldsymbol {\hat {\mu }}}_{1})\leq D({\boldsymbol {y}},{\boldsymbol {\hat {\mu }}}_{0})$

Se puede considerar como estadístico de contraste la diferencia de desviaciones $T=D({\boldsymbol {y}},{\boldsymbol {\hat {\mu }}}_{0})-D({\boldsymbol {y}},{\boldsymbol {\hat {\mu }}}_{1})$ , que bajo ciertas condiciones se distribuye asintóticamente como una $\chi _{p_{1}-p_{0}}^{2}$ .