What is the difference between GLM and GLMM?

Modelos Lineales Generalizados Mixtos

18/10/2017

Valoración: 4.35 (9910 votos)

En el ámbito del análisis de datos complejos, a menudo nos encontramos con situaciones en las que las observaciones no son independientes y/o la variable respuesta no sigue una distribución normal. Los modelos de regresión lineal tradicionales y los modelos lineales mixtos (LME) tienen limitaciones en estos escenarios. Aquí es donde entran en juego los Modelos Lineales Generalizados Mixtos (GLME), también conocidos como Modelos Lineales Mixtos Generalizados (GLMM).

What is the specification of the GLMM model?
The complete specification of a GLMM includes the distribution of the response variable; the link function; the definition of categorical and continuous fixed-effect predictors; and the definition of the random effects, which specify how some model parameters vary ran- domly across groups.

Los GLME son una extensión de los modelos lineales generalizados (GLM) que incorporan la capacidad de modelar la variabilidad entre grupos, similar a los modelos lineales mixtos. Se utilizan cuando la variable respuesta tiene una distribución distinta de la normal (como Binomial, Poisson, Gamma, etc.) y los datos están agrupados o tienen una estructura de dependencia, como en estudios longitudinales o datos jerárquicos. Puedes pensar en ellos como la fusión de las características de los GLM y los LME, permitiendo analizar la relación entre una variable respuesta y predictores, donde los coeficientes pueden variar entre grupos.

¿Qué Son Exactamente los GLME?

Los GLME son modelos estadísticos que describen la relación entre una variable respuesta y variables independientes, permitiendo que los coeficientes varíen con respecto a una o más variables de agrupación. Son particularmente útiles para analizar datos donde las observaciones dentro de un grupo están correlacionadas.

Un modelo mixto, ya sea lineal o generalizado, se compone de dos partes principales:

  • Efectos Fijos: Estos son los términos de regresión lineal convencionales. Representan los efectos promedio de los predictores sobre la respuesta en toda la población o en todos los grupos. Son coeficientes que se estiman directamente.
  • Efectos Aleatorios: Estos términos están asociados con unidades experimentales individuales extraídas al azar de una población (por ejemplo, sujetos, fábricas, escuelas). Capturan la variación entre grupos que no se explica por los efectos fijos. A diferencia de los efectos fijos, los efectos aleatorios se consideran variables aleatorias con distribuciones de probabilidad (normalmente se asume una distribución normal con media cero).

La inclusión de efectos aleatorios es crucial para manejar la correlación dentro de los grupos. Por ejemplo, en un estudio donde se miden varias veces a los mismos individuos (datos longitudinales), las mediciones de un mismo individuo están correlacionadas. Los efectos aleatorios a nivel de individuo pueden modelar esta correlación.

La Ecuación Fundamental de los Modelos GLME

La estructura de un Modelo Lineal Generalizado Mixto se basa en la idea de que, condicionada a los efectos aleatorios, la variable respuesta sigue una distribución de la familia exponencial, y la esperanza de esta respuesta está relacionada con una combinación lineal de predictores (efectos fijos y aleatorios) a través de una función de enlace. La forma estándar se puede expresar de la siguiente manera:

yᵢ | b ~ Distr(μᵢ, σ²wᵢ)

Y la relación entre la media condicional y los predictores lineales es:

g(μ) = Xβ + Zb + δ

Donde:

  • y es el vector de respuesta (n-por-1), y yᵢ es su i-ésimo elemento.
  • b es el vector de efectos aleatorios.
  • Distr es la distribución condicional especificada de y dado b (por ejemplo, Poisson, Binomial).
  • μ es la media condicional de y dado b, y μᵢ es su i-ésimo elemento.
  • σ² es el parámetro de dispersión. Para algunas distribuciones (como Poisson o Binomial con tamaño conocido), este parámetro puede ser fijo (a menudo 1) o estimado.
  • w es el vector de pesos efectivos de observación (n-por-1), y wᵢ es el peso para la observación i. Estos pesos pueden ser importantes para ciertas distribuciones o si se especifican pesos a priori.
  • g(μ) es la función de enlace que define la relación entre la media de la respuesta μ y la combinación lineal de los predictores.
  • X es la matriz de diseño de efectos fijos (n-por-p).
  • β es el vector de efectos fijos (p-por-1).
  • Z es la matriz de diseño de efectos aleatorios (n-por-q).
  • b es el vector de efectos aleatorios (q-por-1).
  • δ es un vector de desplazamiento (offset) del modelo, que puede ser útil en algunos casos (por ejemplo, en modelos Poisson donde el riesgo o la exposición varían).

La media condicional μ se recupera aplicando la inversa de la función de enlace a la combinación lineal de predictores:

μ = g⁻¹(η)

Donde η = Xβ + Zb + δ es el predictor lineal que incluye tanto los efectos fijos como los aleatorios.

Las suposiciones clave para los GLME incluyen:

  • El vector de efectos aleatorios b sigue una distribución normal multivariada con media cero y matriz de covarianza que depende de un parámetro θ y la dispersión σ²: b | σ², θ ~ N(0, σ²D(θ)). D(θ) es una matriz simétrica y semidefinida positiva parametrizada por θ.
  • Las observaciones yᵢ son condicionalmente independientes dado el vector de efectos aleatorios b.

Suposiciones Clave de los GLMM

Comprender las suposiciones subyacentes a los Modelos Lineales Mixtos Generalizados es fundamental para garantizar la validez de las inferencias. Aquí detallamos las suposiciones principales:

  1. Distribución de la Variable Respuesta: Se asume que, condicional a los efectos aleatorios, la variable respuesta pertenece a la familia exponencial de distribuciones. Esto abarca distribuciones como Normal, Binomial, Poisson, Gamma e InverseGaussian. La elección de la distribución debe alinearse con la naturaleza de los datos de respuesta (ej: Binomial para resultados binarios, Poisson para conteos).
  2. Función de Enlace: Existe una función de enlaceg que relaciona la media de la respuesta condicional μ con la combinación lineal de los predictores (fijos y aleatorios). La elección de la función de enlace debe ser apropiada para la distribución elegida (ej: logit para Binomial, log para Poisson).
  3. Independencia de los Efectos Aleatorios: Los efectos aleatoriosu (o b en la notación anterior) se asumen independientes de los efectos fijosβ y sus variables predictoras asociadas X. Esto significa que las variables predictoras no deben estar correlacionadas con los efectos aleatorios.
  4. Estructura de Varianza: La varianza de la respuesta condicional es una función de la media, determinada por la distribución elegida. Por ejemplo, en un modelo Poisson, la varianza condicional es igual a la media condicional. La estructura de covarianza de los efectos aleatorios también debe ser correctamente especificada.
  5. Especificación Correcta de la Estructura de Efectos Aleatorios: La estructura de los efectos aleatorios, incluyendo los factores de agrupación y la forma de la matriz de covarianza D(θ), debe ser especificada correctamente para modelar adecuadamente la correlación dentro de los grupos.
  6. Tamaño de Muestra Suficiente: Se requiere un tamaño de muestra adecuado tanto a nivel total como a nivel de grupo para obtener estimaciones confiables de los efectos fijos y aleatorios, así como de los parámetros de varianza/covarianza.

Especificando el Modelo: Notación de Wilkinson

Para especificar la estructura de los efectos fijos y aleatorios en el software estadístico (como se ejemplifica con fitglme en el texto), se suele utilizar la notación de Wilkinson. Una fórmula típica para un GLME es:

respuesta ~ efectos_fijos + (efectos_aleatorios1 | variable_agrupacion1) + ... + (efectos_aleatoriosR | variable_agrupacionR)

Donde:

  • respuesta es el nombre de la variable dependiente.
  • efectos_fijos especifica los términos para la parte de efectos fijos del modelo (similar a una regresión GLM estándar).
  • (efectos_aleatorios | variable_agrupacion) especifica los términos para los efectos aleatorios. Los términos a la izquierda de | son los predictores cuyos coeficientes varían aleatoriamente por los niveles de la variable_agrupacion (la variable a la derecha de |).

Algunos ejemplos comunes de la notación para efectos aleatorios:

  • (1 | grupo): Modelo con intercepto aleatorio para cada nivel de grupo. Asume que solo el intercepto varía aleatoriamente entre grupos.
  • (predictor | grupo): Modelo con intercepto aleatorio y pendiente aleatoria para predictor, ambos variando por nivel de grupo. Asume que el intercepto y la pendiente aleatorios pueden estar correlacionados dentro de cada grupo. Es equivalente a (1 + predictor | grupo).
  • (1 | grupo) + (-1 + predictor | grupo): Modelo con intercepto aleatorio y pendiente aleatoria para predictor, variando por nivel de grupo, pero asumiendo que el intercepto y la pendiente aleatorios son independientes. El -1 suprime el intercepto aleatorio redundante.

La parte de efectos fijos utiliza la notación de Wilkinson estándar:

Notación de WilkinsonTérminos en Notación Estándar
1Término constante (intercepto)
X^kX, , ..., Xk (polinomial)
X1 + X2X1, X2 (efectos principales)
X1*X2X1, X2, X1:X2 (efectos principales e interacción)
X1:X2Solo el término de interacción X1.*X2
- X2Excluir X2

Por defecto, se incluye un intercepto fijo a menos que se especifique -1 en la fórmula de efectos fijos.

Elección de Distribución y Función de Enlace

La elección de la distribución y la función de enlace es crucial en los GLME, ya que adaptan el modelo al tipo de variable respuesta. Aquí se sugieren algunas opciones comunes:

Tipo de Datos de RespuestaDistribución SugeridaFunción de Enlace Canónica por Defecto
Cualquier número realNormal'identity' (g(μ) = μ)
Cualquier número positivoGamma'reciprocal' (g(μ) = 1/μ)
Cualquier entero no negativo (datos de conteo)Poisson'log' (g(μ) = log(μ))
Entero de 0 a n (proporciones, recuentos dentro de un total fijo)Binomial'logit' (g(μ) = log(μ / (1-μ)))
Cualquier número positivoInverseGaussian'reciprocal squared' (g(μ) = 1/μ²)

Aunque la función de enlace canónica es la opción por defecto y a menudo la más interpretable, se pueden especificar otras funciones de enlace si son más apropiadas para la relación teórica entre los predictores y la respuesta.

What is the formula for the generalized linear mixed effect model?
For generalized linear mixed-effects models, the formula specification is of the form 'y ~ fixed + (random1|grouping1) + ... + (randomR|groupingR)' , where fixed and random contain the fixed-effects and the random-effects terms, respectively.

Ejemplo: Modelando Defectos en Fábricas

Consideremos un ejemplo práctico basado en datos simulados de fábricas que producen lotes de un producto. El objetivo es modelar el número de defectos por lote. Tenemos datos de varias fábricas (variable de agrupación) y variables predictoras como un nuevo proceso implementado, tiempo de procesamiento, temperatura y proveedor de materiales.

La variable respuesta 'defectos' es un conteo, lo que sugiere una distribución de Poisson.

Queremos modelar los defectos utilizando el nuevo proceso, tiempo, temperatura y proveedor como efectos fijos. Además, esperamos que haya variación en la calidad entre fábricas que no se explica por estos predictores fijos. Esto se modela incluyendo un intercepto aleatorio por cada fábrica (la variable de agrupación).

El modelo GLME para este caso sería:

defectsᵢⱼ ~ Poisson(μᵢⱼ)

Y la parte lineal conectada por la función de enlace log (canónica para Poisson):

log(μᵢⱼ) = β₀ + β₁ * newprocessᵢⱼ + β₂ * time_devᵢⱼ + β₃ * temp_devᵢⱼ + β₄ * supplier_Cᵢⱼ + β₅ * supplier_Bᵢⱼ + bᵢ

Donde:

  • defectsᵢⱼ es el número de defectos en el lote j de la fábrica i.
  • μᵢⱼ es la media esperada de defectos para el lote j de la fábrica i.
  • β₀ a β₅ son los coeficientes de efectos fijos para el intercepto, nuevo proceso, tiempo, temperatura y las variables dummy para los proveedores C y B.
  • bᵢ es el intercepto aleatorio para la fábrica i, asumiendo bᵢ ~ N(0, σ²_b). Este término bᵢ captura la variación específica de cada fábrica.

En notación de Wilkinson, este modelo se especifica como:

'defectos ~ 1 + newprocess + time_dev + temp_dev + supplier + (1|factory)'

Donde 1 representa el intercepto fijo, los siguientes términos son los efectos fijos y (1|factory) especifica un intercepto aleatorio agrupado por la variable factory.

Interpretación de Resultados y Trabajo con el Modelo

Una vez que el modelo GLME ha sido ajustado a los datos, se obtiene un resumen que proporciona información clave:

  • Estadísticas de Ajuste del Modelo: Incluyen métricas como AIC, BIC, LogLikelihood y Deviance, que ayudan a evaluar la bondad de ajuste y comparar modelos alternativos.
  • Coeficientes de Efectos Fijos: Tabla con las estimaciones de los coeficientes β, sus errores estándar, estadísticos de prueba (t-stat o z-stat) y p-valores. Un p-valor bajo para un coeficiente fijo sugiere que ese predictor tiene un efecto significativo en la respuesta promedio a través de los grupos.
  • Parámetros de Covarianza de Efectos Aleatorios: Información sobre la varianza de los efectos aleatorios (ej: σ²_b en el ejemplo de la fábrica). Una varianza significativa para un efecto aleatorio (indicado por su error estándar o intervalo de confianza si se calculan) sugiere que hay una variación importante entre los grupos que no se explica por los efectos fijos.
  • Parámetro de Dispersión: La estimación de σ² (o la raíz cuadrada de la dispersión), que es relevante para la varianza de las observaciones condicionales.

Para trabajar más a fondo con el modelo ajustado, se pueden utilizar funciones específicas para:

  • Extraer las estimaciones de los efectos fijos y aleatorios, así como los parámetros de covarianza.
  • Calcular intervalos de confianza para los coeficientes y parámetros.
  • Realizar pruebas de hipótesis personalizadas sobre combinaciones de coeficientes.
  • Generar valores predichos o ajustados basados en el modelo.
  • Analizar los residuales para verificar las suposiciones del modelo.

GLM vs GLMM: ¿Cuál es la Diferencia?

Es útil contrastar los GLME/GLMM con sus modelos predecesores:

CaracterísticaModelos Lineales Generalizados (GLM)Modelos Lineales Mixtos Generalizados (GLMM)
Manejo de la Distribución de la RespuestaFlexible (Familia Exponencial: Poisson, Binomial, etc.)Flexible (Familia Exponencial: Poisson, Binomial, etc.)
Manejo de Datos Correlacionados/AgrupadosNo directamente; asume independencia de observaciones.Sí; modela la correlación a través de efectos aleatorios.
Estructura de PredictoresSolo efectos fijos. La combinación lineal se relaciona con la media a través de la función de enlace.Incluye efectos fijos y efectos aleatoriosZb. La combinación lineal Xβ + Zb se relaciona con la media a través de la función de enlace.
Complejidad ComputacionalGeneralmente más sencillo.Más complejo, a menudo requiere métodos de aproximación o simulación para la estimación.
Aplicaciones TípicasRegresión logística, regresión de Poisson simple, modelos para datos de recuento o proporciones independientes.Datos longitudinales, datos jerárquicos (anidados), metaanálisis, estudios con múltiples mediciones por sujeto/unidad.

En esencia, los GLMM son más flexibles que los GLM porque pueden manejar tanto la no normalidad de la respuesta como la estructura de dependencia en los datos, lo cual es muy común en la investigación real.

Preguntas Frecuentes sobre GLMM

¿Cuál es la diferencia principal entre un GLM y un GLMM?
La diferencia clave es que los GLMM incluyen efectos aleatorios además de los efectos fijos para modelar la correlación dentro de los grupos, mientras que los GLM solo modelan efectos fijos y asumen independencia entre las observaciones.
¿Cuál es la fórmula general de un GLMM?
La fórmula general relaciona la media condicional de la respuesta (dado los efectos aleatorios) con un predictor lineal a través de una función de enlace: g(E[y | u]) = Xβ + Zu, donde g es la función de enlace, E[y | u] es la esperanza condicional, son los efectos fijos y Zu son los efectos aleatorios.
¿Cuáles son las principales suposiciones de un GLMM?
Las suposiciones clave incluyen que la respuesta condicional sigue una distribución de la familia exponencial, la correcta especificación de la función de enlace, la independencia entre efectos fijos y aleatorios, una estructura de varianza adecuada para la distribución elegida, la correcta especificación de la estructura de efectos aleatorios y un tamaño de muestra suficiente.
¿Por qué usar GLMM en lugar de simplemente un GLM con errores robustos?
Mientras que los errores robustos pueden ajustar los errores estándar por la correlación dentro de los grupos, no modelan explícitamente la variación entre grupos ni permiten estimar los efectos aleatorios o predecir valores para nuevos grupos. Los GLMM proporcionan un modelo más completo que explica la fuente de la correlación.

En resumen, los Modelos Lineales Generalizados Mixtos son una herramienta poderosa y flexible para analizar datos complejos que exhiben tanto no normalidad en la respuesta como estructura de dependencia. Al incorporar efectos fijos y aleatorios, y permitir una variedad de distribuciones y funciones de enlace, se adaptan a una amplia gama de escenarios de datos del mundo real que van más allá de las capacidades de los modelos de regresión más simples.

Si quieres conocer otros artículos parecidos a Modelos Lineales Generalizados Mixtos puedes visitar la categoría Maquillaje.

Subir