19/10/2022
En el fascinante mundo de la econometría y el análisis estadístico, comprender el impacto real de cada variable en nuestros modelos es crucial. Más allá de los coeficientes brutos de una regresión, los efectos marginales nos ofrecen una visión más precisa y digerible de cómo un pequeño cambio en una variable independiente afecta la variable dependiente. Este artículo se sumerge en el cálculo e interpretación de los efectos marginales, centrándose específicamente en el comando mfx de Stata, relevante para las versiones 10 y anteriores de este potente software estadístico.

Si bien Stata 11 y versiones posteriores introdujeron el comando margins como un reemplazo más versátil y potente, entender la lógica detrás de mfx no solo es fundamental para quienes trabajan con versiones antiguas, sino que también proporciona una base sólida para comprender cómo se derivan estos importantes valores en cualquier contexto de modelado no lineal.
¿Qué Son los Efectos Marginales? Una Mirada Profunda
Matemáticamente, un efecto marginal de una variable independiente X sobre el valor esperado de una variable dependiente Y se define como la derivada parcial de la función de predicción f con respecto a X. Es decir, ΔE[Y|X] / ΔX, lo que representa la tasa de cambio instantánea de E[Y|X] con respecto a X. En modelos de regresión lineal simple, el efecto marginal de una variable es directamente su coeficiente estimado (β), lo que facilita su interpretación directa. Sin embargo, en modelos no lineales (como regresiones logísticas, probit o multinomiales), la relación no es tan sencilla. El efecto de un cambio en X ya no es constante, sino que depende del valor actual de X y de las demás variables en el modelo.
La computación de estos efectos en modelos no lineales a menudo implica una de dos estrategias:
- Derivación Analítica: Si la función de predicción es diferenciable, se pueden obtener expresiones exactas para los efectos marginales. Esto proporciona resultados precisos, pero puede ser matemáticamente complejo y no siempre factible para funciones muy intrincadas.
- Aproximación Numérica: Cuando la derivación analítica es inviable, se utilizan métodos numéricos. Estos aproximan la derivada mediante diferencias finitas. Las fórmulas más comunes son:
- Diferencia Adelantada (One-Sided):
(f(x+h) - f(x)) / h - Diferencia Central (Two-Sided, más precisa):
(f(x+h) - f(x-h)) / (2h)
La elección de h, un pequeño tamaño de paso, es crítica. Un h demasiado pequeño puede llevar a inestabilidad numérica debido a limitaciones de precisión de punto flotante, mientras que un h demasiado grande reduce la precisión de la aproximación.
El Comando mfx en Stata (Versiones 10 y Anteriores)
Después de realizar una estimación de regresión, el comando mfx en Stata calcula los efectos marginales. El efecto marginal de una variable independiente x es la derivada parcial, con respecto a x, de la función de predicción f. Si no se especifica una función de predicción (mediante la opción predict), mfx utiliza la predicción predeterminada del comando de estimación anterior.
Esta derivada se evalúa en los valores de las variables independientes especificados en la opción at del comando mfx. Si no se especifican valores, se evalúa en los valores predeterminados, que suelen ser las medias de las variables independientes. Si hubo algún offset en la estimación anterior, la derivada se evalúa en las medias de las variables de offset.
La derivada es calculada numéricamente por mfx, lo que significa que aproxima la derivada utilizando la fórmula de diferencia finita con un h apropiadamente pequeño. Es importante recordar que la función de predicción f es una función de todas las variables independientes en el modelo (x_i) y sus coeficientes (b_i), manteniendo las demás variables constantes en sus medias.
Errores Estándar de los Efectos Marginales: El Delta Method
La obtención de los errores estándar de los efectos marginales es fundamental para la inferencia estadística y se realiza utilizando el Delta Method. La fórmula general para el error estándar de un efecto marginal de x es la raíz cuadrada de D_x' * V * D_x, donde V es la matriz de varianza-covarianza de la estimación y D_x es el vector columna cuya j-ésima entrada es la derivada parcial del efecto marginal de x con respecto al coeficiente de la j-ésima variable independiente. Esto implica el cálculo de segundas derivadas, lo que puede ser computacionalmente intensivo.
Métodos de Cálculo de mfx: Lineal vs. No Lineal
El comando mfx puede evitar el costoso proceso iterativo de búsqueda de un h apropiado en dos situaciones clave, lo que agiliza el cálculo:
1. Variables Dicotómicas
Cuando la variable x no es continua sino una variable dicotómica (o dummy), es decir, solo puede tomar valores de 0 o 1, la interpretación de una derivada puntual en su valor promedio carece de sentido. En este caso, mfx calcula la pendiente de la línea entre f(0) y f(1). En otras palabras, para una variable dicotómica, utiliza h=1. Esto representa un cambio discreto de 0 a 1, un enfoque más intuitivo para estas variables.
Por ejemplo, después de una regresión logística multinomial (mlogit) con una variable dummy como foreign (0=doméstico, 1=extranjero), mfx calculará el efecto marginal de foreign como la diferencia en la probabilidad predicha cuando foreign es 1 versus cuando es 0, manteniendo las otras variables en sus medias.

2. La Condición del Método Lineal
El método lineal se aplica cuando la función de predicción f depende de las variables x y los coeficientes b de una manera específica: solo a través de la suma lineal Σ x_i * b_i (conocida como xb o el índice lineal). Un ejemplo clásico es la probabilidad predicha en una regresión logística, exp(xb) / (1 + exp(xb)), donde xb es el único argumento que contiene las variables y sus coeficientes.
Cuando se cumple esta condición, el cálculo del efecto marginal de x_i se simplifica enormemente mediante la regla de la cadena: df/dx_i = (df/d(xb)) * b_i. Esto significa que df/d(xb) se calcula una sola vez y luego se multiplica por el coeficiente apropiado para cada x_i, haciendo que el método lineal sea considerablemente más rápido que el no lineal.
Cuándo el Método Lineal NO se Satisface
La condición del método lineal no se cumple cuando algunas variables independientes son tratadas de manera diferente a otras en la función de predicción. Esto es común en modelos de ecuaciones múltiples donde una variable puede aparecer en más de una ecuación. Por ejemplo, en un modelo biprobit con dos ecuaciones, si una variable (como logptax) está presente en ambas, incluso una predicción simple como el índice lineal (xb) no satisfará la condición lineal. En estos casos, mfx recurrirá al método no lineal más intensivo.
Para verificar qué método está utilizando mfx, se puede usar la opción tracelvl(1). Esto mostrará si se está empleando el método lineal o no lineal durante el cálculo.
Profundizando en los Cálculos de mfx
Método No Lineal: El Proceso Iterativo
Como se mencionó, el método no lineal es más general y computacionalmente más exigente. Para calcular el efecto marginal de x, mfx utiliza la aproximación numérica de la derivada: (f(x+h) - f(x)) / h. Comienza con una estimación inicial de h y, si no es lo suficientemente buena, itera (haciendo h más grande o más pequeño) hasta encontrar un h que produzca el nivel de precisión deseado. Lo mismo ocurre para el cálculo de las segundas derivadas (d^2f/dxdb) necesarias para los errores estándar, donde se itera sobre un pequeño cambio en el coeficiente b_j.
La opción tracelvl(2) en mfx permite observar estos cálculos paso a paso, mostrando cómo se determinan las segundas derivadas.
Método Lineal: Eficiencia a Través de la Estructura
En el método lineal, donde f(x_1, ..., x_p, b_1, ..., b_p) = f(Σ x_i * b_i), la eficiencia se logra porque df/d(xb) es común para todas las variables x_i. Solo es necesario calcular esta derivada una vez, y luego los efectos marginales individuales se obtienen multiplicándola por el coeficiente correspondiente b_i. Esto es notablemente más rápido.
Por ejemplo:
- En una regresión lineal (
regress) con predicciónxb,f(xb) = xb. La derivadadf/d(xb)es 1, por lo que el efecto marginal es simplemente el coeficiente. - En una regresión logística (
logit) con predicción de probabilidad (predict, p),f(xb) = exp(xb) / (1 + exp(xb)). La derivadadf/d(xb)esexp(xb) / (1 + exp(xb))^2, que es igual ap * (1 - p)(probabilidad predicha multiplicada por uno menos la probabilidad predicha). Este valor dedf/d(xb)se calcula y luego se multiplica por cada coeficiente para obtener los efectos marginales.
Para los errores estándar en el método lineal, las fórmulas de las segundas derivadas D_ij = d^2f / (db_j dx_i) se simplifican, especialmente cuando df/d(xb) es una función constante o cuando las variables no se comparten entre ecuaciones. mfx calcula estas segundas derivadas de manera eficiente, aprovechando la estructura lineal para acelerar el proceso.
Interpretación de los Efectos Marginales
La interpretación de los efectos marginales varía según el tipo de variable:
- Variables Continuas: El efecto marginal (
ΔE[Y|X] / ΔX) representa el cambio infinitesimal en el valor esperado deYpor un cambio unitario enX, manteniendo las otras variables constantes. Dado que en modelos no lineales este efecto puede variar a lo largo del rango deX, a menudo se evalúa en un punto específico (como la media deXo un valor representativo). - Variables Discretas/Dicotómicas: El efecto marginal se interpreta como el cambio en el valor esperado de
Ycuando la variable discreta cambia de una categoría a otra (por ejemplo, de 0 a 1), manteniendo las otras variables constantes. Esto se conoce como un "efecto incremental" o "diferencia primera".
Efectos Marginales Promedio (AME) vs. Efectos Marginales en Puntos Específicos
El comando mfx, por defecto, calcula los efectos marginales en las medias de las variables independientes. Sin embargo, una práctica común es calcular los efectos marginales promedio (AME, por sus siglas en inglés: Average Marginal Effects). Un AME se obtiene calculando el efecto marginal para cada observación en el conjunto de datos y luego promediando estos efectos. Esto puede ser útil para resumir un efecto general, pero tiene sus limitaciones.
Los AME pueden ocultar diferencias importantes en cómo el efecto de una variable varía a lo largo de su rango o según los valores de otras variables. Por ejemplo, el efecto marginal de la edad en la probabilidad de tener una enfermedad podría ser muy diferente para personas jóvenes que para personas mayores. Un AME podría no capturar esta heterogeneidad.

Una alternativa más informativa, especialmente en presencia de efectos no lineales o interacciones, es evaluar los efectos marginales en valores representativos de las variables. Por ejemplo, en lugar de un AME general para la raza, se podría calcular el efecto marginal de la raza para diferentes grupos de edad (ej. 20, 30, 40, 50, 60 y 70 años). Esto proporciona una imagen mucho más matizada y comprensible del impacto de la variable.
Medias Marginales Estimadas (Adjusted Predictions)
Relacionado pero distinto de los efectos marginales son las medias marginales estimadas (también conocidas como predicciones ajustadas). En lugar de calcular una derivada, este enfoque consiste en predecir el resultado (Y) para combinaciones específicas de valores de las variables. Por ejemplo, se podría estimar la probabilidad promedio de tener diabetes para mujeres de 70 años que son 'blancas' y compararla con la probabilidad para mujeres de 70 años que 'no son blancas'. La diferencia entre estas dos predicciones es una forma de cuantificar el efecto.
La ventaja de las medias marginales es que son directamente interpretables como probabilidades o valores esperados. La desventaja, para algunos, es que a menudo implican establecer todas las demás variables en sus medias o en valores específicos, lo que puede no representar un escenario "real" para todas las observaciones.
Preguntas Frecuentes (FAQ)
¿Cuál es la diferencia entre mfx y margins en Stata?mfx es el comando para calcular efectos marginales en Stata 10 y versiones anteriores. margins lo reemplazó a partir de Stata 11, ofreciendo una sintaxis más flexible, mayor capacidad para manejar interacciones y efectos condicionales, y una forma más robusta de calcular e interpretar efectos y predicciones ajustadas.
¿Por qué es importante el efecto marginal en modelos no lineales?
En modelos no lineales (como logit o probit), los coeficientes no se interpretan directamente como el cambio en la probabilidad o el valor esperado de la variable dependiente. Los efectos marginales transforman estos coeficientes en una métrica directamente interpretable, mostrando el impacto real de un cambio unitario en una variable independiente sobre la variable dependiente, a menudo en la escala de probabilidad.
¿Cómo elijo el valor de h en la aproximación numérica?
En la práctica, mfx de Stata se encarga de elegir un h apropiado de forma iterativa para asegurar la precisión. Como usuario, no necesitas especificar h directamente. Sin embargo, es importante saber que un h inadecuado (demasiado pequeño o demasiado grande) podría llevar a errores numéricos o imprecisiones.
¿Cuándo debo usar efectos marginales promedio (AME) vs. efectos marginales en puntos específicos?
Los AME ofrecen un resumen general del efecto de una variable en toda la muestra. Son útiles para una interpretación concisa cuando el efecto no varía drásticamente a lo largo de los valores de las variables. Sin embargo, si sospechas que el efecto de una variable cambia significativamente según los valores de otras variables (por ejemplo, en presencia de interacciones o no linealidades fuertes), es más informativo calcular los efectos marginales en puntos específicos o valores representativos de las variables relevantes. Esto permite capturar la heterogeneidad del efecto.
¿Qué es el Delta Method y por qué se usa para los errores estándar?
El Delta Method es una técnica estadística utilizada para aproximar la varianza de una función no lineal de variables aleatorias. En el contexto de los efectos marginales, permite estimar los errores estándar de estos efectos (que son funciones no lineales de los coeficientes estimados) basándose en la matriz de varianza-covarianza de los coeficientes originales. Es crucial porque los efectos marginales no suelen tener una distribución normal, pero el método permite derivar sus propiedades asintóticas para la inferencia.
Conclusión
El cálculo e interpretación de los efectos marginales son pasos esenciales para comprender a fondo los resultados de los modelos de regresión, especialmente aquellos de naturaleza no lineal. Aunque el comando mfx de Stata (para versiones 10 y anteriores) ya no es el estándar, su lógica subyacente de aproximación numérica y el uso del Delta Method para los errores estándar siguen siendo principios fundamentales en la econometría moderna. Al dominar estos conceptos, los analistas pueden ir más allá de los coeficientes brutos y obtener una comprensión más precisa y matizada del impacto de las variables en sus modelos, lo que conduce a conclusiones más robustas y decisiones mejor informadas.
Si quieres conocer otros artículos parecidos a ¿Cómo Calcular e Interpretar Efectos Marginales en Stata? puedes visitar la categoría Estadística.
