¿Qué es la varianza conjunta?

Descifrando la Covarianza: Guía Completa

18/11/2025

Valoración: 4.13 (13623 votos)

En el vasto universo de las matemáticas y las finanzas, comprender cómo dos elementos interactúan entre sí es fundamental. Ya sea que estemos analizando datos científicos, rendimientos de inversiones o cualquier otro par de variables, la capacidad de cuantificar su relación nos brinda una visión invaluable. Aquí es donde entra en juego la covarianza, una medida estadística que nos permite determinar la dirección en la que dos variables se mueven en relación la una con la otra. Este artículo desglosará qué es la covarianza, cómo se calcula, por qué es tan importante y cómo se relaciona con otros conceptos estadísticos clave como la correlación, ofreciéndote una guía completa para dominar esta herramienta analítica.

¿Cómo se calcula la covarianza de dos variables?
La covarianza se calcula dividiendo la suma de los productos por el número de observaciones, lo que da como resultado una covarianza de 5,4, lo que indica una relación positiva entre las dos acciones, ya que generalmente se mueven en la misma dirección.
Índice de Contenido

¿Qué es la Covarianza?

La covarianza es una medida estadística que indica la dirección en la que dos variables aleatorias se desvían de sus medias. En términos más sencillos, nos dice si dos variables tienden a moverse en la misma dirección o en direcciones opuestas. Es una herramienta poderosa, especialmente en el ámbito financiero, donde se utiliza para entender cómo los rendimientos de dos activos se comportan entre sí. A diferencia de la varianza, que mide la dispersión de una sola variable respecto a su media, la covarianza compara dos variables con sus respectivas medias para evaluar sus variaciones conjuntas.

Para los inversores, la covarianza es crucial para analizar el rendimiento de acciones o clases de activos en relación unos con otros. Al examinar el comportamiento histórico de los precios de las acciones, la covarianza puede ayudar a predecir si es probable que los precios de las acciones sigan patrones similares en el futuro, ya sea entre sí o en relación con un índice de mercado.

  • Una covarianza positiva indica una relación positiva: las variables tienden a moverse en la misma dirección. Si una aumenta, la otra también; si una disminuye, la otra también.
  • Una covarianza negativa sugiere una relación inversa: las variables tienden a moverse en direcciones opuestas. Si una aumenta, la otra tiende a disminuir.
  • Una covarianza cercana a cero indica que no hay una relación lineal clara entre las variables.

Fórmula de la Covarianza

El cálculo de la covarianza implica multiplicar la desviación de cada variable respecto a su media, y luego promediar estos productos. La fórmula de la covarianza para una muestra de datos es la siguiente:

Cov(X, Y) = Σ [(Xi - X̄) * (Yi - Ȳ)] / (n - 1)

Donde:

  • Xi: Es el valor individual de la variable X en la observación i.
  • : Es la media de la variable X.
  • Yi: Es el valor individual de la variable Y en la observación i.
  • Ȳ: Es la media de la variable Y.
  • n: Es el número de observaciones o pares de datos.
  • Σ: Es la suma de todos los productos.
  • El divisor (n - 1) se utiliza para muestras, aplicando la corrección de Bessel para obtener un estimador insesgado de la covarianza poblacional. Para la covarianza poblacional, se dividiría por n.

Covarianza vs. Coeficiente de Correlación

Si bien la covarianza nos da la dirección de la relación, su interpretación puede ser un desafío debido a que sus unidades dependen de las unidades de las variables originales. Por ejemplo, la covarianza de la altura y el peso de las personas tendrá unidades de "pulgadas-libras" o "centímetros-kilogramos", lo que no es intuitivo de comparar. Aquí es donde el coeficiente de correlación se vuelve invaluable.

El coeficiente de correlación estandariza la relación entre dos activos, proporcionando un valor que siempre se encuentra entre -1 y 1. Esto lo hace mucho más fácil de interpretar y comparar la fuerza de las relaciones entre diferentes pares de activos. La fórmula del coeficiente de correlación (r) es:

r = Cov(X, Y) / (σX * σY)

Donde:

  • Cov(X, Y): Es la covarianza entre las variables X e Y.
  • σX: Es la desviación estándar de la variable X.
  • σY: Es la desviación estándar de la variable Y.

¿Cómo Funciona la Correlación?

La interpretación del coeficiente de correlación es directa:

  • Un coeficiente de correlación de +1 (correlación perfecta positiva) significa que las dos variables se mueven juntas en la misma proporción. Si una aumenta, la otra aumenta exactamente en la misma medida relativa.
  • Un coeficiente de correlación de -1 (correlación perfecta negativa) indica que se mueven en direcciones opuestas en la misma proporción. Si una aumenta, la otra disminuye exactamente en la misma medida relativa.
  • Un coeficiente de correlación de 0 sugiere que no hay una relación lineal aparente entre las variables. Esto no significa que no haya ninguna relación, solo que no es lineal.

Es muy inusual encontrar acciones o clases de activos que estén perfectamente correlacionados. Sin embargo, muchos tienen una alta correlación, como las acciones de empresas petroleras, que tienden a moverse en conjunto con los precios del petróleo. Aunque los diagramas de dispersión pueden representar visualmente estas relaciones, a menudo requieren un análisis estadístico adicional para confirmar cualquier patrón subyacente. En finanzas, la correlación es crucial para determinar la asignación de activos y mejorar la diversificación de una cartera.

Es fundamental recordar que la correlación no implica causalidad. Por ejemplo, puede haber una correlación entre el uso de botas de nieve y los accidentes automovilísticos durante el clima nevado, pero en realidad, es la nieve la que influye en ambos, no las botas de nieve causando accidentes.

Importancia en Finanzas: Diversificación de Carteras

La covarianza y la correlación son herramientas esenciales para los gestores de cartera y los inversores individuales. Una estrategia de cartera diversificada puede navegar por más entornos de mercado y, potencialmente, reducir la volatilidad general. Los gestores de carteras utilizan la correlación para evaluar el nivel de diversificación dentro de sus portafolios, tanto para clases de activos como para acciones individuales.

Activos con bajas correlaciones generalmente proporcionan mayores beneficios de diversificación. Al combinar activos que no se mueven de la misma manera, se puede reducir el riesgo total de la cartera sin sacrificar el rendimiento esperado. Por ejemplo, los bonos gubernamentales intermedios históricamente muestran una correlación negativa con las acciones, lo que los convierte en un diversificador eficaz en una cartera de renta variable. La combinación de factores con diferentes características de riesgo y rendimiento, y bajas correlaciones, ayuda a los inversores a afrontar condiciones de mercado adversas.

La fórmula para calcular la varianza y la desviación estándar de una cartera puede parecer intimidante, pero implica tomar la varianza de cada activo individual ponderada por su porcentaje en la cartera, elevarla al cuadrado, y sumarla al producto de los pesos, la correlación de los activos y las desviaciones estándar individuales de los activos. Por lo tanto, refleja no solo el riesgo de los activos individuales, sino también sus interacciones. Una cartera de cuatro activos tendrá cuatro pesos y seis términos de correlación, mientras que cinco activos tendrán diez términos de correlación. La varianza en sí puede ser difícil de interpretar, por lo que la mayoría de los analistas calculan la desviación estándar como la raíz cuadrada de la varianza.

Cálculo Práctico de Covarianza y Correlación: Un Ejemplo Detallado

Para ilustrar el proceso, calcularemos la covarianza y la correlación entre el rendimiento mensual de las acciones de la Compañía A y la Compañía B a lo largo de 2024. Este ejemplo se basa en un conjunto de datos hipotéticos, pero el proceso es aplicable a cualquier serie de datos.

Pasos para el Cálculo Manual (y confirmación con Excel):

  1. Calcular la Media de cada Serie de Datos:

    Primero, necesitamos la media de los rendimientos mensuales de cada compañía. Esto se hace sumando todos los rendimientos de cada acción y dividiendo por el número de meses. Supongamos que, para nuestro ejemplo, la media mensual de la Compañía A es del 4.2% y la de la Compañía B es del 2.3%.

  2. Calcular la Desviación Estándar de cada Serie de Datos:

    Aunque no es estrictamente necesaria para la covarianza, sí lo es para la correlación. La desviación estándar mide la dispersión de los datos alrededor de la media. Para la Compañía A, supongamos que es del 6.4%, y para la Compañía B, del 5.4%. Estos valores son cruciales para el cálculo de la correlación.

  3. Calcular las Diferencias de cada Mes respecto a su Media:

    Para cada mes, resta la media de la Compañía A del rendimiento de la Compañía A para ese mes. Haz lo mismo para la Compañía B. Esto nos da la desviación de cada punto de datos de su respectiva media.

    Diferencia_A(mes i) = Rendimiento_A(mes i) - Media_A

    Diferencia_B(mes i) = Rendimiento_B(mes i) - Media_B

  4. Multiplicar las Diferencias para cada Mes:

    Ahora, multiplica la diferencia de la Compañía A por la diferencia de la Compañía B para cada mes. Este producto es clave para la covarianza.

    Producto_Diferencias(mes i) = Diferencia_A(mes i) * Diferencia_B(mes i)

  5. Sumar los Productos de las Diferencias:

    Suma todos los "Productos_Diferencias" calculados en el paso anterior. Esta suma representa el numerador de nuestra fórmula de covarianza.

  6. Calcular la Covarianza:

    Divide la suma de los productos de las diferencias por (n - 1), donde n es el número de observaciones (en nuestro caso, 12 meses). Si la suma de los productos fue, por ejemplo, 0.00152 (asumiendo que los rendimientos se manejan en decimales), entonces:

    Covarianza = 0.00152 / (12 - 1) = 0.00152 / 11 ≈ 0.000138

    Una covarianza positiva (como 0.000138) indica una relación positiva entre las dos acciones, lo que sugiere que generalmente se mueven en la misma dirección.

    ¿Cómo se calcula la covarianza de dos variables?
    La covarianza se calcula dividiendo la suma de los productos por el número de observaciones, lo que da como resultado una covarianza de 5,4, lo que indica una relación positiva entre las dos acciones, ya que generalmente se mueven en la misma dirección.
  7. Calcular el Coeficiente de Correlación:

    Ahora, para evaluar la fuerza de esta relación, dividimos la covarianza por el producto de las desviaciones estándar de las dos acciones. Asumiendo que las desviaciones estándar se usan como decimales (0.064 y 0.054):

    Correlación = Covarianza / (Desviación_Estándar_A * Desviación_Estándar_B)

    Correlación = 0.000138 / (0.064 * 0.054) = 0.000138 / 0.003456 ≈ 0.04

    Un resultado de 0.04 indica una correlación positiva entre los precios de las acciones de la Compañía A y la Compañía B, pero es muy débil, casi nula, dado el rango de -1 a +1. Esto sugiere que el movimiento de una acción apenas influye en el de la otra.

  8. Confirmación con Función de Excel:

    Para verificar tus cálculos, puedes usar la función =CORREL(rango_datos_A, rango_datos_B) en Excel, que debería arrojar el mismo coeficiente de correlación. Esto es una excelente manera de validar el proceso manual.

Otro Concepto de Varianza Importante: La Varianza Agrupada

Aunque el enfoque principal de este artículo es la covarianza entre dos variables, es importante mencionar un concepto relacionado que a menudo genera confusión por su nombre similar: la varianza agrupada (también conocida como combinada, compuesta o varianza general). En estadística, la varianza agrupada es un método para estimar la varianza de varias poblaciones diferentes cuando, si bien la media de cada población puede ser diferente, se puede suponer que la varianza de cada población es la misma.

Bajo el supuesto de varianzas poblacionales iguales, la varianza muestral agrupada proporciona una estimación de la varianza con una precisión más alta que las varianzas muestrales individuales. Esta mayor precisión puede llevar a un aumento de la potencia estadística cuando se usa en pruebas de hipótesis que comparan las poblaciones, como la prueba t de Student. La raíz cuadrada de un estimador de varianza agrupada se conoce como desviación estándar agrupada.

Motivación y Cálculo de la Varianza Agrupada

A menudo, en la recopilación de datos, se necesitan numerosas pruebas repetidas para cada valor de una variable independiente (x) para lograr una varianza pequeña en la variable dependiente (y). Esto puede ser costoso. Las estimaciones razonables de varianza se pueden determinar utilizando el principio de varianza agrupada después de repetir cada prueba en una x particular solo unas pocas veces. La varianza agrupada es una estimación de la varianza común fija σ² que subyace a varias poblaciones que poseen diferentes medias aritméticas.

Si las poblaciones están indexadas de acuerdo con i = 1, ..., k, entonces la varianza agrupada s_p² puede ser calculada por la media ponderada:

s_p² = Σ [(n_i - 1) * s_i²] / Σ (n_i - 1)

Donde:

  • n_i: Es el tamaño de la muestra de la población i.
  • s_i²: Es la varianza de la muestra de la población i.
  • El uso de los factores de ponderación (n_i - 1) en lugar de n_i proviene de la corrección de Bessel, asegurando un estimador insesgado.

Ejemplo de Cálculo de Varianza Agrupada

Consideremos el siguiente conjunto de datos para la variable dependiente y, obtenidos en varios niveles de la variable independiente x:

xy
131, 30, 29
242, 41, 40, 39
331, 28
423, 22, 21, 19, 18
521, 20, 19, 18, 17

Las estadísticas para cada subconjunto (nivel de x) son:

xny medias_i² (Varianza)s_i (Desviación Estándar)
1330.01.01.0
2440.51.671.29
3229.54.52.12
4520.64.32.07
5519.02.51.58

Aplicando la fórmula de la varianza agrupada:

s_p² = [(3-1)*1.0 + (4-1)*1.67 + (2-1)*4.5 + (5-1)*4.3 + (5-1)*2.5] / [(3-1) + (4-1) + (2-1) + (5-1) + (5-1)]

s_p² = [2*1.0 + 3*1.67 + 1*4.5 + 4*4.3 + 4*2.5] / [2 + 3 + 1 + 4 + 4]

s_p² = [2.0 + 5.01 + 4.5 + 17.2 + 10.0] / 14

s_p² = 38.71 / 14 ≈ 2.765

La varianza agrupada de los datos mostrados es aproximadamente 2.764.

Efecto sobre la Precisión y Agregación de Desviaciones Estándar

La varianza agrupada es una estimación que puede ser menos precisa si existe una correlación significativa entre los conjuntos de datos agrupados o si los promedios de los conjuntos de datos son muy distintos. La precisión disminuye a medida que la correlación es más distinta de cero o las medias están más distantes entre sí.

También es posible agregar desviaciones estándar de forma exacta cuando se dispone de más información estadística. Para poblaciones que no se superponen, la media y la desviación estándar de la población combinada pueden calcularse si se conocen los tamaños y las medias de cada subpoblación. De manera similar, para poblaciones superpuestas, se requiere información sobre la intersección. Cuando se agregan conjuntos de datos uno a uno, la desviación estándar del resultado se puede calcular si se conoce la desviación estándar de cada conjunto de datos y la covarianza entre cada par de conjuntos de datos. Si no hay correlación entre ningún par de conjuntos de datos, la relación se simplifica a la raíz de la suma de los cuadrados de las desviaciones estándar individuales.

Conclusión

La covarianza y la correlación son métricas estadísticas fundamentales que nos permiten comprender las relaciones entre variables, especialmente en el ámbito financiero. Mientras que la covarianza indica la dirección de la relación (positiva, negativa o nula), el coeficiente de correlación estandariza esta relación, facilitando su interpretación y comparación de la fuerza de dicha conexión. Ambas son herramientas indispensables para la gestión de riesgos, la diversificación de carteras y la toma de decisiones informadas sobre la asignación de activos. Dominar estos conceptos te equipará con una visión más profunda sobre el comportamiento conjunto de los datos y los mercados.

Preguntas Frecuentes (FAQs)

¿Cuál es la diferencia clave entre covarianza y correlación?

La covarianza mide la dirección de la relación entre dos variables (positiva, negativa o nula) y su valor puede ser cualquier número real, dependiendo de las unidades de las variables. La correlación, por otro lado, estandariza esta relación en una escala de -1 a +1, lo que la hace más fácil de interpretar y comparar la fuerza de la relación, independientemente de las unidades de las variables.

¿Por qué es importante la covarianza en las finanzas?

En finanzas, la covarianza es vital para entender cómo los rendimientos de diferentes activos se mueven entre sí. Ayuda a los inversores y gestores de cartera a construir portafolios diversificados. Si dos activos tienen una covarianza baja o negativa, combinarlos puede reducir el riesgo general de la cartera, ya que sus movimientos tienden a compensarse entre sí.

¿Un valor de covarianza alto siempre indica una relación fuerte?

No necesariamente. Un valor de covarianza alto solo indica que las variables se mueven juntas de manera significativa, pero no nos dice la "fuerza" relativa de esa relación. Esto se debe a que el valor de la covarianza no está estandarizado y depende de la escala de las variables. Para evaluar la fuerza, se debe usar el coeficiente de correlación.

¿Qué significa una correlación de cero?

Una correlación de cero (0) indica que no hay una relación lineal discernible entre las dos variables. Esto significa que el movimiento de una variable no predice el movimiento de la otra de manera lineal. Sin embargo, es importante recordar que puede existir una relación no lineal.

¿Cómo se utiliza la covarianza en la diversificación de carteras?

Los inversores buscan activos que tengan baja covarianza (idealmente negativa) entre sí. Al combinar activos que no se mueven en perfecta sincronía, se puede reducir la volatilidad general de la cartera. Por ejemplo, si las acciones y los bonos tienen una covarianza baja o negativa, un portafolio que los combine será más estable que uno compuesto solo por acciones.

¿Es lo mismo la varianza agrupada que la covarianza?

No, son conceptos distintos. La varianza agrupada es una técnica para estimar una varianza común cuando se tienen múltiples muestras de poblaciones que se asume tienen la misma varianza (aunque sus medias puedan ser diferentes). La covarianza, en cambio, mide la relación conjunta y la dirección de movimiento entre dos variables diferentes.

Si quieres conocer otros artículos parecidos a Descifrando la Covarianza: Guía Completa puedes visitar la categoría Estadística.

Subir