16/10/2022
En el vasto universo de los datos, a menudo nos encontramos con la necesidad de comprender cómo se conectan diferentes elementos entre sí. ¿Afecta el aumento de la temperatura a las ventas de helados? ¿Existe una relación entre el nivel educativo y los ingresos? Estas preguntas, y muchas otras, nos llevan al fascinante campo de la estadística y, más específicamente, a la noción de la relación entre variables.

No todas las relaciones son iguales. Algunas son tan predecibles que podemos expresarlas con una fórmula exacta, mientras que otras son más sutiles, influenciadas por múltiples factores y con un grado de incertidumbre inherente. Comprender esta distinción es el primer paso para desentrañar los secretos que los datos guardan. A continuación, exploraremos cómo identificar y cuantificar estas relaciones, centrándonos en una de las herramientas más poderosas para este fin: la correlación.
- Relaciones Determinísticas vs. Relaciones Estadísticas
- ¿Qué son los Coeficientes de Correlación?
- ¿Cómo se Calcula el Coeficiente de Correlación?
- Aplicaciones Prácticas de la Correlación
- Herramientas para Calcular el Coeficiente de Correlación
- Correlación vs. Regresión Lineal Simple
- Preguntas Frecuentes (FAQ)
- En Conclusión
Relaciones Determinísticas vs. Relaciones Estadísticas
Antes de sumergirnos en la correlación, es crucial entender que las relaciones entre variables pueden ser de dos tipos principales: determinísticas (o funcionales) y estadísticas.
Relaciones Determinísticas
Una relación determinística es una conexión exacta y predecible entre una variable predictora (generalmente denotada como x) y una variable de respuesta (y). Si conocemos el valor de x, podemos determinar con total precisión el valor de y.
Un ejemplo clásico es la conversión de temperatura entre grados Celsius (C) y grados Fahrenheit (F). La relación es una fórmula precisa:
F = (9/5)C + 32
Esto significa que si la temperatura es de 10 grados Celsius, sabemos con certeza que son 50 grados Fahrenheit: F = (9/5)(10) + 32 = 50. Esta relación lineal exacta se puede representar gráficamente como una línea recta perfecta, donde cada punto en el eje Celsius tiene un único y exacto punto correspondiente en el eje Fahrenheit.
Otros ejemplos de relaciones determinísticas incluyen:
- La relación entre el diámetro (
d) y la circunferencia de un círculo (C):C = π × d. - La Ley de Hooke, que describe la relación entre el peso aplicado (
X) y la cantidad de estiramiento en un muelle (Y):Y = α + βX. - La Ley de Ohm, que relaciona el voltaje aplicado (
V), la resistencia (r) y la corriente (I):I = V/r. - La Ley de Boyle, que para una temperatura constante, relaciona la presión (
P) y el volumen de gas (V):P = α/V, dondeαes una constante conocida para cada gas.
En todos estos casos, la relación es una ley física o matemática que no deja espacio para la variación aleatoria.
Relaciones Estadísticas
A diferencia de las relaciones determinísticas, las relaciones estadísticas no son exactas. Aunque una variable pueda influir en la otra, siempre habrá cierto grado de variabilidad o ruido que impide una predicción perfecta. Por ejemplo, la relación entre las horas de estudio y la calificación en un examen es estadística. Más horas de estudio suelen llevar a mejores calificaciones, pero no siempre es una relación uno a uno; otros factores como el talento natural, el estado de ánimo o la dificultad del examen también influyen.
Aquí es donde entra en juego la correlación, una medida fundamental en estadística que nos ayuda a cuantificar la fuerza y la dirección de la relación lineal entre dos variables.
¿Qué son los Coeficientes de Correlación?
Los coeficientes de correlación son indicadores numéricos que nos dicen qué tan fuerte y en qué dirección se mueven linealmente dos variables diferentes, x e y. Es una de las métricas más utilizadas para entender las conexiones entre conjuntos de datos. El coeficiente de correlación lineal más común es el de Pearson.

El Coeficiente de Correlación de Pearson (ρ o r)
El coeficiente de correlación de Pearson mide la relación lineal entre dos variables. Su valor posible oscila entre -1.0 y 1.0. Esto significa que nunca puede ser mayor que 1.0 ni menor que -1.0.
- Un coeficiente de 1.0 indica una correlación positiva perfecta. Esto significa que a medida que una variable aumenta, la otra variable aumenta en la misma proporción, y viceversa. Se mueven en perfecta sintonía.
- Un coeficiente de -1.0 indica una correlación negativa perfecta. Esto significa que a medida que una variable aumenta, la otra disminuye en la misma proporción, y viceversa. Se mueven en direcciones opuestas de manera perfectamente predecible.
- Un coeficiente de 0 indica que no hay relación lineal entre las dos variables. Es importante destacar que esto no significa que no haya relación alguna, sino que no existe una relación lineal. Podría existir una relación no lineal fuerte, pero el coeficiente de Pearson no la captaría.
Valores intermedios indican relaciones más o menos fuertes:
- Un valor mayor que cero (por ejemplo, 0.7) indica una relación positiva. Ambas variables tienden a moverse en la misma dirección. Cuanto más cerca esté de +1, más fuerte será la relación lineal positiva.
- Un valor menor que cero (por ejemplo, -0.6) indica una relación negativa. Las variables tienden a moverse en direcciones opuestas. Cuanto más cerca esté de -1, más fuerte será la relación lineal negativa.
¡Advertencia importante! La correlación no implica causalidad. Que dos variables estén correlacionadas no significa que una cause a la otra. Podría haber una tercera variable no observada que influya en ambas, o la correlación podría ser puramente coincidencia. Por ejemplo, el número de piratas en el mundo ha disminuido mientras la temperatura global ha aumentado. Hay una correlación negativa, pero no significa que los piratas causen el cambio climático o viceversa.
Interpretando la Fuerza de la Correlación
Si bien no hay una definición universalmente estricta, generalmente se usan rangos para interpretar la fuerza de una correlación lineal:
| Coeficiente de Correlación (r) | Fuerza de la Relación |
|---|---|
| Entre 0.75 y 1.0 (o -0.75 y -1.0) | Fuerte / Muy Fuerte |
| Entre 0.3 y 0.75 (o -0.3 y -0.75) | Moderada |
| Entre -0.3 y 0.3 | Débil o Nula |
Es crucial recordar que estas son solo pautas. El contexto del estudio y el campo de aplicación pueden influir en lo que se considera una correlación "fuerte" o "débil". En ciencias experimentales, a menudo se repiten estudios para verificar si un alto grado de correlación puede ser reproducido.
¿Cómo se Calcula el Coeficiente de Correlación?
El cálculo del coeficiente de correlación de Pearson implica varias etapas estadísticas, incluyendo la covarianza y las desviaciones estándar de las variables. La fórmula es la siguiente:
r = n(Σxy) - (Σx)(Σy) / √([nΣx² - (Σx)²][nΣy² - (Σy)²])
Donde:
nes el número de pares de datos.Σxyes la suma de los productos de cada par de valoresxey.ΣxyΣyson las sumas de todos los valores dexy dey, respectivamente.Σx²yΣy²son las sumas de los cuadrados de los valores dexy dey, respectivamente.
La desviación estándar es una medida de la dispersión de los datos alrededor de su promedio. La covarianza es una medida de cómo dos variables cambian juntas. Sin embargo, su magnitud no está acotada, lo que dificulta su interpretación. El coeficiente de correlación es la versión normalizada de la covarianza, dividida por el producto de las dos desviaciones estándar, lo que lo convierte en una medida estándar y comparable.
Aunque es posible calcularlo manualmente para conjuntos de datos pequeños, el cálculo puede ser tedioso y propenso a errores. Por esta razón, en la práctica, se utilizan ampliamente software y programas estadísticos para obtener este coeficiente.
Aplicaciones Prácticas de la Correlación
La correlación es una herramienta increíblemente versátil con aplicaciones en una multitud de campos, desde las finanzas hasta la ciencia y la investigación social.
En los Mercados Financieros
En el mundo de la inversión, el coeficiente de correlación es fundamental para medir la relación entre dos valores o activos. Por ejemplo, si dos acciones tienden a moverse en la misma dirección (ambas suben o ambas bajan), su coeficiente de correlación será positivo. Si se mueven en direcciones opuestas (una sube mientras la otra baja), su correlación será negativa.
Correlación Positiva en Finanzas
Un ejemplo de correlación positiva es la relación entre los precios del petróleo y los billetes de avión. Si el coeficiente de correlación es +0.95, sugiere una relación positiva muy fuerte: si el precio del petróleo disminuye, las tarifas aéreas también bajan, y si el precio del petróleo aumenta, también lo hacen los precios de los billetes de avión.
Consideremos el caso de una acción bancaria grande como JPMorgan Chase & Co. (JPM) y un Fondo Cotizado en Bolsa (ETF) que representa al sector financiero en su conjunto (como el Financial Select SPDR ETF, XLF). Es de esperar que JPM tenga una correlación positiva con el sector bancario. Si el coeficiente de correlación es, por ejemplo, +0.34, indica una correlación positiva, aunque débil. Esto significa que, aunque se mueven en la misma dirección, la magnitud de sus movimientos puede variar, como cuando JPM sube un 13% y XLF baja un 2.8% en el mismo período. Comprender la correlación entre una acción y su industria ayuda a los inversores a evaluar cómo se está comportando la acción en relación con sus pares.

Correlación Negativa en Finanzas: Diversificación de Carteras
Una correlación negativa (o inversa) ocurre cuando el coeficiente es menor que 0. Esto es una indicación de que las variables se mueven en direcciones opuestas. Un valor de -1 significa una correlación negativa perfecta. En inversión, una correlación negativa no significa que los valores deban evitarse; de hecho, son muy valiosos para la diversificación de carteras.
Al incluir una combinación de inversiones que tienen una correlación negativa o baja con el mercado de valores general, los inversores pueden protegerse contra la posible pérdida de valor debido a la volatilidad de los precios. En resumen, para reducir el riesgo de volatilidad en una cartera, a veces los opuestos se atraen.
Imagina una cartera equilibrada invertida 60% en acciones y 40% en bonos. En un año de fuerte crecimiento económico, las acciones podrían rendir un 12%, mientras que los bonos podrían tener un retorno negativo del -2% (debido al aumento de las tasas de interés). La rentabilidad global de la cartera sería del 6.4%. Sin embargo, si al año siguiente la economía se desacelera y las tasas de interés bajan, las acciones podrían caer un -5%, pero los bonos podrían rendir un 8%. En este escenario, la cartera equilibrada obtendría un retorno del 0.2%, lo que es mucho menos volátil que una cartera 100% de acciones que vería un -5% en el segundo año.
En Ciencia y Vida Cotidiana
Fuera de las finanzas, la correlación se utiliza para entender fenómenos naturales y sociales. Por ejemplo, un estudio podría encontrar una correlación negativa de -0.96 entre la temperatura exterior y las facturas de calefacción. Esta fuerte correlación negativa significa que a medida que la temperatura exterior disminuye, las facturas de calefacción aumentan, y viceversa. Esto permite a los proveedores de energía y a los consumidores anticipar gastos y tomar decisiones.
Herramientas para Calcular el Coeficiente de Correlación
Como mencionamos, calcular la correlación manualmente es poco práctico para la mayoría de los casos. Afortunadamente, existen herramientas computacionales que lo hacen de forma rápida y precisa.
Cálculo de Correlación en Excel
Microsoft Excel es una de las herramientas más accesibles y utilizadas para calcular la correlación. Ofrece varias maneras de hacerlo:
1. Usando la Función CORREL
La forma más sencilla es usar la función `CORREL`. Simplemente coloque sus dos conjuntos de datos uno al lado del otro en columnas y use la fórmula:
=CORREL(rango_array1, rango_array2)
Por ejemplo, si sus datos de X están en A1:A10 y sus datos de Y están en B1:B10, la fórmula sería `=CORREL(A1:A10,B1:B10)`.
2. Usando la Herramienta de Análisis de Datos
Para analizar la correlación entre múltiples conjuntos de datos o para crear una matriz de correlación, Excel tiene un complemento llamado "Herramientas para análisis" (Data Analysis Toolpak) que debe habilitarse si no lo está:
- Vaya a Archivo > Opciones > Complementos.
- En la sección 'Administrar', seleccione 'Complementos de Excel' y haga clic en 'Ir...'.
- Marque la casilla 'Herramientas para análisis' y haga clic en 'Aceptar'.
Una vez habilitado:
- Vaya a la pestaña 'Datos' en la cinta de opciones.
- En el grupo 'Análisis', haga clic en 'Análisis de datos'.
- Seleccione 'Correlación' de la lista y haga clic en 'Aceptar'.
- En el cuadro de diálogo 'Correlación':
- En 'Rango de entrada', seleccione el rango de todas sus columnas de datos (asegúrese de incluir los encabezados si los tiene).
- Elija 'Agrupado por: Columnas' si sus variables están en columnas separadas.
- Si incluyó los encabezados en el rango de entrada, marque la casilla 'Rótulos en la primera fila'.
- En 'Opciones de salida', elija dónde desea que aparezcan los resultados (por ejemplo, en una nueva hoja de cálculo o en un rango específico de la hoja actual).
- Haga clic en 'Aceptar'.
Excel generará automáticamente una matriz de correlación, mostrando el coeficiente de correlación para cada par de variables seleccionadas.
Cálculo de Correlación en una Calculadora Gráfica (ej. TI-84)
Las calculadoras gráficas, como la TI-84, también pueden calcular el coeficiente de correlación. Los pasos generales son:
Paso 1: Activar Diagnósticos (Solo una vez)
Este paso solo debe realizarse una vez en su calculadora. Si no lo hace, el valor de 'r' (el coeficiente de correlación) no aparecerá cuando ejecute la función de regresión lineal.
- Presione
[2nd]y luego[0]para ingresar al catálogo de su calculadora. - Desplácese hacia abajo hasta que vea "
diagnosticsOn". - Presione
[ENTER]hasta que la pantalla de la calculadora diga "Done".
Recuerde: No tendrá que hacer esto de nuevo a menos que resetee su calculadora.

Paso 2: Ingresar Datos
Ingrese sus datos en la calculadora:
- Presione
[STAT]y luego seleccione1:Edit. - Ingrese todos sus datos de 'x' en la lista
L1y todos sus datos de 'y' en la listaL2.
Paso 3: Calcular
Una vez que haya ingresado sus datos:
- Vaya a
[STAT]y luego al menúCALC(arriba). - Seleccione
4:LinReg(ax+b)y presione[ENTER].
¡Eso es todo! Ahora puede leer el coeficiente de correlación directamente de la pantalla (es 'r'). Recuerde, si 'r' no aparece en su calculadora, es porque los diagnósticos deben activarse. Aquí también encontrará la ecuación de regresión lineal y el coeficiente de determinación (r²).
Correlación vs. Regresión Lineal Simple
Tanto el cálculo del coeficiente de Pearson como la regresión lineal simple son métodos para determinar cómo se relacionan linealmente las variables estadísticas. Sin embargo, difieren en su propósito principal:
- El coeficiente de Pearson es una medida de la fuerza y dirección de la asociación lineal entre dos variables, sin asumir causalidad. Su rango va de +1 a -1.
- La regresión lineal simple describe la relación lineal entre una variable de respuesta (
y) y una variable explicativa (x) utilizando un modelo estadístico. Los modelos de regresión se utilizan principalmente para hacer predicciones de una variable basada en el valor de la otra.
En esencia, la correlación cuantifica la relación, mientras que la regresión la modela para permitir predicciones.
Preguntas Frecuentes (FAQ)
¿Qué es el coeficiente de correlación lineal?
Es un número calculado a partir de datos que mide la fuerza y la dirección de la relación lineal entre dos variables. Indica qué tan bien los puntos de datos se ajustan a una línea recta.
¿Qué significa correlación lineal?
Significa que a medida que una variable cambia, la otra variable tiende a cambiar de manera proporcional en una dirección constante. Un coeficiente de +1 indica que ambas variables aumentan o disminuyen juntas de forma perfecta. Un coeficiente de -1 indica que a medida que una aumenta, la otra disminuye de forma perfecta.
¿Qué se considera una correlación fuerte?
Generalmente, cuanto más cerca esté un coeficiente de correlación de 1.0 (o -1.0), más fuerte se considera la relación entre las dos variables. Un coeficiente por encima de 0.75 (o por debajo de -0.75) suele indicar un alto grado de correlación, mientras que uno entre -0.3 y 0.3 es signo de una correlación débil o nula.
¿La correlación implica causalidad?
No, enfáticamente no. La correlación solo indica una asociación o patrón de movimiento conjunto entre variables. No prueba que una variable cause el cambio en la otra. Podría haber otros factores influyentes o la relación podría ser puramente coincidente.
¿Pueden dos variables tener una relación fuerte pero una correlación débil?
Sí, si la relación entre las variables no es lineal. Por ejemplo, una relación en forma de U o curva podría ser muy fuerte, pero el coeficiente de correlación de Pearson (que solo mide relaciones lineales) podría ser cercano a cero. Esto resalta la importancia de visualizar los datos (por ejemplo, con un diagrama de dispersión) antes de interpretar solo el coeficiente.
En Conclusión
El coeficiente de correlación lineal es una herramienta estadística indispensable para comprender la relación entre diferentes conjuntos de datos. Ya sea para predecir movimientos en el mercado de valores, evaluar el comportamiento de fondos de inversión, o simplemente para entender mejor los fenómenos que nos rodean, la capacidad de cuantificar y interpretar la correlación es una habilidad valiosa. Aunque su cálculo manual puede ser complejo, las calculadoras y el software moderno han simplificado enormemente el proceso, permitiéndonos transformar datos brutos en información significativa y accionable. Al dominar este concepto, damos un paso importante hacia un análisis de datos más profundo y decisiones más informadas.
Si quieres conocer otros artículos parecidos a Desentrañando la Correlación: Guía Completa puedes visitar la categoría Estadística.
