10/02/2025
En el vasto universo de las matemáticas y la estadística, entender cómo se comportan los datos es fundamental para tomar decisiones informadas, validar teorías o incluso predecir el futuro. Una de las herramientas más poderosas en este arsenal es el concepto de frecuencia esperada. Pero, ¿qué significa exactamente y cómo la calculamos? Acompáñanos en este recorrido detallado donde desglosaremos su significado, su cálculo en diferentes contextos y su vital importancia en el análisis de datos, desde la comprobación de la justicia de un dado hasta la comprensión de la evolución genética.

Frecuencias Observadas vs. Frecuencias Esperadas
Antes de sumergirnos en el cálculo, es crucial entender la distinción entre dos conceptos íntimamente relacionados: las frecuencias observadas y las frecuencias esperadas.
- Frecuencias Observadas (O): Son los recuentos reales que obtenemos de un experimento o una muestra. Representan lo que realmente sucedió o lo que se ha medido en la realidad. Por ejemplo, si lanzas un dado 100 veces, la frecuencia observada de que salga un '6' sería el número de veces que realmente obtuviste un '6'.
- Frecuencias Esperadas (E): Son los recuentos que esperaríamos obtener si una hipótesis o modelo teórico fuera cierto. Se basan en la probabilidad teórica de un evento. Siguiendo el ejemplo del dado, si el dado es "justo", esperaríamos que cada número (del 1 al 6) aparezca una cantidad similar de veces.
La comparación entre estas dos frecuencias es la base de muchas pruebas estadísticas, permitiéndonos determinar si lo que observamos se alinea con lo que teóricamente deberíamos esperar. Esta discrepancia es la que a menudo nos lleva a aceptar o rechazar una hipótesis nula.
Consideremos esta analogía simple para ilustrar la diferencia:
| Característica | Frecuencia Observada (O) | Frecuencia Esperada (E) |
|---|---|---|
| Origen | Datos reales de un experimento o muestra. | Calculada a partir de un modelo teórico o una hipótesis. |
| Representa | Lo que realmente sucedió. | Lo que debería suceder bajo ciertas condiciones ideales. |
| Naturaleza | Siempre números enteros (recuentos). | Pueden ser números decimales (promedios teóricos). |
| Propósito | Punto de partida para el análisis. | Punto de referencia para comparar y probar hipótesis. |
El Cálculo de Frecuencias Esperadas en Estadística: La Prueba Chi-Cuadrado
Uno de los usos más comunes de las frecuencias esperadas es en la prueba Chi-cuadrado (χ²), específicamente en la prueba de bondad de ajuste o en las pruebas de independencia. Esta prueba nos ayuda a determinar si una distribución observada difiere significativamente de una distribución esperada.
La Lógica Detrás de la Frecuencia Esperada
La idea central es simple: si tenemos una idea de cómo se distribuyen los eventos en una población o bajo ciertas condiciones ideales, podemos predecir cuántas veces esperaríamos ver cada resultado en una muestra de un tamaño determinado. Por ejemplo, si creemos que una moneda es justa, esperaríamos que en 100 lanzamientos, 50 sean caras y 50 sean cruces. Esas 50 caras y 50 cruces serían nuestras frecuencias esperadas.
La Fórmula Fundamental
Para calcular la frecuencia esperada (E) de una categoría específica en un conjunto de datos, utilizamos una fórmula sencilla pero poderosa:
E = n * p
- n: Representa el tamaño total de la muestra o el número total de ensayos. Es el número total de observaciones.
- p: Es la probabilidad teórica o hipotética de que un evento ocurra en esa categoría específica. Esta probabilidad se deriva de la hipótesis nula o del modelo que estamos probando.
Esta fórmula se aplica a cada categoría o celda individual para la que deseamos calcular la frecuencia esperada.
Ejemplo Práctico: ¿Es Justo un Dado?
Imaginemos que tenemos un dado y sospechamos que no es justo. Para probarlo, lo lanzamos 500 veces y registramos cuántas veces cae cada número. Los resultados observados son los siguientes:
| Valor del Dado | 1 | 2 | 3 | 4 | 5 | 6 | Total |
|---|---|---|---|---|---|---|---|
| Frecuencia Observada (O) | 78 | 87 | 87 | 76 | 85 | 87 | 500 |
1. Estableciendo Hipótesis
Nuestra hipótesis nula (Ho) es que el dado es justo, lo que significa que cada cara tiene la misma probabilidad de aparecer. La hipótesis alternativa (HA) es que el dado no es justo.
2. Determinando la Probabilidad (p)
Si el dado es justo, cada una de las 6 caras tiene la misma probabilidad de salir. Por lo tanto, la probabilidad de obtener cualquier número (1, 2, 3, 4, 5 o 6) es de 1/6.
p = 1/6 ≈ 0.1667
3. Calculando la Frecuencia Esperada (E)
Ahora, usamos la fórmula E = n * p para cada categoría. El tamaño total de nuestra muestra (n) es 500 lanzamientos.

- Frecuencia Esperada para el valor 1:
E = 500 * (1/6) ≈ 83.33 - Frecuencia Esperada para el valor 2:
E = 500 * (1/6) ≈ 83.33 - Frecuencia Esperada para el valor 3:
E = 500 * (1/6) ≈ 83.33 - Frecuencia Esperada para el valor 4:
E = 500 * (1/6) ≈ 83.33 - Frecuencia Esperada para el valor 5:
E = 500 * (1/6) ≈ 83.33 - Frecuencia Esperada para el valor 6:
E = 500 * (1/6) ≈ 83.33
Como se puede ver, si el dado fuera perfectamente justo, esperaríamos que cada número apareciera aproximadamente 83.33 veces. Es importante notar que las frecuencias esperadas no tienen por qué ser números enteros, ya que representan un promedio teórico.
4. Comparando Observado y Esperado: El Camino a la Prueba Chi-Cuadrado
Una vez que tenemos las frecuencias observadas y esperadas, podemos usarlas para calcular el estadístico de prueba Chi-cuadrado. La fórmula es:
χ² = ∑ (O - E)² / E
Donde ∑ indica la suma de estos valores para todas las categorías. Un valor de χ² alto sugiere una gran diferencia entre lo observado y lo esperado, lo que podría llevarnos a rechazar la hipótesis nula de que el dado es justo. Para nuestro ejemplo, la tabla de cálculo sería:
| Valor del Dado | Observado (O) | Esperado (E) | O - E | (O - E)² | (O - E)² / E |
|---|---|---|---|---|---|
| 1 | 78 | 83.33 | -5.33 | 28.4089 | 0.3409 |
| 2 | 87 | 83.33 | 3.67 | 13.4689 | 0.1616 |
| 3 | 87 | 83.33 | 3.67 | 13.4689 | 0.1616 |
| 4 | 76 | 83.33 | -7.33 | 53.7289 | 0.6448 |
| 5 | 85 | 83.33 | 1.67 | 2.7889 | 0.0335 |
| 6 | 87 | 83.33 | 3.67 | 13.4689 | 0.1616 |
| Total | 500 | 500 | χ² ≈ 1.5041 |
Este valor de χ² de aproximadamente 1.5041 se compararía con un valor crítico de la distribución Chi-cuadrado para determinar si las diferencias son estadísticamente significativas.
Frecuencias Esperadas en Genética: El Principio de Hardy-Weinberg
Las frecuencias esperadas no solo se aplican en experimentos de dados. También son fundamentales en campos como la genética de poblaciones. El Principio de Hardy-Weinberg es un pilar en este campo y nos permite predecir las frecuencias genotípicas esperadas en una población que no está evolucionando.
Comprendiendo el Equilibrio de Hardy-Weinberg
En 1908, Godfrey H. Hardy y Wilhelm Weinberg formularon de forma independiente este principio. Establece que, en una población grande que se reproduce aleatoriamente, las frecuencias alélicas y genotípicas permanecerán constantes de generación en generación, siempre que no haya mutación, migración de genes, selección natural, deriva genética o apareamiento no aleatorio. Es un modelo ideal que proporciona un punto de referencia para medir los cambios evolutivos en una población.
La Ecuación Clave
El principio se expresa matemáticamente con la ecuación:
p² + 2pq + q² = 1
Donde:
- p: Representa la frecuencia del alelo dominante en la población.
- q: Representa la frecuencia del alelo recesivo en la población.
Es importante destacar que p + q = 1, lo que significa que la suma de las frecuencias de todos los alelos de un gen en la población es igual a 1 (o 100%).
A partir de estas frecuencias alélicas, podemos predecir las frecuencias esperadas de los genotipos en la siguiente generación:
- p²: Frecuencia esperada del genotipo homocigoto dominante.
- 2pq: Frecuencia esperada del genotipo heterocigoto.
- q²: Frecuencia esperada del genotipo homocigoto recesivo.
Ejemplo Práctico: Grupos Sanguíneos MN
Consideremos el sistema de grupo sanguíneo MN en humanos, que está determinado por dos alelos: M y N. Supongamos que tomamos una muestra de 5000 individuos y observamos las siguientes frecuencias de genotipos:
1. Frecuencias Observadas de Genotipos
- 1460 individuos de genotipo MM
- 2550 individuos de genotipo MN
- 990 individuos de genotipo NN
Convertimos estos recuentos a frecuencias observadas:
- Frecuencia de MM (O): 1460 / 5000 = 0.292
- Frecuencia de MN (O): 2550 / 5000 = 0.510
- Frecuencia de NN (O): 990 / 5000 = 0.198
2. Calculando Frecuencias Alélicas (p y q)
A partir de las frecuencias observadas de los genotipos, podemos calcular las frecuencias de los alelos M (p) y N (q):
- Frecuencia de M (p) = (Frecuencia de MM) + 0.5 * (Frecuencia de MN)
p = 0.292 + (0.5 * 0.510) = 0.292 + 0.255 = 0.547- Frecuencia de N (q) = 1 - p
q = 1 - 0.547 = 0.453
Verificamos que p + q = 0.547 + 0.453 = 1.000.
3. Determinando las Frecuencias Esperadas de Genotipos
Ahora, usamos p y q para calcular las frecuencias genotípicas que esperaríamos si la población estuviera en equilibrio de Hardy-Weinberg:
- Frecuencia Esperada de MM (E) =
p² = (0.547)² ≈ 0.2992 - Frecuencia Esperada de MN (E) =
2pq = 2 * 0.547 * 0.453 ≈ 0.4955 - Frecuencia Esperada de NN (E) =
q² = (0.453)² ≈ 0.2052
Verificamos que la suma de las frecuencias esperadas sea aproximadamente 1: 0.2992 + 0.4955 + 0.2052 ≈ 1.000.
4. Convirtiendo a Número de Individuos Esperados
Finalmente, para comparar directamente con los recuentos observados, multiplicamos las frecuencias esperadas por el tamaño total de la muestra (5000 individuos):
- Individuos MM Esperados (E):
0.2992 * 5000 ≈ 1496 - Individuos MN Esperados (E):
0.4955 * 5000 ≈ 2478 - Individuos NN Esperados (E):
0.2052 * 5000 ≈ 1026
Ahora podemos comparar nuestras frecuencias observadas con las esperadas:
| Genotipo | Observado (# Individuos) | Esperado (# Individuos) |
|---|---|---|
| MM | 1460 | 1496 |
| MN | 2550 | 2478 |
| NN | 990 | 1026 |
5. Aplicación: Prueba de Equilibrio
Similar al ejemplo del dado, la diferencia entre los valores observados y esperados se puede cuantificar utilizando la prueba Chi-cuadrado para determinar si la población está en equilibrio de Hardy-Weinberg. Si las diferencias son pequeñas, la población está en equilibrio; si son grandes, sugiere que algún factor evolutivo (mutación, selección, etc.) está actuando sobre la población.

Importancia y Aplicaciones de las Frecuencias Esperadas
El concepto de frecuencia esperada es mucho más que un simple cálculo matemático; es una herramienta analítica indispensable en diversas disciplinas. Su importancia radica en su capacidad para proporcionar un punto de referencia objetivo y cuantificable para el análisis de la realidad.
- Pruebas de Hipótesis: Como hemos visto, las frecuencias esperadas son el pilar de pruebas estadísticas como la Chi-cuadrado. Permiten a los investigadores determinar si las diferencias observadas entre grupos o categorías son significativas o simplemente el resultado del azar.
- Validación de Modelos: Al comparar lo observado con lo esperado, podemos evaluar la validez de modelos teóricos o predicciones. Si los datos observados se desvían drásticamente de lo esperado, el modelo podría necesitar ajustes o revisión.
- Control de Calidad: En la industria, las frecuencias esperadas pueden usarse para monitorear procesos. Por ejemplo, si se espera un cierto porcentaje de productos defectuosos, cualquier desviación significativa de esta expectativa podría indicar un problema en la línea de producción.
- Investigación Científica: En campos como la biología, la sociología o la psicología, las frecuencias esperadas ayudan a los científicos a entender si ciertos fenómenos (distribución de enfermedades, patrones de comportamiento, etc.) se ajustan a lo que sería aleatorio o si hay factores subyacentes que los influencian.
- Planificación y Predicción: Aunque las frecuencias esperadas se basan en la probabilidad teórica, pueden informar la planificación. Por ejemplo, un minorista podría usar las frecuencias esperadas de compra de un producto para planificar el inventario.
En esencia, las frecuencias esperadas nos permiten ir más allá de la mera observación y adentrarnos en la comprensión de las fuerzas que moldean los datos que recopilamos.
Preguntas Frecuentes (FAQ)
¿Cuál es la diferencia entre frecuencia observada y esperada?
La frecuencia observada es el recuento real de cuántas veces ocurrió un evento en un experimento o muestra. Es lo que "ves" en tus datos. La frecuencia esperada, por otro lado, es el recuento que "debería" haber ocurrido si una hipótesis o modelo teórico específico (basado en la probabilidad) fuera cierto. Es una predicción de lo que se esperaría bajo condiciones ideales o una hipótesis nula.
¿Cuándo se utilizan las frecuencias esperadas?
Las frecuencias esperadas se utilizan principalmente en pruebas de hipótesis estadísticas, como la prueba Chi-cuadrado de bondad de ajuste o la prueba Chi-cuadrado de independencia. Son esenciales cuando queremos comparar una distribución de datos observada con una distribución teórica o con lo que se esperaría bajo ciertas suposiciones (como la independencia entre variables o una distribución uniforme).
¿Las frecuencias esperadas siempre deben ser números enteros?
No, las frecuencias esperadas no siempre son números enteros y, de hecho, a menudo son decimales. Esto se debe a que se calculan multiplicando un tamaño de muestra total por una probabilidad, que puede ser una fracción. Representan un promedio teórico o una proporción ideal, no un recuento de individuos u objetos que deben ser indivisibles. Las frecuencias observadas, en cambio, siempre serán números enteros, ya que son recuentos reales de eventos.
¿Qué significa si las frecuencias observadas y esperadas son muy diferentes?
Si las frecuencias observadas y esperadas son muy diferentes, esto sugiere que la hipótesis o el modelo teórico que se utilizó para calcular las frecuencias esperadas podría no ser una buena descripción de la realidad. En el contexto de una prueba de hipótesis, una diferencia grande (reflejada en un valor alto del estadístico de prueba, como Chi-cuadrado) podría llevar a rechazar la hipótesis nula. Esto implica que las desviaciones observadas probablemente no se deban al azar, sino a un factor subyacente o a que la población no se comporta como se esperaba teóricamente.
Conclusión
Las frecuencias esperadas son una herramienta conceptual y computacional de inmensa utilidad en el análisis de datos. Nos permiten ir más allá de la simple observación para evaluar si los patrones que detectamos en el mundo real son consistentes con nuestras suposiciones teóricas o si, por el contrario, señalan la existencia de fuerzas o factores inesperados. Dominar el cálculo y la interpretación de las frecuencias esperadas es, por tanto, un paso crucial para cualquiera que desee extraer conclusiones significativas y robustas a partir de los datos que le rodean, abriendo la puerta a una comprensión más profunda de la probabilidad y la estadística en acción.
Si quieres conocer otros artículos parecidos a Descifrando las Frecuencias Esperadas: Guía Completa puedes visitar la categoría Estadística.
