04/05/2023
En el vasto universo de la estadística, a menudo nos encontramos con la necesidad de representar un conjunto de datos complejos mediante un valor único que, de alguna manera, capture la esencia de toda la colección. Este valor representativo es lo que conocemos como medida de tendencia central, y su nombre sugiere precisamente eso: es un valor alrededor del cual los datos tienden a agruparse. Las principales medidas de tendencia central que nos permiten hacer esto son la media, la mediana y la moda.

Piensa en tu vida cotidiana: ¿alguna vez te has preguntado cómo se calcula la tasa de carreras en un partido de críquet o qué significa el porcentaje agregado en tus resultados de examen? Todos estos conceptos, aunque parezcan sencillos, se basan en principios estadísticos que facilitan la representación de grandes colecciones de datos en términos de un valor único. La estadística, en su esencia, se ocupa de la recolección y el análisis de información con un propósito específico.
La representación de estos datos puede hacerse de múltiples maneras, como tablas, gráficos de barras, gráficos circulares, representaciones pictóricas, entre otros. Sin embargo, para obtener una comprensión rápida y concisa, las medidas de tendencia central son herramientas invaluables. Imagina un partido de un día (ODI) de 50 overs entre India y Australia, donde India anota 370 carreras. ¿Cómo decides si es una buena puntuación? Simple, calculas la tasa de carreras promedio. Es aquí donde entran en juego los conceptos de media, mediana y moda, permitiéndonos resumir y comprender mejor la información.
¿Qué son las Medidas de Tendencia Central?
Las medidas de tendencia central son parámetros que nos ayudan a encontrar el centro de un conjunto de datos. Aunque existen varias, las más comunes y ampliamente utilizadas son la media, la mediana y la moda. Cada una ofrece una perspectiva diferente sobre el 'centro' de los datos y es útil en distintas situaciones.
La Media: El Promedio que Todos Conocemos
La media es, sin duda, la medida de tendencia central más utilizada y familiar para la mayoría. Representa el promedio aritmético de un conjunto de datos. Es aplicable tanto para datos continuos como discretos. Su cálculo es sencillo: es igual a la suma de todos los valores en la colección de datos dividida por el número total de valores.
Fórmula de la Media para Datos No Agrupados:
Si tenemos ‘n’ valores en un conjunto de datos, denotados como x₁, x₂, x₃, …, xₙ, la media (simbolizada como x̄) se calcula de la siguiente manera:
x̄ = (x₁ + x₂ + x₃ + … + xₙ) / n
También puede expresarse de forma más compacta utilizando la notación de sumatoria:
x̄ = (Σxᵢ) / n
Donde Σxᵢ representa la suma de todos los valores desde i=1 hasta n.
Para datos agrupados, el cálculo de la media se vuelve un poco más complejo, ya que los datos se presentan en intervalos de clase junto con sus frecuencias. Existen tres métodos principales para calcular la media en este caso:
| Método | Fórmula de la Media | Descripción de Términos |
|---|---|---|
| Método Directo | x̄ = (Σfᵢxᵢ) / (Σfᵢ) | Σfᵢ = Suma de todas las frecuencias xᵢ = Punto medio de cada clase fᵢ = Frecuencia de cada clase |
| Método de la Media Asumida | x̄ = a + (Σfᵢdᵢ) / (Σfᵢ) | a = Media asumida (punto medio de una clase central) dᵢ = xᵢ – a (desviación de cada punto medio respecto a la media asumida) |
| Método de Desviación Escalonada | x̄ = a + h * (Σfᵢuᵢ) / (Σfᵢ) | a = Media asumida h = Tamaño de la clase (ancho del intervalo) uᵢ = (xᵢ – a) / h (desviación escalonada) |
La Mediana: El Valor Central que Organiza los Datos
La mediana representa el valor central de un conjunto de datos una vez que estos han sido ordenados de forma ascendente o descendente. Es una medida de tendencia central robusta, ya que no se ve afectada por valores extremos (outliers), a diferencia de la media.
Fórmula de la Mediana para Datos No Agrupados:
Para calcular la mediana, el primer paso crucial es organizar la colección de datos en orden ascendente o descendente. Luego, se aplica el siguiente método:
- Si el número de valores (n) en los datos es IMPAR:
La mediana es la observación en la posición[(n+1)/2]. - Si el número de valores (n) en los datos es PAR:
La mediana es el promedio de las observaciones en las posiciones(n/2)y[(n/2) + 1].
Fórmula de la Mediana para Datos Agrupados:
Para datos agrupados, la mediana se calcula utilizando la siguiente fórmula:
Mediana = l + [((N/2) - cf) / f] * h
Donde:
l= Límite inferior de la clase mediana (la clase que contiene la mediana).N= Suma total de frecuencias (número total de observaciones).cf= Frecuencia acumulada de la clase anterior a la clase mediana.f= Frecuencia de la clase mediana.h= Tamaño de la clase (ancho del intervalo de la clase mediana).
La Moda: El Dato Más Frecuente que Destaca
La moda es el valor que aparece con mayor frecuencia en un conjunto de datos. Es la medida de tendencia central más simple de entender y, a menudo, la más fácil de identificar. Un conjunto de datos puede tener una moda (unimodal), varias modas (multimodal) o ninguna moda si todos los valores aparecen con la misma frecuencia.
Consideremos el siguiente conjunto de datos que representa las calificaciones obtenidas por diferentes estudiantes en una asignatura:
| Nombre | Calificación Obtenida (sobre 100) |
|---|---|
| Anmol | 73 |
| Kushagra | 80 |
| Garima | 73 |
| Ashwini | 70 |
| Geetika | 73 |
| Shakshi | 65 |
Observando las calificaciones, el valor que se repite con mayor frecuencia es 73 (aparece tres veces). Por lo tanto, la moda de esta colección de datos es 73.
Fórmula de la Moda para Datos Agrupados:
Para datos agrupados, la moda se calcula utilizando la siguiente fórmula:
Moda = l + [(f₁ - f₀) / (2f₁ - f₀ - f₂)] * h
Donde:
l= Límite inferior de la clase modal (la clase con la frecuencia más alta).f₁= Frecuencia de la clase modal.f₀= Frecuencia de la clase que precede a la clase modal.f₂= Frecuencia de la clase que sigue a la clase modal.h= Tamaño de la clase (ancho del intervalo de la clase modal).
Relación entre Media, Mediana y Moda: La Fórmula Empírica
Existe una relación empírica entre la media, la mediana y la moda que es particularmente útil para distribuciones moderadamente asimétricas (sesgadas). Esta relación permite estimar una de las medidas si las otras dos son conocidas:
Moda ≈ 3 * Mediana - 2 * Media
Esta fórmula es una aproximación y es muy valiosa en situaciones donde calcular una de las medidas directamente podría ser complicado, pero las otras dos son fácilmente accesibles. Se conoce como la relación empírica de Karl Pearson.
El Rango: Una Medida de Dispersión Complementaria
Aunque no es una medida de tendencia central, el rango es una medida de dispersión fundamental que a menudo se estudia junto con la media, mediana y moda. Proporciona una idea de la amplitud o variabilidad de un conjunto de datos.
El rango se define como la diferencia entre el valor más alto y el valor más bajo en un conjunto de datos.
Fórmula del Rango:
Rango = Valor Más Alto - Valor Más Bajo
Esta medida nos da una idea rápida de la extensión de los datos, es decir, cuán dispersos están.
Ejemplos Prácticos y Resueltos
Para solidificar la comprensión de estos conceptos, veamos algunos ejemplos prácticos.
Ejemplo 1: Puntuaciones de Jugadores
La siguiente tabla muestra las puntuaciones obtenidas por diferentes jugadores en un partido. ¿Cuál es la media, mediana y moda de los datos?
| S.No | Nombre | Carreras Anotadas |
|---|---|---|
| 1 | Sachin | 80 |
| 2 | Yuvraj | 52 |
| 3 | Virat | 40 |
| 4 | Sehwag | 52 |
| 5 | Rohit | 70 |
| 6 | Harbhajan | 1 |
| 7 | Dhoni | 6 |
Solución:
i) La Media:
Suma de las carreras = 80 + 52 + 40 + 52 + 70 + 1 + 6 = 301
Número total de jugadores = 7
Media (x̄) = Suma de carreras / Número de jugadores = 301 / 7 = 43
La media de los datos es 43.
ii) La Mediana:
Primero, ordenamos los datos en orden ascendente:
| Nombre | Carreras Anotadas |
|---|---|
| Harbhajan | 1 |
| Dhoni | 6 |
| Virat | 40 |
| Yuvraj | 52 |
| Sehwag | 52 |
| Rohit | 70 |
| Sachin | 80 |
El número de elementos en los datos es n = 7 (impar).
Mediana = [(n+1)/2]-ésima observación = [(7+1)/2]-ésima observación = 4ª observación
La 4ª observación en la lista ordenada es 52.
Por lo tanto, la mediana es 52.
iii) La Moda:
La moda es el dato que aparece con mayor frecuencia. En este conjunto de datos, el número 52 aparece dos veces, más que cualquier otro valor.
Por lo tanto, la moda es 52.
Ejemplo 2: Conjunto de Datos Numéricos
Encuentra la media, mediana, moda y rango para los siguientes datos:
90, 94, 53, 68, 79, 94, 53, 65, 87, 90, 70, 69, 65, 89, 85, 53, 47, 61, 27, 80
Solución:
Número de observaciones (n) = 20
Media:
Suma de las observaciones = 90 + 94 + 53 + 68 + 79 + 94 + 53 + 65 + 87 + 90 + 70 + 69 + 65 + 89 + 85 + 53 + 47 + 61 + 27 + 80 = 1419
Media = Suma de observaciones / Número de observaciones = 1419 / 20 = 70.95
La media es 70.95.
Mediana:
Ordenamos las observaciones en orden ascendente:
27, 47, 53, 53, 53, 61, 65, 65, 68, 69, 70, 79, 80, 85, 87, 89, 90, 90, 94, 94
Aquí, n = 20 (par).
Mediana = 1/2 * [(n/2)-ésima observación + ((n/2) + 1)-ésima observación]Mediana = 1/2 * [10ª observación + 11ª observación]Mediana = 1/2 * (69 + 70) = 1/2 * (139) = 69.5
La mediana es 69.5.
Moda:
El valor que se repite con mayor frecuencia en los datos es 53 (aparece 3 veces).
Por lo tanto, la moda es 53.
Rango:
Valor más alto = 94
Valor más bajo = 27
Rango = Valor Más Alto - Valor Más Bajo = 94 - 27 = 67
Preguntas Frecuentes (FAQ)
¿Cuándo se debe usar la media, la mediana o la moda?
- La media es ideal para datos que tienen una distribución simétrica y no presentan valores extremos. Es sensible a cada valor en el conjunto de datos.
- La mediana es la mejor opción para datos sesgados o cuando hay valores atípicos (outliers), ya que no se ve afectada por ellos. Proporciona el valor central 'real' en un conjunto ordenado.
- La moda es útil para datos categóricos o nominales, donde no se pueden calcular promedios. También es relevante cuando se quiere saber qué valor es el más común.
¿Puede un conjunto de datos tener más de una moda?
Sí, un conjunto de datos puede tener más de una moda. Si dos valores tienen la misma frecuencia más alta, el conjunto de datos es bimodal. Si tiene más de dos, es multimodal. Si todos los valores aparecen con la misma frecuencia, el conjunto de datos no tiene moda.
¿La mediana siempre es un valor del conjunto de datos original?
No necesariamente. Si el número de observaciones es impar, la mediana será uno de los valores originales. Sin embargo, si el número de observaciones es par, la mediana se calcula como el promedio de los dos valores centrales, y este promedio podría no ser un valor presente en el conjunto de datos original.
¿Qué significa el término 'datos agrupados'?
Los datos agrupados son datos que se han organizado en clases o intervalos, junto con sus frecuencias correspondientes. En lugar de tener cada observación individual, se tiene un resumen de cuántas observaciones caen dentro de ciertos rangos. Esto es común cuando se trabaja con grandes volúmenes de datos.
Conclusión
La media, la mediana y la moda son pilares fundamentales en la estadística descriptiva. Cada una ofrece una forma única de resumir y comprender el 'centro' de un conjunto de datos, y su correcta aplicación depende de la naturaleza de los datos y el objetivo del análisis. Comprender sus fórmulas y cuándo aplicar cada una te equipará con herramientas esenciales para interpretar la información de manera más efectiva, transformando números crudos en conocimientos significativos. Dominar estas medidas es un paso crucial para cualquier persona que busque dar sentido al mundo lleno de datos que nos rodea.
Si quieres conocer otros artículos parecidos a ¿Media, Mediana y Moda? ¡Descubre sus Fórmulas! puedes visitar la categoría Estadística.
