¿Qué es y para qué sirve la media?

Mediana en Datos Agrupados y Tablas de Frecuencia

14/05/2025

Valoración: 4.27 (6732 votos)

Cuando nos enfrentamos a grandes volúmenes de información, como la edad de miles de empleados en una empresa o el gasto mensual de miles de hogares, el cálculo de parámetros estadísticos se vuelve una tarea compleja si se aborda dato por dato. Imagina tener que sumar 231 veces el mismo sueldo de 950 euros; es mucho más eficiente multiplicarlo por 231. Es precisamente por esta razón que, para manejar grandes conjuntos de datos de manera eficiente, los cálculos de los parámetros de centralidad, como la mediana, se realizan a menudo a través de tablas de frecuencia o cuando los datos están agrupados en intervalos.

¿Cuál es la fórmula del NDWI?
NDWI = (NIR \u2013 SWIR) / (NIR + SWIR) El agua pura no refleja el infrarrojo cercano (NIR) ni el infrarrojo de superficie (SWIR). La fórmula del NDWI fue modificada por Xu (2005).

Ya dominas el cálculo de la media, pero ¿qué ocurre cuando los datos no se distribuyen de forma simétrica o cuando existen valores extremos (outliers) que podrían distorsionar el promedio? Aquí es donde la mediana se revela como una medida de centralidad extraordinariamente útil y robusta.

Índice de Contenido

¿Qué es la Mediana?

La mediana es el valor central en un conjunto de datos ordenados. Es decir, el valor que divide la distribución en dos partes iguales, dejando el 50% de los datos por debajo de él y el 50% por encima. A diferencia de la media, la mediana es menos sensible a los valores extremos, lo que la convierte en una medida de tendencia central preferida en distribuciones asimétricas o cuando hay datos atípicos.

Cálculo de la Mediana en Datos No Agrupados

Antes de sumergirnos en las tablas de frecuencia, recordemos cómo se calcula la mediana para datos individuales, no agrupados. Este es el punto de partida fundamental:

  1. Ordenar los datos: Es el paso más crucial. Los datos deben estar ordenados de menor a mayor (o de mayor a menor).
  2. Identificar la posición central:
    • Si el número de datos (N) es impar, la mediana es el valor que se encuentra exactamente en la posición (N+1)/2.
    • Si el número de datos (N) es par, la mediana es el promedio de los dos valores centrales, ubicados en las posiciones N/2 y (N/2)+1.

Ejemplo simple:

Consideremos las calificaciones de 7 estudiantes: 5, 8, 3, 9, 6, 7, 4.

  1. Ordenamos los datos: 3, 4, 5, 6, 7, 8, 9.
  2. N = 7 (impar). La posición de la mediana es (7+1)/2 = 4.
  3. El valor en la cuarta posición es 6. Por lo tanto, la mediana es 6.

Ahora, si tuviéramos 8 estudiantes: 3, 4, 5, 6, 7, 8, 9, 10.

  1. N = 8 (par). Las posiciones centrales son N/2 = 4 y (N/2)+1 = 5.
  2. Los valores en estas posiciones son 6 y 7.
  3. La mediana es el promedio de 6 y 7: (6+7)/2 = 6.5.

Cálculo de la Mediana en Tablas de Frecuencia (Datos Discretos)

Cuando los datos se repiten muchas veces, como el ejemplo de los sueldos que cobraban 950 euros, es más eficiente organizarlos en una tabla de frecuencia. Para calcular la mediana en este escenario, necesitamos una columna adicional: la frecuencia acumulada.

¿Qué es la Frecuencia Acumulada (Fa)?

La frecuencia acumulada de un valor es la suma de su frecuencia absoluta y las frecuencias absolutas de todos los valores anteriores. Nos ayuda a localizar rápidamente la posición de los datos.

Pasos para calcular la mediana en una tabla de frecuencias:

  1. Organizar los datos en una tabla de frecuencias: Asegúrate de tener la variable (xᵢ), la frecuencia absoluta (fᵢ) y la frecuencia acumulada (Fᵢ).
  2. Calcular el número total de datos (N): Es la suma de todas las frecuencias absolutas (∑fᵢ).
  3. Determinar la posición de la mediana: Calcula N/2.
  4. Localizar la mediana: En la columna de frecuencia acumulada (Fᵢ), encuentra la primera frecuencia acumulada que sea igual o mayor que N/2. El valor de la variable (xᵢ) correspondiente a esa frecuencia acumulada es la mediana.

Ejemplo: Número de hijos por familia en un vecindario

Supongamos que tenemos los siguientes datos:

Número de Hijos (xᵢ)Frecuencia (fᵢ)Frecuencia Acumulada (Fᵢ)
055
11217
21835
31045
4550

Cálculo:

  1. N = 50 (suma de fᵢ).
  2. Posición de la mediana = N/2 = 50/2 = 25.
  3. Buscamos en la columna de Fᵢ el primer valor igual o mayor que 25.
    • Fᵢ para 0 hijos es 5.
    • Fᵢ para 1 hijo es 17.
    • Fᵢ para 2 hijos es 35.

    El primer valor igual o mayor que 25 es 35.

  4. El valor de xᵢ correspondiente a Fᵢ = 35 es 2.

Por lo tanto, la mediana del número de hijos por familia es 2.

¿Cómo se calcula la media, mediana y moda en datos no agrupados?
Para calcular la media solo tienes que sumar todos los datos y dividirlos por la cantidad de datos que tengas. Para la mediana, ordena los datos de menor a mayor o viceversa y elige justo el número que se encuentre en la mitad de todos. Para la moda, descubre el dato que más se repite.

Cálculo de la Mediana en Datos Agrupados (Intervalos de Clase)

El desafío aumenta cuando los datos están agrupados en intervalos de clase, como rangos de edad o ingresos. Aquí, no conocemos los valores exactos, solo su rango. Para estos casos, utilizamos una fórmula específica que nos permite estimar la mediana.

Fórmula de la Mediana para Datos Agrupados:

La fórmula para calcular la mediana en datos agrupados es:

Me = Lᵢ + [(N/2 - Fₐ) / fᵢ] * A

Donde:

  • Me: Mediana.
  • Lᵢ: Límite inferior de la clase mediana (el intervalo donde se encuentra la mediana).
  • N: Número total de datos (suma de todas las frecuencias absolutas).
  • Fₐ: Frecuencia acumulada de la clase inmediatamente anterior a la clase mediana.
  • fᵢ: Frecuencia absoluta de la clase mediana.
  • A: Amplitud o ancho del intervalo de la clase mediana (límite superior - límite inferior).

Pasos para calcular la mediana en datos agrupados:

  1. Construir la tabla de distribución de frecuencias: Asegúrate de que incluya los intervalos de clase, la frecuencia absoluta (fᵢ) para cada clase y la frecuencia acumulada (Fᵢ).
  2. Calcular el número total de datos (N): Suma todas las frecuencias absolutas.
  3. Determinar la posición de la mediana: Calcula N/2.
  4. Identificar la "clase mediana": Busca en la columna de frecuencia acumulada (Fᵢ) la primera clase cuya frecuencia acumulada sea igual o superior a N/2. Esta es la clase donde se encuentra la mediana.
  5. Identificar los valores de la fórmula: Una vez identificada la clase mediana, extrae los valores de Lᵢ, Fₐ, fᵢ y A correspondientes a esa clase y la anterior.
  6. Aplicar la fórmula: Sustituye los valores en la fórmula de la mediana y realiza el cálculo.

Ejemplo detallado: Edades de empleados en una empresa

Consideremos la distribución de edades de 100 empleados de una empresa:

Intervalo de EdadFrecuencia (fᵢ)Frecuencia Acumulada (Fᵢ)
[20 - 30)1515
[30 - 40)2540
[40 - 50)3575
[50 - 60)1893
[60 - 70)7100

Cálculo:

  1. N = 100 (total de empleados).
  2. Posición de la mediana = N/2 = 100/2 = 50.
  3. Identificar la clase mediana: Buscamos en la columna Fᵢ el primer valor igual o superior a 50.
    • Fᵢ para [20-30) es 15.
    • Fᵢ para [30-40) es 40.
    • Fᵢ para [40-50) es 75.

    La clase mediana es [40 - 50), ya que su Fᵢ (75) es la primera en superar o igualar a 50.

  4. Extraer los valores de la fórmula:
    • Lᵢ (Límite inferior de la clase mediana) = 40
    • N (Total de datos) = 100
    • Fₐ (Frecuencia acumulada de la clase anterior a la mediana) = 40 (la Fᵢ de la clase [30-40))
    • fᵢ (Frecuencia absoluta de la clase mediana) = 35 (la fᵢ de la clase [40-50))
    • A (Amplitud de la clase mediana) = 50 - 40 = 10
  5. Aplicar la fórmula:

    Me = 40 + [(100/2 - 40) / 35] * 10

    Me = 40 + [(50 - 40) / 35] * 10

    Me = 40 + [10 / 35] * 10

    Me = 40 + 0.2857 * 10

    Me = 40 + 2.857

    Me ≈ 42.86

Por lo tanto, la mediana de la edad de los empleados es aproximadamente 42.86 años. Esto significa que la mitad de los empleados tienen menos de 42.86 años y la otra mitad tienen más de 42.86 años.

Importancia y Ventajas de la Mediana

La mediana es una medida de tendencia central muy valiosa, especialmente en situaciones donde la media podría ser engañosa. Su principal fortaleza radica en su robusta ante valores atípicos. Por ejemplo, en el caso de los ingresos, unos pocos millonarios en una población podrían elevar drásticamente la media, pero no afectarían significativamente la mediana, que seguiría representando el ingreso del "individuo promedio" en términos de posición.

Ventajas clave:

  • Resistencia a los valores extremos: No se ve influenciada por datos excepcionalmente grandes o pequeños.
  • Aplicabilidad en datos asimétricos: Es la mejor medida de centralidad para distribuciones sesgadas.
  • Uso con datos ordinales: Puede calcularse para datos que tienen un orden, pero no necesariamente una distancia numérica significativa entre ellos (ej., escalas de satisfacción: "mala", "regular", "buena", "excelente").
  • Posibilidad de clases abiertas: A diferencia de la media, la mediana puede calcularse incluso si la primera o última clase de un intervalo es abierta (ej., "menos de 20 años" o "más de 70 años"), siempre que la clase mediana no sea una de ellas.

Desventajas a considerar:

  • Menos eficiente: En distribuciones simétricas y sin outliers, la media es una estimación más eficiente del centro de los datos.
  • No utiliza todos los valores: Su cálculo se enfoca en la posición, no en la magnitud de todos los datos, lo que puede desechar información en ciertos contextos.
  • Mayor dispersión muestral: En el muestreo repetido, la mediana puede variar más que la media para una misma población.

Comparación entre Media, Mediana y Moda

Para tener una comprensión completa de tus datos, es útil considerar las tres medidas de tendencia central juntas, ya que cada una ofrece una perspectiva diferente.

ParámetroDefinición BreveUso PrincipalSensibilidad a Outliers
MediaPromedio aritmético de todos los valores.Datos numéricos simétricos, sin valores extremos.Alta (muy sensible).
MedianaValor central que divide los datos en dos mitades.Datos numéricos asimétricos o con outliers.Baja (robusta).
ModaValor que aparece con mayor frecuencia.Datos categóricos, discretos; para identificar el valor más común.Nula (se enfoca en la frecuencia).

La elección entre estas medidas depende de la naturaleza de tus datos y del objetivo de tu análisis. Un buen análisis a menudo implica el uso de varias de ellas para obtener una interpretación completa.

Preguntas Frecuentes (FAQ)

¿Cuál es la diferencia principal entre la media y la mediana?
La diferencia principal radica en su sensibilidad a los valores extremos. La media es el promedio y se ve fuertemente afectada por valores muy grandes o muy pequeños. La mediana, al ser el valor central, es mucho más robusta y representa mejor el "típico" valor en distribuciones asimétricas.
¿Por qué es importante la frecuencia acumulada para calcular la mediana?
La frecuencia acumulada nos permite localizar la posición de la mediana dentro del conjunto de datos o dentro de un intervalo de clase. Al saber cuántos datos hay hasta cierto punto, podemos identificar rápidamente dónde se encuentra el valor que divide la distribución por la mitad (N/2).
¿Puedo calcular la mediana si tengo clases abiertas (por ejemplo, "más de 60 años")?
Sí, la mediana puede calcularse con clases abiertas, siempre y cuando la clase mediana no sea la clase abierta. Si la mediana cae en una clase abierta, no podrás calcular su valor exacto con la fórmula, ya que necesitas el límite inferior y superior para determinar la amplitud del intervalo.
¿La mediana siempre es un valor del conjunto de datos original?
No. Para datos no agrupados con un número par de observaciones, la mediana es el promedio de los dos valores centrales y puede no ser uno de los valores originales. Para datos agrupados, la mediana es una estimación calculada por una fórmula y rara vez coincidirá con un límite de clase o un valor de frecuencia original.

Conclusión

El cálculo de la mediana, ya sea en tablas de frecuencia o en datos agrupados, es una habilidad fundamental en el análisis estadístico. Nos permite obtener una comprensión profunda de la tendencia central de un conjunto de datos, especialmente cuando la distribución es asimétrica o contiene valores atípicos. Al dominar estas técnicas, estás mejor equipado para interpretar y tomar decisiones informadas a partir de grandes volúmenes de información, transformando datos brutos en conocimiento útil y aplicable.

Si quieres conocer otros artículos parecidos a Mediana en Datos Agrupados y Tablas de Frecuencia puedes visitar la categoría Estadística.

Subir