¿Cómo se calcula la densidad de probabilidades?

La Mediana: El Punto Medio de Tus Datos

05/06/2023

Valoración: 4.81 (3351 votos)

En el vasto universo de la estadística y el análisis de datos, comprender las medidas de tendencia central es fundamental para desentrañar el significado oculto detrás de los números. Mientras que el promedio (o media aritmética) es a menudo la primera medida que viene a la mente, la mediana ofrece una perspectiva única y a menudo más representativa del centro de una distribución, especialmente cuando los datos están sesgados o contienen valores atípicos. Este artículo explorará en profundidad qué es la mediana, cómo se calcula para diferentes tipos de datos y, crucialmente, su interpretación en el contexto de las funciones de densidad.

¿Cómo se calcula la mediana?
Por ejemplo, el promedio de 2, 3, 3, 5, 7 y 10 es 30 dividido por 6, que es 5. Mediana Es el número intermedio de un grupo de números; es decir, la mitad de los números son superiores a la mediana y la mitad de los números tienen valores menores que la mediana. Por ejemplo, la mediana de 2, 3, 3, 5, 7 y 10 es 4.
Índice de Contenido

¿Qué es la Mediana y Por Qué es Importante?

La mediana es, en esencia, el valor central en un conjunto de datos ordenado. Imagina que tienes una lista de números; si los organizas de menor a mayor, la mediana será el número que se encuentra justo en el medio, dividiendo el conjunto en dos mitades iguales: la mitad de los valores son superiores a la mediana y la otra mitad son inferiores. Esta característica la convierte en una medida de tendencia central particularmente robusta frente a valores extremos (outliers), a diferencia del promedio, que puede verse significativamente afectado por ellos.

Para ilustrar la diferencia, consideremos el siguiente ejemplo:

  • Promedio: Suma de un grupo de números dividida por su recuento. Por ejemplo, el promedio de 2, 3, 3, 5, 7 y 10 es (2+3+3+5+7+10) / 6 = 30 / 6 = 5.
  • Mediana: El número intermedio. Para 2, 3, 3, 5, 7 y 10, la mediana es 4 (el promedio de los dos valores centrales 3 y 5, ya que hay un número par de elementos).
  • Moda: El número que aparece con mayor frecuencia. Para 2, 3, 3, 5, 7 y 10, la moda es 3.

En una distribución perfectamente simétrica, estas tres medidas (media, mediana y moda) tienden a ser iguales. Sin embargo, en distribuciones asimétricas o sesgadas, sus valores pueden diferir considerablemente, y la mediana a menudo proporciona una mejor representación del 'centro' típico de los datos.

Cálculo de la Mediana para Datos No Agrupados

El método para calcular la mediana depende de si los datos están agrupados o no. Comencemos con los datos no agrupados, que son simplemente una lista de números individuales.

Paso 1: Ordenar los Datos

El primer y más crucial paso es ordenar el conjunto de datos de menor a mayor. Sin este paso, el cálculo de la mediana será incorrecto.

Paso 2: Identificar el Caso (Número Impar o Par de Datos)

Caso A: Número Impar de Observaciones (n es impar)

Si el número total de observaciones (n) es impar, la mediana es simplemente el valor que ocupa la posición central una vez que los datos están ordenados. La posición se calcula con la fórmula: (n + 1) / 2.

Ejemplo: Considera el conjunto de datos: 1, 3, 3, 6, 7, 8, 9.

Aquí, n = 7 (un número impar). La posición de la mediana es (7 + 1) / 2 = 8 / 2 = 4. Buscamos el valor en la cuarta posición de la lista ordenada:

  1. 1
  2. 3
  3. 3
  4. 6 (Mediana)
  5. 7
  6. 8
  7. 9

La mediana es 6. Este valor deja tres números por debajo (1, 3, 3) y tres números por encima (7, 8, 9).

Caso B: Número Par de Observaciones (n es par)

Si el número total de observaciones (n) es par, no hay un único valor central. En este caso, la mediana se define como la media aritmética (el promedio) de los dos valores centrales. Estos dos valores ocupan las posiciones n/2 y (n/2) + 1 en la lista ordenada.

¿Cómo encontrar la mediana en una curva de densidad?
Para encontrar el valor igual para la mediana, normalmente se buscaría el valor de x en el cual el área bajo la curva hacia la izquierda es igual al área bajo la curva hacia la derecha .

Ejemplo: Considera el conjunto de datos: 1, 2, 3, 4, 5, 6, 8, 9.

Aquí, n = 8 (un número par). Las posiciones de los dos valores centrales son n/2 = 8/2 = 4 y (n/2) + 1 = 4 + 1 = 5. Buscamos los valores en la cuarta y quinta posición de la lista ordenada:

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 8
  8. 9

Los dos valores centrales son 4 y 5. La mediana se calcula como su promedio: (4 + 5) / 2 = 9 / 2 = 4.5.

Cálculo de la Mediana para Datos Agrupados

Cuando trabajamos con grandes conjuntos de datos, a menudo se agrupan en intervalos de clase y se presentan en tablas de frecuencias. Calcular la mediana para datos agrupados requiere un enfoque ligeramente diferente, ya que no tenemos acceso a los valores individuales exactos.

Paso 1: Calcular Frecuencias Acumuladas

Primero, necesitamos calcular la frecuencia absoluta acumulada (Ni) para cada intervalo. Esto nos ayuda a identificar el intervalo donde se encuentra la mediana.

Paso 2: Identificar el Intervalo Mediano

El intervalo mediano es aquel en el que la frecuencia acumulada (Ni) es mayor o igual a n/2 (donde n es el total de observaciones).

Paso 3: Aplicar la Fórmula de la Mediana para Datos Agrupados

Una vez identificado el intervalo mediano, se utiliza la siguiente fórmula para estimar la mediana:

Mediana = Li + [((n/2) - Ni-1) / fi] * Ai

Donde:

  • Li: Límite inferior del intervalo mediano.
  • n: Número total de observaciones.
  • Ni-1: Frecuencia acumulada del intervalo anterior al intervalo mediano.
  • fi: Frecuencia absoluta del intervalo mediano.
  • Ai: Amplitud (ancho) del intervalo mediano (Límite superior - Límite inferior).

Ejemplo para Datos Agrupados (N impar):

Consideremos las calificaciones de 39 alumnos:

Calificaciones (xi)N° de alumnos (fi)Frecuencia Acumulada (Ni)
122
224
348
4513
5821
6930
7333
8437
9239

Total de alumnos (n) = 39. Calculamos n/2 = 39/2 = 19.5.

Buscamos el primer Ni que sea mayor o igual a 19.5. En la tabla, Ni = 21 (para xi = 5) es el primero que cumple esta condición. Por lo tanto, el intervalo mediano es el correspondiente a la calificación de 5.

Como los datos no están en intervalos continuos sino en valores discretos con sus frecuencias, la mediana es simplemente el valor de xi donde la frecuencia acumulada "pasa" el n/2. En este caso, la mediana es 5 puntos. Esto significa que la mitad de la clase obtuvo 5 o menos, y la otra mitad obtuvo 5 o más.

¿Cómo encontrar la media de una función de densidad?
La media se calcula utilizando la fórmula \u03bc = \u222b\u221e -\u221e xf(x) dx , donde f(x) es la función de densidad de probabilidad de la variable aleatoria.

Ejemplo para Datos Agrupados (N par):

Consideremos las calificaciones de 38 alumnos:

Calificaciones (xi)N° de alumnos (fi)Frecuencia Acumulada (Ni)
122
224
348
4513
5619
6928
7432
8436
9238

Total de alumnos (n) = 38. Calculamos n/2 = 38/2 = 19.

Buscamos el Ni que sea igual a n/2. En la tabla, Ni = 19 (para xi = 5) coincide exactamente con 19. En este escenario, la mediana es el promedio del valor de xi donde Ni = n/2 y el siguiente valor de xi.

El valor para Ni = 19 es 5. El siguiente valor de xi (que corresponde a Ni = 28) es 6.

Por lo tanto, la mediana es (5 + 6) / 2 = 5.5 puntos. Esto significa que la mitad de la clase obtuvo 5.5 o menos, y la otra mitad obtuvo 5.5 o más.

Para intervalos continuos, la fórmula general cobra mayor relevancia, permitiendo una interpolación precisa dentro del intervalo mediano. La clave es identificar el intervalo correcto y aplicar la fórmula con sus límites y frecuencias.

La Mediana en una Función de Densidad de Probabilidad

Cuando hablamos de variables aleatorias continuas, los datos no se presentan como una lista discreta de números, sino a través de una función de densidad de probabilidad, f(x). En este contexto, la mediana tiene una interpretación geométrica y probabilística muy clara.

Para una función de densidad de probabilidad f(x), la mediana (denotada comúnmente como 'm' o 'Me') es el valor de 'x' tal que el área bajo la curva de f(x) a la izquierda de 'm' es igual a 0.5. Es decir, la probabilidad de que la variable aleatoria tome un valor menor o igual a 'm' es del 50%.

Matemáticamente, esto se expresa como:

m-∞ f(x) dx = 0.5

Esto significa que el 50% de la masa de probabilidad se encuentra a la izquierda de la mediana y el 50% a la derecha. Es el punto que divide la distribución de probabilidad en dos mitades de igual probabilidad acumulada.

¿Cuál es la mediana de 1, 2, 3, 4, 5, 6, 7, 8?
Conjunto finito de números Por ejemplo, la siguiente lista de siete números, 1, 3, 3, 6, 7, 8, 9. tiene como mediana 6, que es el cuarto valor. .

Es importante contrastar esto con la media (o esperanza matemática) de una función de densidad, que se calcula como:

μ = ∫-∞ x f(x) dx

Mientras que la media representa el 'centro de masa' de la distribución (su punto de equilibrio), la mediana representa el punto que divide la probabilidad total en dos mitades iguales. En distribuciones simétricas (como la distribución normal), la media y la mediana coinciden. Sin embargo, en distribuciones sesgadas, la media será 'arrastrada' hacia la cola más larga, mientras que la mediana permanecerá más cerca del centro de la masa de datos, siendo una medida más robusta de la tendencia central.

Comparación de Medidas de Tendencia Central

Para reforzar la comprensión, veamos una tabla comparativa de las medidas de tendencia central más comunes utilizando el conjunto de datos [1, 2, 2, 3, 4, 7, 9]:

Tipo de MedidaDescripciónEjemplo (Datos: 1, 2, 2, 3, 4, 7, 9)Resultado
Rango MedioPunto medio entre el mínimo y el máximo del conjunto.(1 + 9) / 25
Media AritméticaSuma de los valores dividida por el número de valores.(1 + 2 + 2 + 3 + 4 + 7 + 9) / 74
MedianaValor intermedio que separa la mitad superior de la inferior.1, 2, 2, 3, 4, 7, 9 (ordenado)3
RangoDiferencia entre el valor máximo y el mínimo.9 - 18
ModaValor más frecuente en el conjunto de datos.1, 2, 2, 3, 4, 7, 92

Preguntas Frecuentes sobre la Mediana

¿Cuándo es preferible usar la mediana en lugar de la media?

La mediana es preferible cuando la distribución de los datos es asimétrica (sesgada) o cuando el conjunto de datos contiene valores atípicos (outliers) que podrían distorsionar la media. Por ejemplo, al analizar ingresos en una población, la mediana es más representativa porque unos pocos individuos con ingresos extremadamente altos no inflarán el 'ingreso promedio' de manera engañosa. También es útil en escalas ordinales donde las diferencias entre valores no son uniformes.

¿La mediana siempre es uno de los valores en el conjunto de datos?

No necesariamente. Si el conjunto de datos tiene un número impar de observaciones, la mediana será uno de los valores presentes en el conjunto. Sin embargo, si el conjunto tiene un número par de observaciones, la mediana se calcula como el promedio de los dos valores centrales y, por lo tanto, puede no ser un valor que exista realmente en el conjunto de datos original (como en el ejemplo 4.5 para 1, 2, 3, 4, 5, 6, 8, 9).

¿Puede una distribución tener más de una mediana?

No. Por definición, la mediana es el único valor que divide un conjunto de datos ordenado en dos mitades iguales. Siempre habrá una única mediana para un conjunto de datos dado. La moda, en cambio, sí puede tener múltiples valores si varias categorías tienen la misma frecuencia máxima.

¿Cómo se relaciona la mediana con los percentiles?

La mediana es, por definición, el 50º percentil. Esto significa que el 50% de los datos caen por debajo de ella y el 50% caen por encima. Es un caso especial de un cuantil (un tipo de percentil que divide los datos en partes iguales).

¿Qué significa que la mediana de una función de densidad es 'm'?

Significa que la mitad de la probabilidad total de la variable aleatoria se concentra en valores menores o iguales a 'm', y la otra mitad en valores mayores o iguales a 'm'. Es el punto donde la función de probabilidad acumulada alcanza el valor de 0.5.

Conclusión

La mediana es una medida de tendencia central increíblemente valiosa, que ofrece una perspectiva complementaria y a menudo más precisa que la media, especialmente en escenarios con datos sesgados o atípicos. Su simplicidad conceptual, combinada con su robustez matemática, la convierte en una herramienta indispensable tanto para el análisis de datos discretos como para la comprensión de las distribuciones de probabilidad continuas. Dominar su cálculo e interpretación es un paso fundamental para cualquier persona que busque extraer el máximo valor de sus conjuntos de datos y tomar decisiones informadas en diversos campos, desde la economía hasta la ingeniería.

Si quieres conocer otros artículos parecidos a La Mediana: El Punto Medio de Tus Datos puedes visitar la categoría Estadística.

Subir