24/01/2024
En el vasto universo del análisis de datos, comprender la distribución y variabilidad de un conjunto de valores es fundamental. Si bien la media y el rango son medidas comunes, a menudo se ven influenciadas de manera significativa por valores atípicos o distribuciones asimétricas. Es aquí donde la mediana y el Rango Intercuartil (RIQ) emergen como herramientas estadísticas increíblemente poderosas y más resistentes. Estas medidas nos ofrecen una visión más precisa del centro y la dispersión de nuestros datos, especialmente cuando los valores extremos podrían distorsionar nuestra percepción. Prepárate para sumergirte en el corazón de tus datos y descubrir cómo estas dos métricas pueden transformar tu comprensión de la información.

- ¿Qué es la Mediana y Cómo se Calcula?
- Entendiendo los Cuartiles: Q1, Q2 y Q3
- El Rango Intercuartil (RIQ): Una Medida Robusta de Dispersión
- Ejemplo Práctico: Calculando Mediana y RIQ Paso a Paso
- Interpretación del Rango Intercuartil (RIQ)
- Tabla Comparativa: Mediana vs. Media y RIQ vs. Rango
- Preguntas Frecuentes (FAQ)
¿Qué es la Mediana y Cómo se Calcula?
La mediana es, en esencia, el valor central en un conjunto de datos cuando estos se han ordenado de forma ascendente o descendente. A diferencia de la media, que es el promedio aritmético, la mediana no se ve afectada por valores extremadamente grandes o pequeños. Esto la convierte en una medida de tendencia central robusta y preferible para conjuntos de datos con asimetrías o valores atípicos.
Pasos para Calcular la Mediana:
- Ordena los datos: El primer y crucial paso es organizar todos los valores de tu conjunto de datos de menor a mayor (o de mayor a menor, el resultado será el mismo).
- Encuentra la posición central:
- Si el número de datos (n) es impar: La mediana es el valor que se encuentra exactamente en la posición central. Puedes encontrar su posición usando la fórmula (n + 1) / 2.
- Si el número de datos (n) es par: No hay un único valor central. En este caso, la mediana es el promedio de los dos valores centrales. Sus posiciones se encuentran en n / 2 y (n / 2) + 1.
Ejemplos de Cálculo de la Mediana:
Ejemplo 1: Conjunto de datos impar
Considera las edades de un grupo de amigos: [18, 20, 22, 19, 21]
- Ordenamos los datos: [18, 19, 20, 21, 22]
- El número de datos (n) es 5 (impar). La posición de la mediana es (5 + 1) / 2 = 3.
- El valor en la tercera posición es 20.
Por lo tanto, la mediana de las edades es 20.
Ejemplo 2: Conjunto de datos par
Considera las puntuaciones de un examen: [85, 92, 78, 88, 95, 80]
- Ordenamos los datos: [78, 80, 85, 88, 92, 95]
- El número de datos (n) es 6 (par). Los dos valores centrales están en las posiciones n/2 = 6/2 = 3 y (n/2) + 1 = 3 + 1 = 4.
- Los valores en la tercera y cuarta posición son 85 y 88.
- Calculamos el promedio: (85 + 88) / 2 = 173 / 2 = 86.5
Por lo tanto, la mediana de las puntuaciones es 86.5.
Entendiendo los Cuartiles: Q1, Q2 y Q3
Los cuartiles son puntos de división que separan un conjunto de datos ordenados en cuatro partes iguales, cada una conteniendo el 25% de los datos. Son fundamentales para comprender la distribución de los valores y para el cálculo del Rango Intercuartil.
- Primer Cuartil (Q1): También conocido como el cuartil inferior, es el valor por debajo del cual se encuentra el 25% de los datos. Es la mediana de la primera mitad del conjunto de datos (excluyendo la mediana si n es impar).
- Segundo Cuartil (Q2): Este es exactamente la mediana del conjunto completo de datos. Por debajo de Q2 se encuentra el 50% de los datos.
- Tercer Cuartil (Q3): También conocido como el cuartil superior, es el valor por debajo del cual se encuentra el 75% de los datos. Es la mediana de la segunda mitad del conjunto de datos (excluyendo la mediana si n es impar).
Cómo Encontrar Q1 y Q3:
Una vez que has ordenado tus datos y calculado la mediana (Q2), los pasos para encontrar Q1 y Q3 son los siguientes:
- Divide el conjunto de datos: Separa el conjunto de datos ordenado en dos mitades: una mitad inferior y una mitad superior.
- Si el número de datos (n) es impar, la mediana (Q2) se excluye de ambas mitades.
- Si el número de datos (n) es par, las dos mitades contendrán la misma cantidad de datos y no habrá un valor central para excluir.
- Calcula Q1: Q1 es la mediana de la mitad inferior de los datos.
- Calcula Q3: Q3 es la mediana de la mitad superior de los datos.
El Rango Intercuartil (RIQ): Una Medida Robusta de Dispersión
El Rango Intercuartil (RIQ), también conocido como rango intercuartílico, es una medida de dispersión estadística que nos indica la extensión del 50% central de un conjunto de datos. Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1).
Fórmula del RIQ:RIQ = Q3 - Q1
¿Por qué el RIQ es una Medida Robusta?
A diferencia del rango total (valor máximo - valor mínimo), que puede ser drásticamente afectado por un solo valor atípico en cualquiera de los extremos del conjunto de datos, el RIQ se centra en la parte central de la distribución. Al ignorar el 25% más bajo y el 25% más alto de los datos, el RIQ se vuelve considerablemente más robusto frente a los valores extremos y a las asimetrías de la distribución. Esto lo hace particularmente útil en situaciones donde la presencia de datos anómalos es común, proporcionando una representación más fiel de la variabilidad "típica" de los datos.

Desviación Cuartil (DQ):
Una medida relacionada con el RIQ es la desviación cuartil (DQ), que se calcula como la mitad del Rango Intercuartil:
Fórmula de la Desviación Cuartil:DQ = RIQ / 2 = (Q3 - Q1) / 2
La desviación cuartil es afectada muy poco por cuentas extremas, lo que la convierte en una buena medida de dispersión para distribuciones sesgadas, ofreciendo una perspectiva de cuán dispersos están los datos alrededor de la mediana.
Ejemplo Práctico: Calculando Mediana y RIQ Paso a Paso
Vamos a aplicar todo lo aprendido con un conjunto de datos de ejemplo. Supongamos que tenemos los siguientes tiempos (en minutos) que tardan 11 personas en completar una tarea:
[12, 15, 18, 11, 20, 13, 17, 16, 14, 25, 19]
Paso 1: Ordenar los datos
Primero, ordenamos los datos de menor a mayor:
[11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25]
El número total de datos (n) es 11.
Paso 2: Calcular la Mediana (Q2)
Como n es impar (11), la mediana es el valor en la posición (11 + 1) / 2 = 6. El valor en la sexta posición es 16.
Por lo tanto, Mediana (Q2) = 16.
Paso 3: Identificar la mitad inferior y superior
Dado que n es impar, excluimos la mediana (16) y dividimos el resto de los datos:
- Mitad inferior: [11, 12, 13, 14, 15]
- Mitad superior: [17, 18, 19, 20, 25]
Paso 4: Calcular Q1 (Primer Cuartil)
Q1 es la mediana de la mitad inferior de los datos: [11, 12, 13, 14, 15]. Esta mitad tiene 5 valores (impar). La mediana es el valor en la posición (5 + 1) / 2 = 3.
El valor en la tercera posición de la mitad inferior es 13.
Por lo tanto, Q1 = 13.

Paso 5: Calcular Q3 (Tercer Cuartil)
Q3 es la mediana de la mitad superior de los datos: [17, 18, 19, 20, 25]. Esta mitad tiene 5 valores (impar). La mediana es el valor en la posición (5 + 1) / 2 = 3.
El valor en la tercera posición de la mitad superior es 19.
Por lo tanto, Q3 = 19.
Paso 6: Calcular el Rango Intercuartil (RIQ)
Aplicamos la fórmula RIQ = Q3 - Q1:
RIQ = 19 - 13 = 6.
El Rango Intercuartil es 6. Esto significa que el 50% central de los tiempos para completar la tarea varía en 6 minutos.
Paso 7: Calcular la Desviación Cuartil (DQ)
Aplicamos la fórmula DQ = RIQ / 2:
DQ = 6 / 2 = 3.
Interpretación del Rango Intercuartil (RIQ)
El RIQ es una métrica poderosa para entender la dispersión de tus datos, especialmente la parte central de ellos. Su interpretación es bastante directa:
- Un RIQ pequeño indica que el 50% central de los datos está muy agrupado alrededor de la mediana. Esto sugiere una baja variabilidad en la parte más densa de la distribución.
- Un RIQ grande sugiere que el 50% central de los datos está más disperso. Esto implica una mayor variabilidad en la sección media de tu conjunto de datos.
Es crucial recordar que el RIQ no te dice nada sobre los valores extremos de tu conjunto de datos, solo sobre la variabilidad de la porción central. Sin embargo, su robustez lo hace invaluable para comparar la dispersión entre diferentes grupos o para identificar la variabilidad inherente sin la influencia de valores atípicos. Es una de las bases para construir los populares diagramas de caja y bigote (box plots), que visualizan de manera efectiva la distribución de una variable y permiten comparar múltiples distribuciones simultáneamente, además de ayudar a ubicar posibles valores extremos.

Tabla Comparativa: Mediana vs. Media y RIQ vs. Rango
Medidas de Tendencia Central
| Característica | Mediana | Media |
|---|---|---|
| Definición | Valor central en datos ordenados | Promedio aritmético de todos los valores |
| Sensibilidad a Atípicos | Baja (robusta) | Alta (sensible) |
| Tipo de Datos Ideal | Datos asimétricos, ordinales, con atípicos | Datos simétricos, sin atípicos significativos |
| Aplicación Común | Ingresos, precios de vivienda, tiempos de reacción | Alturas, pesos, calificaciones promedio |
Medidas de Dispersión
| Característica | Rango Intercuartil (RIQ) | Rango (Amplitud) |
|---|---|---|
| Definición | Diferencia entre Q3 y Q1 (50% central) | Diferencia entre el valor máximo y mínimo |
| Sensibilidad a Atípicos | Baja (robusta) | Alta (muy sensible) |
| Porción de Datos | Se enfoca en el 50% central | Considera todos los datos, incluidos los extremos |
| Aplicación Común | Análisis de variabilidad central, box plots | Primera estimación de dispersión, identificación de extremos |
Preguntas Frecuentes (FAQ)
¿Por qué usar la mediana en lugar de la media?
La mediana es preferible cuando tus datos tienen una distribución asimétrica (sesgada) o contienen valores atípicos (extremos). La media puede ser engañosa en estas situaciones, ya que los valores extremos pueden arrastrarla significativamente. La mediana, al ser una medida de posición, ofrece una representación más fiel del "centro" para la mayoría de los datos.
¿Cuándo es el RIQ una mejor medida de dispersión?
El RIQ es superior al rango total cuando los datos contienen valores atípicos o la distribución es sesgada. Como se enfoca en el 50% central de los datos, proporciona una medida de dispersión más robusta que no se ve inflada por los valores extremos, dando una imagen más precisa de la variabilidad "típica".
¿El RIQ puede ser cero?
Sí, el RIQ puede ser cero. Esto ocurre cuando el 50% central de tus datos son idénticos. Por ejemplo, en el conjunto de datos [5, 5, 5, 5, 5, 5, 5], Q1 y Q3 serían ambos 5, resultando en un RIQ de 0. Esto indica una ausencia total de variabilidad en la porción central de los datos.
¿Qué son los cuartiles exactamente?
Los cuartiles son puntos de corte que dividen un conjunto de datos ordenado en cuatro partes iguales. Q1 marca el 25% inferior, Q2 (la mediana) marca el 50% inferior, y Q3 marca el 75% inferior. Son percentiles específicos (Q1 es el percentil 25, Q2 el percentil 50, Q3 el percentil 75).
¿Cómo se relaciona el RIQ con los box plots?
El RIQ es el corazón de un diagrama de caja y bigote (box plot). La "caja" en un box plot se extiende desde Q1 hasta Q3, y su longitud es precisamente el RIQ. Esto visualiza directamente la extensión del 50% central de tus datos, mientras que los "bigotes" se extienden para mostrar la variabilidad fuera de este rango central, a menudo hasta los valores no atípicos más extremos.
En resumen, la mediana y el Rango Intercuartil son herramientas esenciales para cualquier persona que trabaje con datos. Proporcionan una comprensión más profunda y resistente de la tendencia central y la dispersión, especialmente en conjuntos de datos complejos o con anomalías. Al dominar su cálculo e interpretación, estarás mejor equipado para extraer información significativa y tomar decisiones informadas, yendo más allá de las medidas estadísticas básicas para obtener una visión verdaderamente robusta de tus datos.
Si quieres conocer otros artículos parecidos a Mediana y Rango Intercuartil: Guía Completa puedes visitar la categoría Estadística.
