¿Cómo R Calcula los Cuartiles y el IQR?

18/07/2025

★★★★★Valoración: 4.32 (12492 votos)

En el vasto universo del análisis de datos, comprender la distribución de nuestros conjuntos de información es tan crucial como los propios números. Aquí es donde los cuartiles emergen como herramientas estadísticas indispensables, ofreciéndonos una visión clara de cómo se agrupan y dispersan los datos. Pero, ¿cómo podemos calcular y utilizar estos valiosos marcadores en R, uno de los entornos de programación más potentes para la estadística? Este artículo te guiará a través de los conceptos fundamentales de los cuartiles y te mostrará, paso a paso, cómo R los calcula y cómo puedes aplicar este conocimiento para desentrañar los secretos de tus datos.

¿Cómo calcula R los cuartiles? — Para calcular cuartiles en R, use la función QUANTILE() . Suponga que tiene sus datos almacenados en una variable llamada x. Puede encontrar los tres cuartiles escribiendo: QUANTILE(x, probs = (0.25, 0.5, 0.75)).

Índice de Contenido

Comprendiendo los Cuartiles: La Base de la Distribución de Datos
La Vital Importancia de los Cuartiles en el Análisis Estadístico
Métodos para Calcular Cuartiles: Una Breve Visión General
Dominando el Cálculo de Cuartiles en R: La Función quantile()
El Rango Intercuartílico (IQR) en R: Más Allá de la Mediana
Interpretando y Aplicando los Cuartiles e IQR en R
Ejemplos Prácticos Completos de Cuartiles e IQR en R
- Ejemplo 1: Puntuaciones de Exámenes
- Ejemplo 2: Tiempos de Entrega (con un posible outlier)
Conclusión
Preguntas Frecuentes (FAQ)

Comprendiendo los Cuartiles: La Base de la Distribución de Datos

Los cuartiles son valores estadísticos que dividen un conjunto de datos ordenado en cuatro partes iguales, cada una conteniendo aproximadamente el 25% de las observaciones. Existen tres cuartiles principales que actúan como puntos de corte:

El Primer Cuartil (Q1): También conocido como el cuartil inferior, marca el percentil 25 de un conjunto de datos. Separa el 25% inferior de los datos del 75% superior.
El Segundo Cuartil (Q2): Este es la mediana del conjunto de datos y marca el percentil 50. Divide los datos en dos mitades iguales: el 50% inferior y el 50% superior.
El Tercer Cuartil (Q3): Denominado cuartil superior, marca el percentil 75. Separa el 75% inferior de los datos del 25% superior.

Los cuartiles son un tipo de cuantil, que son valores que dividen los datos en grupos iguales. Otros cuantiles comunes incluyen:

Percentiles: Dividen los datos en 100 grupos, cada uno con el 1% de las observaciones.
Deciles: Dividen los datos en 10 grupos, cada uno con el 10% de las observaciones.
Quintiles: Dividen los datos en 5 grupos, cada uno con el 20% de las observaciones.

La Vital Importancia de los Cuartiles en el Análisis Estadístico

Los cuartiles son extraordinariamente útiles porque proporcionan una forma rápida y sencilla de resumir la dispersión y el sesgo de tus datos. Una vez que conoces tus cuartiles, puedes utilizarlos para contextualizar otros puntos de datos. Por ejemplo, si Q1 es 300, Q2 es 500 y Q3 es 900, sabes que un punto de dato de 450 se encuentra entre el percentil 25 y la mediana.

Además, los cuartiles son la base para construir otras medidas de ubicación y dispersión:

Resumen de Cinco Números: Una lista que incluye el mínimo, Q1, la mediana (Q2), Q3 y el máximo del conjunto de datos.
Rango Intercuartílico (IQR): Es la diferencia entre el cuartil superior y el inferior (Q3 - Q1). El IQR mide la dispersión del 50% central de tus datos, siendo una medida de variabilidad robusta, menos afectada por valores atípicos.
Detección de Outliers: Los cuartiles y el IQR son fundamentales para identificar outliers (valores atípicos). Un valor se considera atípico si es mayor que Q3 + (1.5 x IQR) o menor que Q1 - (1.5 x IQR).

Métodos para Calcular Cuartiles: Una Breve Visión General

Aunque el enfoque principal de este artículo es R, es útil saber que los cuartiles pueden calcularse de varias maneras:

Método del Localizador (Manual): Implica ordenar los datos y usar fórmulas para encontrar la posición de Q1, Q2 y Q3.
Método de la Mediana (Manual): Se encuentra primero la mediana (Q2), luego Q1 como la mediana de la mitad inferior de los datos, y Q3 como la mediana de la mitad superior.
Hojas de Cálculo (Excel/Google Sheets): Funciones como QUARTILE() simplifican el proceso, aunque los resultados pueden variar ligeramente dependiendo del algoritmo interno utilizado.

Dominando el Cálculo de Cuartiles en R: La Función quantile()

R, siendo un lenguaje y entorno para computación estadística y gráficos, ofrece funciones muy eficientes para el cálculo de cuartiles. La función principal que utilizaremos es quantile().

Para calcular los cuartiles en R, si tienes tus datos almacenados en una variable, por ejemplo, x, simplemente necesitas usar la función quantile() especificando los percentiles que te interesan. Los cuartiles corresponden a los percentiles 25, 50 y 75.

Uso Básico de quantile():

# Creamos un conjunto de datos de ejemplo datos <- c(2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30) # Calculamos los cuartiles (Q1, Mediana, Q3) cuartiles <- quantile(datos, probs = c(0.25, 0.50, 0.75)) print(cuartiles)

La salida de este código sería algo similar a:

 25% 50% 75% 8 16 24

Esto nos indica que Q1 es 8, la mediana (Q2) es 16, y Q3 es 24. La función quantile() es increíblemente flexible. El argumento probs permite especificar cualquier percentil que desees calcular, lo que la hace útil no solo para cuartiles, sino también para deciles, quintiles o cualquier otro percentil.

Comparación de funciones para cuartiles en R:

Función	Descripción	Uso Principal
`quantile()`	Calcula cuantiles arbitrarios (incluidos cuartiles, deciles, percentiles).	Obtener Q1, Q2, Q3 y otros percentiles específicos.
`IQR()`	Calcula directamente el Rango Intercuartílico (Q3-Q1).	Medir la dispersión del 50% central de los datos.
`fivenum()`	Devuelve el resumen de cinco números (mínimo, Q1, mediana, Q3, máximo).	Obtener una visión rápida de la distribución de los datos.

El Rango Intercuartílico (IQR) en R: Más Allá de la Mediana

Como mencionamos, el IQR es una medida de dispersión que nos dice cuán disperso está el 50% central de nuestros datos. Es menos sensible a los outliers que el rango total (máximo - mínimo), lo que lo convierte en una medida de dispersión más robusta.

Cálculo del IQR con la función IQR():

R proporciona una función dedicada para calcular el IQR directamente: IQR(). Esta función es un atajo conveniente y calcula Q3 - Q1 utilizando la misma metodología por defecto que quantile().

# Usando el mismo conjunto de datos 'datos' datos <- c(2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30) # Calculamos el IQR directamente iqr_valor <- IQR(datos) print(iqr_valor)

La salida para el ejemplo anterior sería:

[1] 16

Esto significa que el rango intercuartílico de nuestro conjunto de datos es 16. Si lo calculamos manualmente a partir de los cuartiles obtenidos con quantile() (Q3=24, Q1=8), veríamos que 24 - 8 = 16, lo que confirma la coherencia.

¿Cuál es la fórmula para determinar los cuartiles? — Primer cuartil (Q1) = (n + 1) x 1/4 . Segundo cuartil (Q2), o mediana = (n + 1) x 2/4. Tercer cuartil (Q3) = (n + 1) x 3/4.

Cálculo manual del IQR a partir de quantile():

También puedes calcular el IQR extrayendo los valores de Q1 y Q3 de la salida de quantile():

# Calculamos los cuartiles cuartiles <- quantile(datos, probs = c(0.25, 0.75)) # Extraemos Q3 y Q1 y calculamos el IQR iqr_manual <- cuartiles["75%"] - cuartiles["25%"] print(iqr_manual)

Este método es útil si ya has calculado los cuartiles y solo necesitas el IQR como un paso secundario.

Interpretando y Aplicando los Cuartiles e IQR en R

La capacidad de calcular cuartiles e IQR en R es solo el primer paso. La verdadera magia reside en cómo interpretamos y aplicamos estos valores para obtener información significativa de nuestros datos.

Decodificando la Información de los Cuartiles y el IQR

Variabilidad de los Datos: Un IQR más grande indica una mayor dispersión en la porción central de los datos, lo que sugiere que los puntos de datos están más extendidos alrededor de la mediana. Un IQR pequeño, por el contrario, indica que los datos están más agrupados.
Detección de Sesgo: La posición de la mediana (Q2) en relación con Q1 y Q3 puede indicar el sesgo de la distribución. Si la mediana está más cerca de Q1, los datos pueden estar sesgados a la derecha (cola larga hacia valores altos), y viceversa.

Aplicación del IQR en la Detección de Outliers

Una de las aplicaciones más poderosas del IQR es la identificación de outliers. Los valores atípicos pueden distorsionar significativamente los resultados de un análisis y es crucial identificarlos y manejarlos adecuadamente. La regla general para identificar outliers es la siguiente:

Un valor es un outlier si es menor que Q1 - (1.5 * IQR)
Un valor es un outlier si es mayor que Q3 + (1.5 * IQR)

Ejemplo de Detección de Outliers en R:

# Conjunto de datos con un posible outlier datos_con_outlier <- c(2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 100) # Calcular Q1, Q3 y el IQR q1 <- quantile(datos_con_outlier, 0.25) q3 <- quantile(datos_con_outlier, 0.75) iqr_outlier <- IQR(datos_con_outlier) # Calcular los límites para outliers limite_inferior <- q1 - 1.5 * iqr_outlier limite_superior <- q3 + 1.5 * iqr_outlier # Identificar outliers outliers_encontrados <- datos_con_outlier[datos_con_outlier < limite_inferior | datos_con_outlier > limite_superior] print(paste("Límite Inferior:", limite_inferior)) print(paste("Límite Superior:", limite_superior)) print(paste("Outliers encontrados:", outliers_encontrados))

Para este conjunto de datos, `100` sería identificado como un outlier, ya que excede el límite superior calculado.

Análisis del IQR en Grupos de Datos

Cuando trabajamos con conjuntos de datos más complejos, a menudo necesitamos analizar la variabilidad no solo para el conjunto completo, sino también dentro de diferentes categorías o grupos. La combinación de las funciones de R con paquetes como dplyr hace que esto sea muy eficiente.

# Instalamos y cargamos dplyr si no lo hemos hecho # install.packages("dplyr") library(dplyr) # Creamos un dataframe de ejemplo df_ventas <- data.frame( region = rep(c("Norte", "Sur"), each = 10), ventas = c(rnorm(10, mean = 50, sd = 5), rnorm(10, mean = 70, sd = 10)) ) # Calculamos el IQR de las ventas por región iqr_por_region <- df_ventas %>% group_by(region) %>% summarise(IQR_Ventas = IQR(ventas)) print(iqr_por_region)

Este código agruparía las ventas por región y calcularía el IQR para cada una, permitiéndonos comparar la dispersión de las ventas entre la región Norte y Sur.

Ejemplos Prácticos Completos de Cuartiles e IQR en R

Ejemplo 1: Puntuaciones de Exámenes

Consideremos las puntuaciones de un examen de 15 estudiantes:

puntuaciones <- c(59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84) # Calcular cuartiles cuartiles_puntuaciones <- quantile(puntuaciones, probs = c(0.25, 0.5, 0.75)) print("Cuartiles de Puntuaciones:") print(cuartiles_puntuaciones) # Calcular IQR iqr_puntuaciones <- IQR(puntuaciones) print(paste("IQR de Puntuaciones:", iqr_puntuaciones)) # Detección de outliers (límites) limite_inf_p <- cuartiles_puntuaciones["25%"] - 1.5 * iqr_puntuaciones limite_sup_p <- cuartiles_puntuaciones["75%"] + 1.5 * iqr_puntuaciones print(paste("Límite Inferior para Outliers:", limite_inf_p)) print(paste("Límite Superior para Outliers:", limite_sup_p))

Ejemplo 2: Tiempos de Entrega (con un posible outlier)

Imaginemos los tiempos de entrega de 12 paquetes en minutos, donde uno fue excepcionalmente largo:

tiempos_entrega <- c(10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 180) # Calcular cuartiles cuartiles_entrega <- quantile(tiempos_entrega, probs = c(0.25, 0.5, 0.75)) print("Cuartiles de Tiempos de Entrega:") print(cuartiles_entrega) # Calcular IQR iqr_entrega <- IQR(tiempos_entrega) print(paste("IQR de Tiempos de Entrega:", iqr_entrega)) # Detección de outliers limite_inf_e <- cuartiles_entrega["25%"] - 1.5 * iqr_entrega limite_sup_e <- cuartiles_entrega["75%"] + 1.5 * iqr_entrega outliers_entrega <- tiempos_entrega[tiempos_entrega < limite_inf_e | tiempos_entrega > limite_sup_e] print(paste("Límite Inferior para Outliers:", limite_inf_e)) print(paste("Límite Superior para Outliers:", limite_sup_e)) print(paste("Outliers encontrados en Tiempos de Entrega:", outliers_entrega))

En este ejemplo, el valor de 180 minutos será identificado como un outlier, destacando un tiempo de entrega inusualmente largo.

Conclusión

Los cuartiles y el Rango Intercuartílico son herramientas fundamentales en el arsenal de cualquier analista de datos. R, con sus funciones intuitivas como quantile() e IQR(), simplifica enormemente el proceso de cálculo y análisis. Al dominar estas funciones, no solo podrás resumir la distribución de tus datos de manera efectiva, sino también identificar valores atípicos y obtener una comprensión más profunda de la variabilidad subyacente. Esto te permitirá tomar decisiones más informadas y construir modelos predictivos más robustos.

¿Cómo calcular el rango intercuartil en R? — R: En R, puedes calcular el RIQ con la función integrada IQR() . Simplemente pasa tu conjunto de datos o un vector de valores a la función como argumento y esta devolverá el rango intercuartil.

Preguntas Frecuentes (FAQ)

P: ¿Qué es el Rango Intercuartílico (IQR) y por qué es importante?

R: El Rango Intercuartílico (IQR) es una medida de dispersión estadística que representa la diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1) de un conjunto de datos. Es crucial porque se centra en la porción central de los datos, ayudando a identificar la dispersión del 50% central de los valores, que es menos influenciada por los valores atípicos y extremos. Esto convierte al IQR en una herramienta valiosa para comprender la variabilidad dentro de un conjunto de datos.

P: ¿Cómo se calcula el IQR en R?

R: En R, puedes calcular el IQR utilizando la función incorporada IQR(). Simplemente pasa tu conjunto de datos o un vector de valores como argumento a la función. Por ejemplo, IQR(mis_datos), donde mis_datos es tu conjunto de datos. Esta función es directa y eficiente para principiantes en el lenguaje de programación R.

P: ¿Puede el IQR ayudar a detectar outliers en un conjunto de datos?

R: Sí, el IQR se usa comúnmente para la detección de outliers. Los outliers se definen típicamente como observaciones que caen por debajo de Q1 - 1.5 * IQR o por encima de Q3 + 1.5 * IQR. Al calcular estos límites, puedes identificar valores que son significativamente más altos o más bajos que la mayor parte de los datos, lo que indica posibles outliers. Este método es robusto y útil, especialmente para principiantes, ya que es simple de implementar en R.

P: ¿Es posible calcular el IQR para datos agrupados en R?

R: Absolutamente. En R, puedes usar el paquete dplyr para agrupar tus datos y luego calcular el IQR para cada grupo. Esto implica usar la función group_by() para especificar la variable de agrupación, seguida de summarise() para aplicar la función IQR() a cada grupo. Este enfoque es beneficioso para el análisis comparativo entre diferentes categorías o grupos dentro de tu conjunto de datos.

P: ¿Qué indica un IQR alto sobre un conjunto de datos?

R: Un IQR alto indica una gran dispersión en el 50% central del conjunto de datos. Esto sugiere que los puntos de datos están más extendidos alrededor de la mediana, mostrando una mayor variabilidad dentro de la porción central de los datos. Por el contrario, un IQR bajo significa que los puntos de datos están estrechamente agrupados alrededor de la mediana. Comprender esto puede ayudar a evaluar la variabilidad y la consistencia de los datos.

P: ¿En qué se diferencia la función quantile() de IQR() en R?

R: La función quantile() es más general; te permite calcular cualquier cuantil (percentil) de un conjunto de datos, incluyendo Q1 (25%), Q2 (50% o mediana) y Q3 (75%). La función IQR(), por otro lado, es una función específica que calcula directamente la diferencia entre el tercer y el primer cuartil (Q3 - Q1). Aunque puedes calcular el IQR usando quantile() (restar el 75% del 25%), IQR() es un atajo conveniente si solo necesitas esa medida de dispersión.

Si quieres conocer otros artículos parecidos a ¿Cómo R Calcula los Cuartiles y el IQR? puedes visitar la categoría Estadística.