11/04/2024
En el vasto universo de la estadística, comprender y analizar los datos es fundamental para tomar decisiones informadas. Entre las herramientas más básicas y poderosas se encuentran las medidas de tendencia central, como la media y la mediana. Estas nos permiten resumir un conjunto de datos en un solo valor representativo. Pero, ¿qué ocurre cuando trabajamos con variables discretas? Es decir, aquellos datos que solo pueden tomar valores enteros y contables, como el número de hijos en una familia o la cantidad de veces que se lanza un dado. Este artículo te guiará a través del cálculo y la interpretación de la media y la mediana específicamente para este tipo de variables, desglosando cada paso y ofreciéndote una visión clara de su aplicación práctica.

La estadística descriptiva no solo se trata de números; se trata de contar una historia con esos números. La media y la mediana son dos de los capítulos más importantes de esa historia, proporcionándonos diferentes perspectivas sobre el 'centro' de nuestros datos. Acompáñanos en este recorrido para dominar estas herramientas esenciales.
- ¿Qué es una Variable Discreta?
- Cálculo de la Media Aritmética para Variables Discretas
- Cálculo de la Mediana para Variables Discretas
- Media vs. Mediana: ¿Cuándo Usar Cuál?
- Preguntas Frecuentes (FAQ)
- ¿Cuál es la diferencia principal entre una variable discreta y una continua?
- ¿Por qué es importante la frecuencia acumulada al calcular la mediana?
- ¿Puede la media ser un valor que no existe en el conjunto de datos?
- ¿Puede la mediana ser un valor que no existe en el conjunto de datos?
- ¿Qué significa que una distribución sea asimétrica?
- ¿Cómo se relacionan la media, mediana y moda en una distribución simétrica?
- Conclusión
¿Qué es una Variable Discreta?
Antes de sumergirnos en los cálculos, es crucial entender qué es una variable discreta. Una variable discreta es aquella que puede tomar un número finito o infinito contable de valores. Esto significa que los valores que puede tomar son números enteros y no hay valores intermedios entre ellos. Por ejemplo, el número de coches que pasan por una calle en una hora (no puedes tener 2.5 coches), el número de alumnos en una clase, o el resultado al lanzar un dado (1, 2, 3, 4, 5, 6).
Se diferencian de las variables continuas, que pueden tomar cualquier valor dentro de un rango determinado (como la altura o el peso, que pueden ser 1.75 metros o 68.3 kilogramos). Esta distinción es importante porque, aunque los principios de la media y la mediana son similares para ambos tipos, la forma de abordarlos, especialmente en el contexto de las frecuencias, puede variar ligeramente.
Cálculo de la Media Aritmética para Variables Discretas
La media aritmética, comúnmente conocida como el promedio, es quizás la medida de tendencia central más utilizada. Para una variable discreta, especialmente cuando los datos se presentan en una tabla de frecuencias, su cálculo es bastante directo.
Fórmula y Procedimiento
Cuando tenemos un conjunto de datos discretos, a menudo se agrupan por sus frecuencias. La fórmula para la media aritmética (X̄) en este caso es:
X̄ = Σ(xᵢ ⋅ fᵢ) / N
- xᵢ: Representa cada valor único de la variable discreta.
- fᵢ: Es la frecuencia absoluta de cada valor xᵢ (cuántas veces aparece ese valor en el conjunto de datos).
- Σ: Indica la sumatoria de todos los productos (xᵢ ⋅ fᵢ).
- N: Es el número total de observaciones (la suma de todas las frecuencias, N = Σfᵢ).
Ejemplo Práctico de la Media
Imaginemos que hemos encuestado a 20 familias sobre el número de televisores que tienen en casa y los resultados son los siguientes:
| Número de Televisores (xᵢ) | Frecuencia (fᵢ) | xᵢ ⋅ fᵢ |
|---|---|---|
| 1 | 3 | 1 ⋅ 3 = 3 |
| 2 | 8 | 2 ⋅ 8 = 16 |
| 3 | 5 | 3 ⋅ 5 = 15 |
| 4 | 4 | 4 ⋅ 4 = 16 |
| Total | N = 20 | Σ(xᵢ ⋅ fᵢ) = 50 |
Ahora, aplicamos la fórmula:
X̄ = 50 / 20 = 2.5
La media de televisores por familia es 2.5. Es importante destacar que, aunque el número de televisores es discreto, la media puede ser un valor no entero, ya que representa un promedio.
Propiedad Importante de la Media
Una característica notable de la media es su comportamiento ante transformaciones lineales de los datos. Si multiplicamos (dividimos) todos los datos de una distribución por una cantidad distinta de cero, la media resultante sería la anterior multiplicada (dividida) por dicha cantidad. Por ejemplo, si el costo promedio de un artículo es de $10 y todos los artículos aumentan su precio al doble, el nuevo promedio será $20.
Ventajas y Desventajas de la Media
- Ventajas: Es fácil de calcular, utiliza todos los valores de la distribución para su cálculo y es una medida familiar para la mayoría de las personas.
- Desventajas: Es muy sensible a los valores atípicos (o extremos). Un solo valor inusualmente alto o bajo puede distorsionar significativamente la media, haciendo que no sea una representación fiel del centro de los datos.
Cálculo de la Mediana para Variables Discretas
La mediana es el valor central en un conjunto de datos ordenados. A diferencia de la media, no se ve afectada por los valores extremos, lo que la convierte en una medida de tendencia central más robusta en distribuciones asimétricas.
Procedimiento para Calcular la Mediana
El cálculo de la mediana para variables discretas varía ligeramente dependiendo de si el número total de observaciones (N) es par o impar, y si los datos están en una tabla de frecuencias.
Paso 1: Ordenar los Datos
El primer paso y el más crucial es ordenar todos los datos de menor a mayor. Si los datos ya están en una tabla de frecuencias, se asume que los valores de xᵢ ya están ordenados.
Paso 2: Encontrar la Posición de la Mediana
La posición de la mediana se calcula utilizando la fórmula: Posición = (N + 1) / 2.
- Si N es impar: La mediana es el valor que se encuentra exactamente en la posición calculada.
- Si N es par: La mediana es el promedio de los dos valores que se encuentran en las posiciones
N/2y(N/2) + 1.
Paso 3: Identificar la Mediana en Datos con Frecuencias
Cuando los datos se presentan en una tabla de frecuencias, necesitamos utilizar la frecuencia acumulada (Fᵢ) para encontrar la posición de la mediana. La frecuencia acumulada para un valor xᵢ es la suma de la frecuencia de xᵢ y las frecuencias de todos los valores anteriores.
Ejemplo Práctico de la Mediana
Retomemos el ejemplo de los televisores en 20 familias:
| Número de Televisores (xᵢ) | Frecuencia (fᵢ) | Frecuencia Acumulada (Fᵢ) |
|---|---|---|
| 1 | 3 | 3 |
| 2 | 8 | 3 + 8 = 11 |
| 3 | 5 | 11 + 5 = 16 |
| 4 | 4 | 16 + 4 = 20 |
| Total | N = 20 |
1. Número total de datos (N) = 20 (par).
2. Posiciones centrales:N/2 = 20/2 = 10 y (N/2) + 1 = 10 + 1 = 11. Necesitamos los valores en la posición 10 y 11.

3. Encontrar los valores usando la frecuencia acumulada:
- La frecuencia acumulada de 1 televisor es 3. Esto significa que los valores 1, 2 y 3 son '1'.
- La frecuencia acumulada de 2 televisores es 11. Esto significa que los valores desde la posición 4 hasta la 11 son '2'.
Por lo tanto, el valor en la posición 10 es '2' y el valor en la posición 11 también es '2'.
4. Calcular la mediana: Como N es par, la mediana es el promedio de los valores en las posiciones 10 y 11.
Mediana = (2 + 2) / 2 = 2
La mediana de televisores por familia es 2.
Ventajas y Desventajas de la Mediana
- Ventajas: No es afectada por los valores atípicos, lo que la hace una medida de tendencia central más robusta y representativa en distribuciones asimétricas.
- Desventajas: No utiliza todos los valores de la distribución para su cálculo, y puede ser menos intuitiva que la media, especialmente cuando N es par y se promedian dos valores.
Media vs. Mediana: ¿Cuándo Usar Cuál?
La elección entre la media y la mediana depende en gran medida de la naturaleza de los datos y del objetivo del análisis. Ambas miden el 'centro' de una distribución, pero lo hacen de maneras distintas.
| Característica | Media Aritmética | Mediana |
|---|---|---|
| Definición | Promedio de todos los valores | Valor central en datos ordenados |
| Sensibilidad a Atípicos | Alta (se ve fuertemente afectada) | Baja (es robusta) |
| Tipo de Datos Ideal | Distribuciones simétricas, sin extremos | Distribuciones asimétricas, con valores atípicos |
| Cálculo | Requiere todos los valores para promediar | Se basa en la posición de los datos |
| Representatividad | Centro de 'gravedad' o equilibrio | Punto que divide la distribución en dos mitades iguales |
| Existencia | Siempre es un valor numérico | Puede ser un valor que no esté en el conjunto de datos (si N es par) |
En general, si tu conjunto de datos no tiene valores extremos y es aproximadamente simétrico, la media es una excelente opción. Sin embargo, si los datos están sesgados (asimétricos) o contienen valores atípicos que podrían distorsionar el promedio, la mediana es una medida mucho más confiable del centro. Por ejemplo, al analizar los ingresos por hogar en un país, la mediana suele ser más representativa que la media, ya que unos pocos ingresos extremadamente altos (valores atípicos) podrían inflar la media y no reflejar la realidad de la mayoría de la población.
Preguntas Frecuentes (FAQ)
¿Cuál es la diferencia principal entre una variable discreta y una continua?
La principal diferencia radica en los valores que pueden tomar. Las variables discretas solo pueden tomar un número finito o contable de valores enteros (ej. número de hijos), mientras que las variables continuas pueden tomar cualquier valor dentro de un rango dado, incluyendo decimales (ej. altura, peso).
¿Por qué es importante la frecuencia acumulada al calcular la mediana?
La frecuencia acumulada nos permite localizar rápidamente la posición de la mediana en un conjunto de datos que ya ha sido agrupado en una tabla de frecuencias. En lugar de listar todos los valores individualmente y contarlos para encontrar el centro, la frecuencia acumulada nos indica hasta qué valor se han 'acumulado' un cierto número de observaciones, facilitando la identificación de la posición central.
¿Puede la media ser un valor que no existe en el conjunto de datos?
Sí, absolutamente. Como vimos en el ejemplo de los televisores, la media fue 2.5, un valor que no es posible tener en la realidad (no puedes tener medio televisor). La media es un valor calculado que representa un promedio, no necesariamente un valor real dentro del conjunto de datos.
¿Puede la mediana ser un valor que no existe en el conjunto de datos?
Sí, esto ocurre cuando el número de observaciones (N) es par. En ese caso, la mediana se calcula como el promedio de los dos valores centrales. Si estos dos valores son diferentes, la mediana resultante podría no ser uno de los valores originales en el conjunto de datos. Por ejemplo, si los valores centrales son 4 y 5, la mediana sería 4.5.
¿Qué significa que una distribución sea asimétrica?
Una distribución asimétrica es aquella en la que los datos no se distribuyen uniformemente alrededor de la media. Si la 'cola' de la distribución se extiende más hacia los valores altos, se dice que es asimétrica a la derecha (o positiva). Si la cola se extiende más hacia los valores bajos, es asimétrica a la izquierda (o negativa). En estos casos, la media tiende a ser 'arrastrada' hacia la cola, mientras que la mediana permanece más cerca del verdadero centro de la mayoría de los datos.
¿Cómo se relacionan la media, mediana y moda en una distribución simétrica?
En una distribución perfectamente simétrica (como la distribución normal), la media, la mediana y la moda (el valor que aparece con más frecuencia) son iguales o muy cercanas entre sí. Esto indica que el centro de la distribución es claro y que no hay valores extremos que la distorsionen.
Conclusión
Calcular la media y la mediana para variables discretas es una habilidad fundamental en el análisis de datos. Ambas medidas nos proporcionan información valiosa sobre el centro de una distribución, pero con diferentes matices. La media, con su sensibilidad a los valores extremos, es ideal para conjuntos de datos simétricos, mientras que la mediana, con su robustez, brilla en distribuciones asimétricas o con valores atípicos. Dominar estas herramientas te permitirá no solo resumir datos, sino también interpretarlos críticamente, desvelando las historias que los números tienen para contar y facilitando una toma de decisiones más precisa y fundamentada en cualquier campo, desde la investigación científica hasta la gestión empresarial.
Si quieres conocer otros artículos parecidos a Calculando Media y Mediana en Variables Discretas puedes visitar la categoría Estadística.
