Cálculo de la mediana de un grupo de datos con Excel
La mediana es un valor que divide una serie de datos en dos partes iguales. Es decir, que habrá la misma cantidad de datos tanto por debajo de ese valor como por encima.
Denotamos por a la mediana. Para calcular el valor de esta mediana es necesario que los datos estén ordenados, ya sea en orden creciente o decreciente. Y deberemos tener en cuenta si el número de datos es par o impar.
Además, dependiendo de si los datos a estudiar se encuentran o no en una tabla de distribución de frecuencias hablaremos de:
Mediana para datos no agrupados
Mediana para datos agrupados
Cuando los datos están ordenados y sin agrupar,
si el número de valores es impar
si el número de valores es par
Con esto las fórmulas para calcular la mediana son:
| Número Impar de Datos | Número Par de Datos |
Datos No Agrupados |
Cuando los datos están ordenados y agrupados,
Hay que fijarse en las frecuencias relativas acumuladas y localizar entre que clases (tablas tipo A) o intervalos de clase (tablas tipo B) se encuentra la frecuencia relativa acumulada del 50 %.
Una vez localizada deberemos interpolar para encontrar la mediana. Tomaremos las clases o los límites de los intervalos entre los que se encuentra esa frecuencia relativa acumulada del 50 %.
Veremos la cantidad que es necesaria aumentar la frecuencia relativa acumulada de la clase inferior para que alcance el valor del 50 %. Y con este valor realizaremos una regla de tres junto con la diferencia entre clases. Consiguiendo así un valor de incremento, el cual añadiremos a la clase para obtener así nuestro valor de la mediana.
Calculemos la mediana a partir de esta tabla de frecuencias.
1) Primero tenemos que localizar entre qué clases se encuentra la mediana.
Como el total de datos escrutados es 34 (número par de datos), la mediana debe caer entre los valores que correspondan a los datos 17 y 18, es decir, al valor 17.5. Así tendremos 17 valores por debajo de la mediana y otros 17 valores por encima. Fijándonos en las frecuencias acumuladas tenemos que la mediana se encontrará entonces en el 5º intervalo de clase. Entre los pesos 3.0 y 3.4
2) Interpolemos ahora los datos para encontrar la mediana.
Nos fijamos en los límites superiores, del intervalo donde caerá la mediana y del intervalo anterior, y tomamos los valores de sus frecuencias acumuladas.
La diferencia entre las frecuencias absolutas acumuladas nos indica que existen entre las clases 10 datos. Para llegar al dato 17.5, debemos incrementar en 2.5 datos partiendo desde el límite de 3.0
Con una sencilla regla de tres hallaremos el incremento en unidades para ese 2.5
Luego para llegar al dato 17.5, al límite 3.0 debemos incrementarle 0.1 su valor. Y así:
Con esto las fórmulas para calcular la mediana son:
| En términos de Frecuencias Absolutas | En términos de Frecuencias Relativas |
Datos agrupados |
es la clase o intervalo de clase anterior al que se encuentra el 50 % de los datos.
es el límite superior de la clase anterior de donde se encuentra la mediana.
Ventajas
- Es fácil de calcular e interpretar su valor
- Se realizan manipulaciones algebraicas.
- Su valor no se encuentra afectado por datos extremos.
- Se puede calcular en tablas de distribución de frecuencias con extremos abiertos
Desventajas
- Al calcular la mediana no usamos todos los valores observados de la variable, lo que la limita como medida de tendencia central.
- No puede ser aplicada a distribuciones de variables cualitativas.