Existen diversas medidas de dispersión, entre las más utilizadas podemos
destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por
diferencia entre el valor más elevado y el valor más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la
media. Se calcula como sumatoria de las diferencias al cuadrado entre cada valor
y la media. Luego la sumatoria obtenida se divide por el tamaño de la población $N$ o si es varianza muestral entre el tamaño de la muestra disminuido en 1, es decir entre $N-1$.
Luego se tiene varianza poblacional (con simbolo $\sigma^2$ o varianza muestral (con simbolo $s^2$
La varianza poblacional se calcula como:
$$\sigma^2 =\frac{\sum_{i=1}^N (x_1-\bar{x})^2}{N}$$Si se tienen las frecuencias absolutas simples, se multiplica esta por cada diferencia al cuadrado:
$$\sigma^2 =\frac{\sum_{i=1}^N (x_1-\bar{x})^2*n_i}{N}$$La varianza muestral como:
$$s^2 =\frac{\sum_{i=1}^N (x_1-\bar{x})^2}{N-1}$$Si se tienen las frecuencias absolutas simples, se multiplica esta por cada diferencia al cuadrado:
$$s^2 =\frac{\sum_{i=1}^N (x_1-\bar{x})^2*n_i}{N-1}$$
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el
contrario, mientras mayor sea la varianza, más dispersos están.
3.- Desviación estándar: Se calcula como raíz cuadrada de la varianza.
4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación estándar y la media.
Calcular la varianza, desviación estándar y coeficiente de variación de las edades entre:
| No. lista | Nombre | Edad |
|---|---|---|
| 1 | Ana | 19 |
| 2 | Jesús | 17 |
| 3 | Juan | 29 |
| 4 | Melisa | 21 |
Primero se calcula la media, que se hizo anteriormente y es de $\bar{x}=21.5$
Se puede construir la siguiente tabla, que sería un cálculo rápido en una hoja de cálculo como Excel:
| No. | x | $(x_i-\bar{x})^2$ |
|---|---|---|
| 1 | 19 | $(19-21.5)^2=6.25$ |
| 2 | 17 | $(17-21.5)^2=20.25$ |
| 3 | 29 | $(29-21.5)^2=56.25$ |
| 4 | 21 | $(21-21.5)^2=0.25$ |
| $\sum_{i=1}^N (x_1-\bar{x})^2 =83.0$ | ||
Luego la varianza es:
$$\sigma^2 =\frac{83.0}{4}=20.75$$Otra fórmula para la varianza es:
$$\sigma^2 =\frac{\sum_{i=1}^N x_1^2-N*\bar{x}^2}{N}$$Aplicando esta fórmula:
$$\sigma^2 =\frac{19^2+17^2+29^2+21^2-4*21.5^2}{4}=20.75$$La desviación estándar es:
$$\sigma = \sqrt{83.0}=4.5552$$El coeficiente de variación, es:
$$C.V. = \frac{4.5552}{21.5}=0.2119=21.19\% $$Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una clase y vamos a calcular sus medidas de dispersión.
| Variable | Frecuencias absolutas | Frecuencias relativas | ||
| (Valor) | Simple | Acumulada | Simple | Acumulada |
| 1,20 | 1 | 1 | 3,3 % | 3,3 % |
| 1,21 | 4 | 5 | 13,3 % | 16,6 % |
| 1,22 | 4 | 9 | 13,3 % | 30,0 % |
| 1,23 | 2 | 11 | 6,6 % | 36,6 % |
| 1,24 | 1 | 12 | 3,3 % | 40,0 % |
| 1,25 | 2 | 14 | 6,6 % | 46,6 % |
| 1,26 | 3 | 17 | 10,0 % | 56,6 % |
| 1,27 | 3 | 20 | 10,0 % | 66,6 % |
| 1,28 | 4 | 24 | 13,3 % | 80,0 % |
| 1,29 | 3 | 27 | 10,0 % | 90,0 % |
| 1,30 | 3 | 30 | 10,0 % | 100,0 % |
1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor
valor (1,20). Luego el rango de esta muestra es 10 cm.
2.- Varianza: recordemos que la media de esta muestra es 1,253. Luego,
aplicamos la fórmula:
![]() |
Por lo tanto, la varianza es 0,0010
3.- Desviación típica: es la raíz cuadrada de la varianza.
|
|
luego:
|
|
4.- Coeficiente de variación de Pearson: se calcula como cociente entre la desviación típica y la media de la muestra.
|
Cy = 0,.0320 / 1,253 Cy = 0,0255 |
El interés del coeficiente de variación es que al ser un porcentaje permite
comparar el nivel de dispersión de dos muestras. Esto no ocurre con la desvación
típica, ya que viene expresada en las mismas unidas que los datos de la serie.
Por ejemplo, para comparar el nivel de dispersión de una serie de datos de la
altura de los alumnos de una clase y otra serie con el peso de dichos alumnos,
no se puede utilizar las desviaciones típicas (una viene vienes expresada en m
y la otra en kg). En cambio, sus coeficientes de variación son ambos
porcentajes, por lo que sí se pueden comparar.