edu.alceres.com

Estadística Medidas No Centrales

Medidas de posición no centrales


Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:

Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Se observa en la figura como las líneas rojas.

Así, el cuartil 1 (Q1) es el valor superior al 25% de los datos menores, el Q2 coincide con la mediana y el Q3 corresponde al dato que supera al 75% de los datos menores.

Para determinar a cuál dato corresponde cada cuartil, se utiliza:

- Q1: Es el dato $\frac{n+1}{4}$
- Q2: Es el dato $\frac{n+1}{2}$
- Q3: Es el dato $3*\frac{n+1}{4}$

Para encontrar el valor preciso, se realiza una interpolación como se explica en el siguiente ejemplo

Ejemplo

Calcule los cuartiles de los siguientes datos correspondientes a las estaturas de los residentes en un conjunto residencial, ya organizados en orden creciente:

#Dato Estat.
1	1,01
2	1,15
3	1,16
4	1,16
5	1,20
6	1,20
7	1,21
8	1,37
9	1,39
10	1,40
11	1,42
12	1,45
13	1,48
14	1,48
15	1,49
16	1,52
17	1,53
18	1,57
19	1,59
20	1,60
21	1,62
22	1,64
23	1,71
24	1,73
25	1,77
26	1,81
27	1,86
28	1,92
29	1,98
30	1,98

Los cuartiles para $n=30$ datos son:

- Q1: Es el dato $\frac{n+1}{4}=\frac{31}{4}=7.75$
- Q2: Es el dato $\frac{n+1}{2}=\frac{31}{2}=15.5$
- Q3: Es el dato $3*\frac{n+1}{4}=3*\frac{31}{4}=23.25$

Solamente el Q2 corresponde al punto medio entre el dato 15 y el 16, es decir al promedio:

$$Q_2=\frac{D_15+D_16}{2}=\frac{1.49+1.52}{2}=1.505$$

Vemos que el $Q_1$ no está en la mitad entre el dato 7 y el dato 8 sino más cerca del dato 8 (trace sobre la recta numérica el 7.75), esto es, como si dividiéramos 7 a 8 en 100 partes y el $Q_1$ está en un 75% más cerca al dato 8 que al dato 7 , la interpolación lineal es:

$$Q_1 = D_7+0.75(D_8-D_7) = 1.21+0.75*(1.37-1.21)=1.33$$

Con un análisis similar para el $Q_3$, en este caso está un 25% después del Dato 23:

$$Q_3 = D_{23}+0.25(D_{24}-D_{23}) = 1.71+0.25*(1.73-1.71)=1.715$$

Diagrama de caja y bigotes o boxplot

Una forma de representación gráfica de los cuartiles es el diagrama de caja y bigotes o boxplot, como se observa en la figura:

Observa que los elementos son:
- Li: Límite inferior, en el extremo del bigote inferior, normalmente coincide con el mínimo salvo que hayan datos atípicos.
- Q1: Primer cuartil en la base de la caja
- Q2: Segundo cuartil o mediana en el intermedio entre el primer y tercer cuartil. No necesariamente está en la mitad de la caja porque depende como se distribuyen los datos
- Q3: Tercer cuartil en la parte superio de la caja.
- Ls: Límite superior en en extremo del bigote superior. Normalmente corresponde al máximo salvo que hayan datos atípicos.
- Datos atípicos: son aquellos que están por debajo del límite inferior o por encima del límite superior.
- RIQ: Rango intercuartílico: Es el rango entre los cuartiles primero y tercero

Los cálculos son:

$$RIQ = Q_3-Q_1$$

Para determinar la longitud máxima de los bigotes y, por consiguiente, establecer si hay datos atípicos, se usan las fórmulas:

$$L_{sup} \leq Q_3+1.5*RIQ$$ $$L_{inf} \geq Q_1-1.5*RIQ$$

Ejemplo

Construya el diagrama Boxplot para los datos de estatura

Los calculos son:

$$RIQ = Q_3-Q_1=1.715-1.33=0.385$$ $$L_{sup}\leq Q_3+1.5*RIQ = 1.715+1.5*0.385=2.2925$$

Como el dato máximo es 1.98, luego el $L_{sup} = 1.98$

$$L_{inf}\leq Q_1-1.5*RIQ = 1.33-1.5*0.385=0.7525$$

Como el dato mínimo es 1.01, luego el $L_{inf} = 1.01$

Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.

Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos (lección 2ª). Los deciles y centiles se calculan de igual manera, aunque haría falta distribuciones con mayor número de datos.
 

Variable Frecuencias absolutas Frecuencias relativas
(Valor) Simple Acumulada Simple Acumulada
         
1,20 1 1 3,3 % 3,3 %
1,21 4 5 13,3 % 16,6 %
1,22 4 9 13,3 % 30,0 %
1,23 2 11 6,6 % 36,6 %
1,24 1 12 3,3 % 40,0 %
1,25 2 14 6,6 % 46,6 %
1,26 3 17 10,0 % 56,6 %
1,27 3 20 10,0 % 66,6 %
1,28 4 24 13,3 % 80,0 %
1,29 3 27 10,0 % 90,0 %
1,30 3 30 10,0 % 100,0 %

1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de la frecuencia.
 

Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente una de las repeticiones.