Medidas estadísticas

puede calcular la desviación típica al extraer la raíz cuadrada de la varianza y ... la desviación estándar, se puede ob
178KB Größe 10 Downloads 123 Ansichten
Medidas estadísticas Medidas de Tendencia Central: Se llaman así debido a que una vez bien calculadas, sus valores tienden a estar ubicadas en el centro de la distribución ordenada. Esta característica la poseen la Media Aritmética y la Mediana. Media Aritmética o Promedio Aritmético: Dada una serie o distribución de valores para la variable aleatoria cuantitativa Xi, matemáticamente se denomina media aritmética al cociente de la sumatoria de los valores dividida entre número de casos. Si los datos corresponden a una población. Xi: X1, X2, X3, ... ,XN, entonces la media aritmética viene expresada así:

μ=

∑ Xi N

Ejemplo: Sea una población formada por los pesos en Kg de cinco niños (Xi: 18 19 20 21 22), calcular e interpretar la media aritmética y mostrar su tendencia central.

μ=

∑ Xi = (18 + 19 + 20 + 21 + 22)Kg = 100 Kg = 20 Kg.

Al colocar la serie de 5 5 N datos ordenada: 18 19 20 21 22, puede notarse que la media aritmética está ubicada en el centro de la serie ordenada, en este caso, la media aritmética coincide con el dato central. Por ese motivo se le llama de tendencia central. Cuando los datos correspondan a una muestra. Xi: X1, X2, X3, ... ,Xn, entonces la media aritmética viene expresada así: X =

∑ Xi

n La media aritmética en muy afectada por los valores extremos de la serie de datos, es decir, al variar sustancialmente uno de los valores extremos, el promedio aritmético varía y se traslada hacia ellos en función de la magnitud de la variación. Por ejemplo, si en la serie anterior suponemos que el quinto niño pesa 32 Kg, entonces la nueva serie es: 18 19 20 21 32 y la nueva media aritmética es:

μ=

∑ Xi = (18 + 19 + 20 + 21 + 32)Kg = 110 Kg = 22 Kg.

5 5 N En este caso la media aritmética de la nueva serie se ha trasladado del centro hacia el extremo superior, lo cual hace que la media aritmética deje de ser representativa de la serie de datos.

Si por el contrario en la serie original se sustituye el primer niño por otro cuyo peso es 8 Kg, entonces la nueva media aritmética es:

μ=

∑ Xi = (8 + 19 + 20 + 21 + 22)Kg = 90 Kg = 18 Kg. N

5

5

Ahora la media aritmética se ha trasladado hacia el extremo inferior, quedando demostrado que un cambio en los valores extremos de una serie hace que la media aritmética se vea afectada. El nivel de afectación depende de la magnitud de los cambios de los valores extremos. Mediana: Dada una serie de valores numéricos (variable cuantitativa: Xi) ordenados, se llama mediana al valor que está ubicado en el centro y por tanto, divide a la serie en dos partes exactamente iguales. Lo anterior implica que para hablar de mediana, necesariamente, los valores deben estar ordenados, de no ser así, no hay posibilidad de definirla y mucho menos calcularla. La mediana por definición siempre estará ubicada en el centro de la distribución ordenada. Por ejemplo en la serie original (Xi: 18 19 20 21 22), la mediana es igual al tercer valor, es decir, Xd = 19 Kg. Véase que la mediana coincide con el dato central, por lo que, antes que ella existe la mitad de N-1 y después, igualmente la mitad de N-1. En este caso, la mitad de (N-1)/2 = (5-1)/2= 4/2 = 2. De allí se deduce que a ambos extremos de la mediana existe igual cantidad de casos. Ejemplo de cálculo manual de la mediana por datos directos sin tabular. Sea Xi, las edades (en años al entero más próximo) de un grupo de jóvenes: 12 15 13 14 15 12 13 14 15 13 13 14 Procedimiento: 1.- Ordenar las edades de menor a mayor: 12 12 13 13 13 13 14 14 14 15 15 15. 2.- Señalar los lugares para cada dato: 1 2 3 4 5 6 7 8 9 10 11 12 3.- Calcular el lugar ocupado por la mediana a través de la siguiente expresión: n + 1 12 + 1 13 LuXd = = = = 6,5 . Este implica que la mediana está ubicada en el lugar 6,5, 2 2 2 es decir, está en el centro de los datos (edades) que ocupan los lugares 6 y 7, en otras palabras, entre el último 13 y el primer 14 de la serie ordenada. 4.- En este caso, el valor de la mediana se obtiene de la semisuma de los dos datos referidos, (13 y 14), por lo tanto: 13 + 14 27 = = 13,5 años 2 2 5.- Interpretación: A ambos extremos del valor (Xd = 13,5 años) se ubica el 50 por ciento de los jóvenes. Observación: Cuando el número de datos es un número par, puede hacerse la interpretación asegundo que a ambos extremos de la mediana se concentra el 50 por ciento de los casos. Si el número de valores es impar, no se cumple la ubicación del 50 por ciento a ambos lados de la mediana. En esta segunda situación, siempre será cierto que Xd =

teóricamente el dato central coincide con la mediana y la mitad del resto ((n-1)/2) se concentrará a ambos extremos de esta medida. Tanto la media aritmética como la mediana se calculan exclusivamente en Variables cuantitativas (discretas y continuas) y para cada distribución de variables cuantitativas, estas medidas son únicas, en otras palabras, para cualquier serie de datos numéricos, existe una sola media aritmética y una sola mediana. Moda. La moda de una serie o distribución se define como el valor que más se repite, el más frecuente o el valor alrededor del cual se concentra la mayor cantidad de casos posibles. La moda tiene la particularidad de ser la única medida estadística que se puede obtener en variables cualitativas. Por otra parte, la moda también se constituye en la única medida estadística que en una distribución pudiera no existir. Ejemplo 1 de cálculo de la moda en una serie directa sin tabular. Sea Xi la variable formada por los pesos en Kg (aproximado al entero más cercano) de una muestra de niños: 14 15 15 16 17 18. Dado que existe un peso que se repite dos veces (el 15), ese constituye la moda: Xo = 15 años. Cuando una distribución posee una sola moda, se denomina unimodal. Ejemplo 2: Ubicar la(s) moda(s) de la serie formada por los puntajes de una muestra de 7 estudiantes que presentaron una prueba objetiva de Castellano de séptimo grado: 12 14 14 15 16 16 17. Debido a que hay dos puntajes que se repiten igual cantidad de veces (14 y 16), entonces existen dos modas. Xo1 = 14puntos y Xo2 = 16 puntos. En casos como estos, la distribución se llama bimodal por existen dos modas. Si la distribución posee más de dos modas, se denomina polimodal. Cuando la distribución carezca de moda, se le llama amodal.

Cálculo manual de las medidas de tendencia central y la moda por datos directos tabulados Calcular e interpretar las medidas de tendencia central y la moda en la distribución del número de hermanos k 8 7 6 5 4 3 2 1

Xi 7 6 5 4 3 2 1 0 ∑

fk 5 7 17 11 4 8 3 1 56

Xi*fk 35 42 85 44 12 16 3 0 237

Fk 56 51 44 27 16 12 4 1

kk 0,0893 0,1250 0,3036 0,1964 0,0714 0,1429 0,0536 0,0178 1,0000

Cálculo manual (forma directa y por intervalos de clase), interpretación.

Xi*hk 0,6251 0,75 1,518 0,7856 0,2142 0,2858 0,0536 0 4,2323

Media Aritmética: Para calcular esta medida estadística en una tabla de frecuencias por datos directos, se utiliza la siguiente fórmula: X =

∑ fk * Xi . El procedimiento de cálculo según esta expresión es el siguiente:

n 1.- Multiplicar cada valor de la variable por la correspondiente frecuencia ordinaria absoluta: fk.Xi. Ver resultados en la cuarta columna de la tabla anterior. 2.- Sumar los productos precedentes para obtener: ∑ fk * Xi = 237

3.- Sustituir en la fórmula para conseguir el valor de la media aritmética: ∑ fk * Xi = 237 = 4,23 hermanos X = n 56 4.- Interpretación: El promedio aritmético de hermanos en las familias encuestadas es de aproximadamente 4,23. 5.- Otra forma de calcular la media aritmética en este tipo de distribuciones de frecuencias es a través de la siguiente fórmula basada en las frecuencias ordinarias relativas (hk): X = ∑ hk * Xi = 4,23 hermanos . Ver resultados en la tabla correspondiente. Mediana: Para calcular la mediana por datos no agrupados tabulados, el procedimiento es el siguiente: 1.- Obtener el lugar de ubicación de la mediana mediante la siguiente expresión: n + 1 56 + 1 LuXd = = = 28,5 2 2 2.- Según este resultado, la mediana está centrada entre los valores ubicados en las posiciones 28 y 29, por lo que, de acuerdo con la tabla de frecuencias estos dos valores están situados en la casilla número 6, donde existe una acumulado de 44 valores y en ella 17 datos iguales a 5, lo que implica que en esa clase o categoría, están las posiciones desde la 28 hasta la 44. Véase que hasta la casilla precedente (la número 5) hay 27 valores acumulados. Siendo entonces los dos valores de interés iguales a 5, la mediana es igual a la semisuma de ellos dos Xd =

5 + 5 10 = =5 2 2

3.- Interpretación: El 50 por ciento de los valores son iguales o menores 5 y el resto, es mayor o igual que 5. Tómese en cuenta que existen varios valores iguales (el 5 se repite 17 veces), por tal motivo, conviene que en la Interpretación se inserten los términos menores o iguales y mayores o iguales, para no correr el riesgo de cometer error. Moda: Siendo la moda el valor que más se repite, entonces su valor se consigue al observar la frecuencia ordinaria absoluta mayor (fkmayor, también conocida como frecuencia modal =

fo) y localizar el valor que corresponde a esa frecuencia y de esta manera se obtiene el valor de la moda. Por ejemplo, en la distribución de frecuencias anterior la moda es el valor al cual le corresponde la frecuencia ordinaria absoluta mayor (fk = 17 de la categoría número ). Lo anterior implica que el valor que más se repite es el 5 (17 veces) Cálculo de las Medidas de Tendencia Central y la Moda mediante el Procesador Statgraphics Plus. Ejemplo: Del archivo “Lisandro Ramírez” del Procesador Estadístico Statgraphics Plus calcule las medidas de tendencia central y la moda del número de hermanos. Procedimiento: 1.- Active Describe, Numeric Data, One-Variable Análisis. 2.- Seleccione y entre la variable “Número de hermanos”, pulse Ok. 3.- Elegir el icono amarillo (Opciones Tabulares), deseleccione “Resumen Analítico” (Summary Analysis). 4.- Seleccionar Resumen de Estadísticos (Summary Statistics) y pulse Ok. 5.- En la salida, de las tres medidas (media aritmética = Average, mediana = median y moda = mode) solo aparece la primera de ellas. Para obtener las otras dos, siga este Procedimiento: 5.1.- Estando el Apuntador del Mouse sobre la salida, haga clic con el botón Derecho y elija “Panel de Opciones. 5.2.- Seleccione Average, Median y Mode, deseleccione lo demás y haga clic en OK. Los valores de la tres medidas son: X = 4,23 Xd = 5 Xo = 5 Cálculo de las Medidas de Tendencia Central y la Moda mediante el Procesador SPSS 10. Del archivo “Lisandro Ramírez” del Procesador Estadístico SPSS 10, calcule las medidas de tendencia central y la moda del número de hermanos. Procedimiento: 1.- Activar el menú “Analizar”, la opción “Estadísticos descriptivos” y la subopción “frecuencias”. 2.- Seleccionar y entrar la variable en “Variables”. 3.- Pulsar en “Estadísticos”, seleccionar Media aritmética, Mediana y Moda, activar “Continuar” y Aceptar. X = 4,23 Xd = 5 Xo = 5 Cálculo Manual de las Medidas de Tendencia Central y la Moda por intervalos de clase Ejemplo: Calcular las medidas de tendencia central y la moda para los puntajes logrados por los alumnos de la sección “B” de noveno grado de la Escuela Básica “Valeria

Alexandra” en una prueba objetiva de Biología de 32 ítemes con cuatro alternativas cada uno. Nk 10 9 8 7 6 5 4 3 2 1

Xi – Xs 30,45 – 31,73 29,17 – 30,45 27,89 – 29,17 26,61 – 27,89 25,33 – 26,61 24,05 – 25,33 22,77 – 24,05 21,49 – 22,77 20,21 – 21,49 18,93 – 20,21 ∑

Xm 31,09 29,81 28,53 27,25 25,97 24,69 23,41 22,13 20,85 19,57

fk 6 9 3 1 0 4 3 5 4 5 40

Fk 40 34 25 22 21 21 17 14 9 5

fk.Xm

hk

hk*Xm

186,54 268,29 85,59 27,25 0 98,76 70,23 110,65 83,4 97,85

0,15 0,225 0,075 0,025 0 0,1 0,075 0,125 0,1 0,125

4,6635 6,70725 2,13975 0,68125 0 2,469 1,75575 2,76625 2,085 2,44625

1028,56

1

25,714

Cálculo de la Media Aritmética. Para obtener la media aritmética por datos agrupados en intervalos de clase se utiliza la siguiente fórmula: X =

∑ fk * Xm n

Procedimiento: 1.- Construida la tabla de frecuencias por datos agrupados en intervalos de clase, calcule los puntos medios o marcas de clase. 2.- Multiplique en cada intervalo, la frecuencia ordinaria absoluta (fk) y el punto medio (Xm) 3.- Haga la sumatoria de los productos anteriores 4.- Sustituir en la fórmula: X =

∑ fk * Xm = 1028,56 = 25,71 puntos

n 40 5.- Interpretación: Los alumnos de octavo grado que presentaron la prueba objetiva de Biología lograron un promedio aritmético de aproximadamente 25,71 puntos.

Existe otra fórmula para calcular la media aritmética en una distribución agrupada en intervalos de clase. Su expresión está en función de las frecuencias ordinarias relativas y los puntos medios o marcas de clase. X = ∑ hk * Xm = 25,71 puntos . Puede notarse que el resultado obtenido es exactamente igual encontrado con la primera fórmula.

Cálculo de la Mediana. Para conseguir el valor de la mediana en una distribución por datos agrupados en intervalo de clase se emplea la siguiente expresión:

n − F(k −1) Xd = Xi + 2 * ic , donde: fk Xi = Es el límite aparente inferior del intervalo que contiene a la mediana n = Es el tamaño de la muestra F(k-1) = Es la frecuencia acumulada absoluta del intervalo anterior al intervalo que contiene a la mediana. ic = Es la amplitud de los intervalo de la distribución de frecuencias. fk = Es la frecuencia absoluta ordinaria del intervalo que contiene a la mediana. Procedimiento: 1.- Se calcula el lugar de ubicación de la mediana a través de la expresión: n 40 = = 20 2 2 2.- Se ubica el lugar en la columna de las frecuencias acumuladas absolutas en un valor que sea igual al lugar o inmediatamente mayor. El lugar 20 está contenido en el intervalo número 5 (k = 5) dado que en éste están los lugares desde el 19 hasta el 21. Esta ubicación es clave, debe hacerse de forma correcta, porque de no ser así, los demás valores de la fórmula serán errados. En este ejemplo los demás valores son los siguientes: Xi = 24,05; f5 = 4; F(k-1) = F(5-1) = F4 = 17; ic = 27,89 – 26,61 = 1,28. 3.- Sustituir en la fórmula: LuXd =

n − F(k −1) 20 − 17 * ic = 24,05 + Xd = Xi + 2 *1,28 = 24,05 + 1,28 = 25,33 puntos fk 3 4.- Interpretación: Dado que el número de casos es par (n = 40) se puede decir que el 50 por ciento de los alumnos lograron puntajes menores o iguales que 25,33 puntos y el otro 50 por ciento tienen puntajes mayores o iguales que 25,33 puntos. Cálculo de la Moda: En el caso de distribuciones agrupadas en intervalos de clase, nosotros vamos a suponer como moda el valor del punto medio del intervalo modal, es decir, aquel en el que exista la mayor frecuencia absoluta ordinaria. El intervalo modal es el número 9 al cual le corresponde una frecuencia ordinaria absoluta (fo = 9). El punto medio es igual a 29,81, por lo tanto, la moda es: Xo = 29,81 puntos. Interpretación: El puntaje que se repite mayor cantidad de veces (9) está próximo a 29,81 puntos. Cálculo de las Medidas de Tendencia Central y la Moda mediante los Procesadores Estadísticos Statgraphics Plus y SPSS 10. El procedimiento en cada caso es el mismo explicado con anterioridad.

Relación entre las medidas de tendencia central y la moda (Asimetría). Cuando se comparan las medidas de tendencia central y la moda, siempre que la distribución sea unimodal, se pueden obtener las siguientes relaciones: 1.- Las tres medidas son iguales entre sí: X = Xd = Xo . Entonces la distribución es Simétrica. 2.- Las tres medidas son diferentes entre sí: X ≠ Xd ≠ Xo . Siendo así, la distribución es Asimétrica. La relación entre las dos medidas tendencia central (media aritmética y mediana) y la moda, permite determinar de qué manera se da la concentración de valores en ambos extremos de la media aritmética. El que la distribución sea simétrica implica que a ambos extremos de la media aritmética se ubica el 50 por ciento de los valores de la serie; en otras palabras, si las tres medidas estadísticas referidas son iguales entre sí, significa que existe un perfecto equilibrio entre la cantidad de datos situados a los dos lados de la media aritmética. Por otra parte, si las tres medidas son diferentes, entonces la distribución es asimétrica, lo cual quiere decir a uno de los extremos de la media aritmética se concentra más del 50 por ciento de los casos. Cuando se da la diferencia entre las tres medidas en referencia, se pueden presentar dos casos: 2.1.- Si X > Xd > Xo , la distribución es asimétrica positiva, lo cual significa que más del 50 por ciento de los datos son menores que la media aritmética. 2.2.- Cuando X < Xd < Xo , entonces la distribución es asimétrica negativa, lo cual indica que más del 50 por ciento de los casos son mayores que la media aritmética. Observaciones: 1.- Si la distribución posee más de una moda, hágase la comparación entre la media aritmética y la mediana. 2.- Si la mediana y la moda son iguales entre si, procédase igual que en el caso anterior. Ejemplo: compare las medidas de tendencia central y la moda. Diga cómo es la concentración de datos a ambos extremos de la media aritmética en la distribución de la variable número de hermanos. Comparación: X = 4,23 < Xd = 5 . La distribución es asimétrica negativa, por lo tanto, más del 50 por ciento de los valores son mayores que la media aritmética. Ejemplo: compare las medidas de tendencia central y la moda. Diga cómo es la concentración de alumnos a ambos extremos de la media aritmética en la distribución de la puntajes obtenidos en la prueba objetiva de Biología de noveno grado. Media aritmética = 25,71, Mediana = 25,33, Moda = 29,81. Tal como se dijo previamente, para determinar la

asimetría de una distribución, si la hubiere, es suficiente con comparar la media aritmética y la mediana. Ver observación precedente. X = 25,71 > Xd = 25,33 . De acuerdo con esta relación, la distribución de la prueba de Biología es asimétrica positiva, lo cual implica que más del 50 por ciento de los alumnos lograron puntajes inferiores a la media aritmética.

Observación: Al obtener las medidas de tendencia central y la moda utilizando alguno de los paquetes estadísticos, se tienen los siguientes resultados: media aritmética = 25,73, mediana = 24,63 y en el caso de la moda, existen cinco valores que se repiten igual cantidad de veces (3): 19,35; 24,56; 28,75; 29,46 y 30,09 puntos. Es importante recordar que cuando las medidas estadísticas se calculan en distribuciones de frecuencias agrupadas en intervalos de clase, estás presentan diferencias con las obtenidas para la misma distribución al emplear los paquetes estadísticos dado que en la medida en que aumente la amplitud de los intervalos, también aumenta el error de cálculo por agrupamiento.

Medidas de Orden. Estas medidas se llaman así dado que permiten ubicar la posición de un valor de la variable siempre que la distribución esté ordenada. Por ejemplo, en una serie ordenada es posible definir los percentiles (Xpi) al dividirla en 100 partes iguales. 1 25 50 75 100 En la gráfica antecedente, se indican algunos de los percentiles (Xpi) de la distribución de una variable Xi cualesquiera. El percentil 25 (Xp25) indica que por debajo de ese valor se encuentra el 25 por ciento de los demás datos y por lógica por encima de él, se ubica el 75 por ciento de los demás valores. De igual manera sucede con los percentiles 50 y 75. El percentil cero (Xp0) corresponde al dato menor de la Variable e implica que por debajo de él no existe ningún valor y por encima está el cien por ciento. El dato mayor corresponde al percentil 100, por debajo de él se ubica el cien por ciento. Lo anterior significa que para efecto de cálculo de los percentiles, se hacen con todos los ubicados entre 0 y 100 debido que éstos al conocer los valores extremos, automáticamente son conocidos y por lógica no es necesario calcularlos, al menos que se tengan deficiencias conceptuales. Deciles (Di): Se obtienen cuando la distribución ordenada es dividida en 10 partes iguales. Los deciles tienen sus correspondientes en los percentiles, es decir, D1 = Xp10, D2 = Xp20, D3 = Xp30, D4 = Xp40, D5 = Xp50, D6 = Xp60, D7 = Xp70, D8 = Xp80, D9 = Xp90, D10 = Xp100. Para efecto de cálculos, se realizan desde el 1 hasta el 9, dado que el decil 10 equivale al percentil 100 y éste corresponde al dato mayor de la distribución. Cuartiles (Qi): Estas medidas de orden se obtienen cuando la distribución ordenada es dividida en cuatro partes iguales. Igual que los deciles, los cuartiles tienen sus equivalentes

en los percentiles. Q1 = Xp25, Q2 = Xp50, Q3 = Xp75. Las medidas de orden (Percentiles, Deciles y Cuartiles y otras), en conjunto se denominan Cuantiles.

Cálculo Manual de Percentiles, Deciles y Cuartiles (Datos Directos). Interpretación Cuando los datos están sin agrupar, para calcular las tres medidas de orden ya definidas, se utiliza la siguiente fórmula: Xpi = Xi + ( Xs − Xi ) * R , donde: Xpi = Es el percentil que se desea hallar Xi = Es el dato inferior al percentil deseado Xs = Es el dato superior o inmediatamente posterior al percentil buscado. R = Es la diferencia entre el lugar del dato mayor menos el lugar del percentil a conseguir R = LugXs – LugXpi.

Ejemplo. Sea la variable Xi formada por los puntajes logrados por un grupo de alumnos de séptimo grado en una prueba objetiva de Castellano: 10 14 12 11 10 15 14 11 16 17 18 17. Calcular: a) el percentil 26, b) Decil 4, c) Cuartil 3. Procedimiento Parte a: 1.- Es necesario ordenar los (n = 12) puntajes de menor a mayor y colocarles las posiciones o lugares. Xi: 10 10 11 11 12 14 14 15 16 17 17 18 Lugar: 1 2 3 4 5 6 7 8 9 10 11 12 2.- Calcular el lugar del percentil incógnita (Xp26) mediante la expresión: p*n LugXpi = 100 Siendo n el número de datos de la serie o distribución (en este caso, n = 12) y p el valor del porcentaje correspondiente al percentil (p = 26).

p * n 26 * 12 = = 3,12 100 100 3.- Este resulta indica que el percentil buscado está ubicado entre el dato que ocupa la posición 3 y el que ocupa la posición 4, es decir, las puntuaciones (Xi = 11 y Xs = 11). LugXp 26 =

4.- Se halla el valor de R (diferencia entre los lugares del dato superior al percentil incógnita y el del percentil a calcular): R = 4 – 3,12 = = 0,88. 5.- Sustituir en la fórmula correspondiente:

Xp 26 = Xi + ( Xs − Xi ) * R = 11 + (11 − 11) * 0,88 = 11 puntos 6.- Interpretación: El puntaje por debajo del cual se encuentra el 26 por ciento de los alumnos que presentaron la prueba objetiva de Castellano de séptimo grado es igual a 11. En otras palabras, el 26 por ciento de los alumnos obtuvo puntajes menores o iguales a 11 puntos. Procedimiento Parte b: Decil 4 Xi: 10 10 11 11 12 14 14 15 16 17 17 18 Lugar: 1 2 3 4 5 6 7 8 9 10 11 12 Recuerde que el D4 = Xp40. p * n 40 * 12 = = 4,8 100 100 2.- Ubicar los datos inmediatos inferior y superior al percentil 40: Xi = 11 y Xs = 12 3.- Hallar el valor de R = 5 – 4,8 = 0,2 4.- Sustituir en la fórmula para calcular el decil 4 o percentil 40 Xp 26 = Xi + ( Xs − Xi ) * R = 11 + (12 − 11) * 0,2 = 11,2 puntos 5.- Interpretación: El 40 por ciento de los alumnos obtuvo puntajes menores o iguales que 11,2 puntos. Procedimiento Parte c: Q3 = Xp75.

1.- Hallar el lugar que ocupa el decil 4: LugXp 40 =

Xi: 10 10 11 11 12 14 14 15 16 17 17 18 Lugar: 1 2 3 4 5 6 7 8 9 10 11 12 p * n 75 * 12 = =9 100 100 2.- Localizar los datos inmediatos al percentil a determinar, conseguir el valor de R y sustituir en la fórmula correspondiente: Como en este caso el lugar del percentil a calcular es un número entero exacto, implica que el percentil incógnita es el dato que ocupa ese lugar, por lo tanto, el Q3 = 16 puntos 3.- Interpretación: El 75 por ciento de los alumnos obtuvo calificaciones iguales o menores que 16 puntos.

1.- Conseguir el lugar del cuartil 3: LugXp 75 =

Cálculo Manual de Percentiles, Deciles y Cuartiles (Datos Agrupados). Interpretación Calcular e interpretar los siguientes cuantiles en la distribución de la prueba objetiva de Biología de noveno grado: a) Percentil 60, b) Decil 5 y c) Cuartil 1. Nk 10 9 8 7 6

Xi – Xs 30,45 – 31,73 29,17 – 30,45 27,89 – 29,17 26,61 – 27,89 25,33 – 26,61

Xm 31,09 29,81 28,53 27,25 25,97

fk

Fk

6 9 3 1 0

40 34 25 22 21

5 4 3 2 1

24,05 – 25,33 22,77 – 24,05 21,49 – 22,77 20,21 – 21,49 18,93 – 20,21 ∑

24,69 23,41 22,13 20,85 19,57

4 3 5 4 5

21 17 14 9 5

40

Cuando los datos están agrupados en intervalos de clase, se utiliza la siguiente fórmula para calcular percentiles. Esta expresión es la misma empleada en el cálculo de la medina por datos agrupados. Véase que si en esta fórmula se sustituye “p” por el valor 50 (Xp50), se obtiene la fórmula de la mediana. Esto implica entonces que aplicarla es seguir los mismos pasos utilizados para obtener la mediana por datos agrupados en intervalos de clase. p*n − F(k −1) Xpi = Xi + 100 * ic fk Procedimiento parte a: Percentil 60 p * n 60 * 40 = = 24 100 100 2.- De acuerdo con el resultado anterior, ubicar en la tabla de frecuencias los demás valores necesarios para el cálculo: k = 8, Xi = 27,89; F(8-1) = F7 = 22, fk = f8 = 3, ic = 1,28. 3.- Sustituir en la fórmula:

1.- Hallar el lugar de ubicación del percentil 60: LugXp 60 =

p*n − F(k −1) 24 − 22 Xp 60 = Xi + 100 * ic = 27,89 + * 1,28 = 27,89 + 0,85 = 28,74 puntos fk 3 4.- Interpretación: El 60 por ciento de los alumnos que presentaron la prueba objetiva de Biología de noveno grado lograron puntajes menores o iguales que 28,74 puntos. Procedimiento parte a: Decil 5 p * n 50 * 40 = = 20 100 100 2.- Ubicar los demás valores que aparecen en la fórmula correspondiente: k = 5, Xi = 24,05; F(5-1) = F4 = 17, fk = f5 = 4, ic = 1,28. 3.- Sustituir en la fórmula:

1.- Hallar el lugar de ubicación del percentil 50: LugXp 50 =

Xp50

p*n − F(k −1) 20 − 17 = Xi + 100 * ic = 24,05 + * 1,28 = 24,05 + 1,28 = 25,33 puntos fk 3

4.- Interpretación: El 50 por ciento de los alumnos obtuvo notas menores o iguales a 25,33 puntos y el otro 50 por ciento se ubicó en puntajes mayores o iguales que 25,33 puntos. Procedimiento parte a: Cuartil 1 p * n 25 * 40 = = 10 100 100 2.- Ubicar los demás valores que aparecen en la fórmula correspondiente: k = 3, Xi = 21,49; F(3-1) = F2 = 9, fk = f3 = 5, ic = 1,28. 3.- Sustituir en la fórmula:

1.- Hallar el lugar de ubicación del percentil 25: LugXp 25 =

p*n − F(k −1) 10 − 9 100 Xp 25 = Xi + * ic = 21,49 + * 1,28 = 21,49 + 0,26 = 21,75 puntos fk 5 4.- Interpretación: El 25 por ciento de los alumnos que presentaron la prueba objetiva de Biología lograron puntajes menores o iguales que 21,75 puntos. Cálculo de Percentiles, Deciles y cuartiles a través del Procesador Statgraphics Plus. Ejemplo: Calcule e interprete los percentiles 25, 50 y 75, los deciles 1 y 6 y los cuarrtiles 1 y 2 mediante el Procesador Statgraphics Plus, en la prueba de Biología de noveno grado. Procedimiento: 1.- Active el menú Describe, Numeric Data y Análisis de una Variable. 2.- Seleccione e introduzca la variable Biología y pulse OK. 3.- Active Opciones Tabulares y pulse OK. 4.- Realice las interpretaciones para cada resultado Cálculo de Percentiles, Deciles y cuartiles a través del Procesador SPSS 10. Ejemplo: Calcule e interprete los percentiles 25, 50 y 75, los deciles 1 y 6 y los cuarrtiles 1 y 2 mediante el Procesador SPSS 10, en la prueba de Biología de noveno grado. Procedimiento: 1.- Activar Analizar, Estadísticos descriptivos, Frecuencias. 2.- Introducir la variable, activar Estadísticos, seleccionar Percentiles. 3.- Anotar cada percentil, pulsar Añadir en cada caso, Continuar al finalizar la entrada de éstos y Aceptar. 4.- Realizar las interpretaciones: Rango Percentil (Definición y cálculo: Procedimiento Manual, interpretación). El rango percentil es una medida estadística que implica lo contrario de los percentiles. En el caso de los percentiles, se conoce un porcentaje o requiere buscar el valor de la variable por debajo del cual se encuentra el porcentaje dado; mientras que, en el rango percentil, se

conoce el valor de la variable y se pide calcular el porcentaje de casos ubicados por debajo del valor. La fórmula para calcular el rango percentil se puede deducir u obtener al despejar de la fórmula para determinar los percentiles. Veamos cómo conseguir la expresión del Rango Percentil cuando la distribución es por Datos Directos Tabulados o no.

Pxi =

⎤ 100 ⎡ Xi − X inf + lx inf ⎥ , donde: ⎢ n ⎣ X sup− X inf ⎦

Pxi= Es el rango percentil buscado Xinf = Es el valor inferior inmediato a Xi Xsup = Es el valor superior inmediato a Xi lxinf = Es el lugar que ocupa Xi n = Es la cantidad de valores de la serie Ejemplo 1: Sea la variable Xi formada por los puntajes logrados por un grupo de alumnos de séptimo grado en una prueba objetiva de Castellano: 10 14 12 11 10 15 14 11 16 17 18 17. Calcular el porcentaje de alumnos cuyos puntajes sean menores o iguales 15. Procedimiento: 1.- Ordenar los puntajes de menor a mayor y colocar las posiciones Xi: 10 10 11 11 12 14 14 15 16 17 17 18 Lugar: 1 2 3 4 5 6 7 8 9 10 11 12 2.- Se extraen los valores de los términos que contiene la fórmula para calcular el rango percentil por datos directos. n = 12, Xi = 15, P(x=15)= ?, Xinf = 14, Xsup = 16, lxinf = 8 P( Xi =15 ) =

⎤ 100 ⎡15 − 14 100 ⎡ Xi − X inf ⎤ + lx inf ⎥ = + 6⎥ = 8,33[0,5 + 6] = 54,15% ⎢ ⎢ n ⎣ X sup − X inf ⎦ ⎦ 12 ⎣16 − 14

Interpretación: El 54,15 por ciento de los alumnos lograron puntajes menores o iguales que 15 puntos.

Expresión para obtener el Rango Percentil cuando la distribución es por Datos Agrupados en intervalos de clase. 100 ⎡ ( Xcon − Xi ) * fk ⎤ + F(k −1) ⎥ , en la que: ⎢ n ⎣ ic ⎦ Pxi = es el rango percentil buscado Pxi =

n = Es el número de datos de la distribución Xcon = Representa el dato conocido Xi = Es el límite inferior del intervalo de clase que contiene a Xcon fk = Es la frecuencia absoluta ordinaria del intervalo que contiene al dato conocido (Xcon) F(k-1) = Es la frecuencia acumulada del intervalo anterior al que contiene el valor conocido ic = Es la amplitud de los intervalos de clase Ejemplo: Calcular e interpretar el porcentaje de alumnos que en la prueba objetiva de Biología de noveno grado obtuvo calificaciones inferiores o iguales a 26,79 puntos. Procedimiento: 1.- Se ubica el valor conocido en el intervalo donde esté contenido. El puntaje Xi = 26,79 está ubicado en el intervalo número 7: 26,61 – 27,89. 2.- Extraer los demás valores correspondientes según la fórmula anterior: Xcon = 26,79, Xi = 26,61; n = 40, ic = 1,28, fk = f7 = 1, F(k-1) = F(7-1) = F6 = 21. 3.- Sustituir los valores en la fórmula y realizar las operaciones correspondientes. Pxi =

100 ⎡ ( Xcon − Xi ) * fk ⎤ + F(k −1) ⎥ ⎢ n ⎣ ic ⎦

100 ⎡ (26,79 − 26,61) *1 ⎤ + 21⎥ = 2,5[0,14 + 21] = 52,85% ⎢ 40 ⎣ 1,28 ⎦ 4.- Interpretación: El 52,85 por ciento de los alumnos que presentaron la prueba objetiva de Biología lograron notas menores o iguales que 26,79 puntos. P( Xi = 26, 79 ) =

Nk 7 6 5

Xi – Xs 26,61 – 27,89 25,33 – 26,61 24,05 – 25,33 ∑

Xm 27,25 25,97 24,69

fk

Fk

1 0 4

22 21 21

40

Medidas de Variabilidad y de Forma: El conocimiento de las medidas de tendencia central (media aritmética y mediana) y la moda, no es suficiente para obtener informaciones que permitan describir totalmente las características de los valores de una distribución de frecuencias. Por ejemplo, esas tres medidas estadísticas no son suficientes para suministrar información referida a la variabilidad o dispersión de los datos. Por tal motivo, es necesario valerse de otras medidas que den informaciones en ese sentido.

En estadística existen medidas que ayudan a describir la dispersión o variabilidad de un conjunto de datos estadísticos. Estas medidas se caracterizan porque permiten detectar el grado de dispersión del grupo de valores, en relación a alguna de las tres medidas previamente citadas y detalladas. La dispersión de la serie de valores, por lo general, está referida a la media aritmética. En otras palabras, la dispersión de un conjunto de casos se refiere al grado en que las observaciones, datos, valores o casos, se diferencian, distancian de la media aritmética. Por ejemplo, las series: Xi: 13 13 13 13 13 con media aritmética = 13 Yi: 11 12 13 14 15, cuya media aritmética = 13 No son iguales entre sí. Entre los valores de la serie Xi y su media aritmética no existen diferencias, es decir, no hay dispersión, por lo que, la distribución es totalmente homogénea. En cambio, en la serie Yi existen diferencias entre los valores y la media aritmética, por lo tanto, en la segunda hay variabilidad o dispersión. En la segunda serie vamos a conseguir los desvíos entre cada valor y la media aritmética. Se entiende por desvío a la diferencia entre cada valor de la variable y la media aritmética. yi = Yi − Y . Se aprovechará la oportunidad para obtener la sumatoria de los desvíos cuadráticos que serán utilizados para obtener la definición matemática de una de las medidas de dispersión. Yi: 11 12 13 14 15 Yi − Y : - 2 -1 0 1 2

(Yi − Y ) : 4 1 0 1 4 ∑ (Yi − Y ) = 4+1+0+1+4 = 10 2

2

Las medidas de dispersión de mayor uso y precisión en Estadística, son la Varianza y la Desviación Típica. Cada una de ellas tiene su símbolo especial a nivel de la población (σ2, σ) y muestral (s2, s). La definición matemática de la varianza es la siguiente:

σ

2

∑ ( Xi − μ ) =

∑ (Xi − X ) =

2

2 2

s : Población : Muestral N n Observación: Cuando se calcula la varianza muestral hay que tomar en cuenta el tamaño de la muestra. Si éste es menor de treinta (n < 30), la varianza muestral se obtiene mediante la siguiente expresión:

∑ (Xi − X ) =

2

s

2

n −1

: varianza muestral cuando n < 30

De acuerdo con cualesquiera de las dos fórmulas anteriores, matemáticamente se entiende que la varianza es el promedio de los desvíos cuadráticos de una serie con respecto a la

media aritmética. Puede notarse en función de la fórmula que la unidad de la varianza es el cuadrado de la unidad en que se expresen los valores de la variable. Si se extrae la raíz cuadrada de la varianza se obtiene la desviación típica o estándar de la distribución. Lo anterior implica que en cualquier distribución, al conocer la varianza se puede calcular la desviación típica al extraer la raíz cuadrada de la varianza y si se conoce la desviación estándar, se puede obtener la varianza, elevando al cuadrado el valor de la desviación típica.

σ=

∑ ( Xi − μ )

2

∑ (Xi − X )

2

: Población : Muestra s= N n Para lograr la interpretación de la dispersión de una serie o distribución se utiliza el Coeficiente de Variación (Cv) que constituye una medida de dispersión relativa dado que se obtiene del coeficiente entre la desviación típica y la media aritmética correspondiente. Se estila multiplicar 100 el cociente anterior para expresarlo en porcentaje. El coeficiente de variación permite determinar entre otras características: el grado de dispersión de la serie, el poder de discriminabilidad de una prueba y el grado de representatividad de la media aritmética. El poder o la capacidad de discriminabilidad de una prueba se refiere al echo de ésta puede diferenciar a los alumnos en función de los niveles de rendimiento alcanzado en ésta. Si las puntuaciones son todas iguales entre sí, la prueba no discrimina, por lo tanto, en la medida en que exista mayor dispersión, mayor será el poder discriminativo. La representatividad de la media aritmética tiene que ver con que ésta represente al grupo de valores de la distribución. Considérese que la media aritmética alcanza su mayor representatividad cuando la serie es cien por ciento homogénea, es decir, cuando todos los valores son iguales entre y por lo tanto, iguales a la media aritmética (no existe dispersión). Sin embargo, en la medida en que va aumentando la dispersión, entonces la media aritmética va perdiendo representatividad. Escala utilizada para ubicar el grado de dispersión, discriminabilidad de la prueba y representatividad de la media aritmética en función del Coeficiente de Variación Cv Dispersión Discriminabilidad Representatividad de la X 81 – 100 61 – 80 41 – 60 21 – 40 01 – 20 0

Muy alta Alta Moderad o Normal Baja Muy baja Nula

Muy elevada Elevada Normal Baja Muy baja Nula

Fuente: Autor

s Cv = *100 X

Muy baja Baja Normal Alta Muy alta Perfecta

Observación: Motivado a que el coeficiente de variación de cualquier distribución de frecuencias normalmente oscila en el intervalo cerrado cero y 100, es posible establecer una escala que facilita determinar el grado de dispersión de la distribución referida. Estas escalas son arbitrarias y varían de un autor a otro. Cálculo Manual de las Medidas de Dispersión en una Distribución por Datos Directos: Interpretar la dispersión de los pesos expresados en Kg de cinco niños (11,12,13,14,15). Procedimiento: 1.- Para interpretar la dispersión de una serie, tal como se explicó previamente, es necesario tener el valor del coeficiente de variación. Por lo tanto, se calcula la varianza, la desviación estándar y por último la medida de dispersión relativa. 2.- Se halla el valor de la media aritmética (13 Kg) 3.- Se obtienen los desvíos de cada valor Xi respecto a la media aritmética 4.- Se elevan al cuadrado los desvíos precedentes y se suman éstos. 5.- Sustituir en la fórmula de la varianza muestral tomando en cuanta la observación referida la tamaño de la muestra. Yi: 11 12 13 14 15 Yi − Y : - 2 -1 0 1 2

(Yi − Y ) : 4 1 0 1 4 ∑ (Yi − Y ) = 4+1+0+1+4 = 10 2

2

∑ (Xi − X ) =

2

10 Kg 2 10 Kg 2 = = 2,5 Kg 2 5 −1 4 n −1 6.- Calcular la desviación estándar s

2

=

∑ (Xi − X )

2

s=

n −1

= 2,5 Kg 2 = 1,58 Kg.

s 1,58 * 100 = 12,15% * 100 = 13 X 8.- Ubicar en la tabla, el valor del coeficiente de variación para determinar los grados de dispersión de la serie, de discriminabilidad y representatividad de la media aritmética. 7.- Hallar el coeficiente de variación: Cv =

9.- Interpretación: Los valores presentan una dispersión muy baja con respecto a la media aritmética. Existe una capacidad muy baja para separar a los niños en grupos según los pesos. La media aritmética posee un altísimo grado de representatividad de los valores de la serie.

Cálculo Manual de las Medidas de Dispersión en una Distribución por Datos Directos Tabulados: Para calcular la varianza en una distribución de frecuencias por datos directos tabulados, se emplea la siguiente fórmula:

∑ fk * (Xi − X ) =

2

s

2

n

∑ fk * (Xi − X ) =

2

Cuando n ≥ 30

s

2

n −1

Cuando n

< 30 Ejemplo: Calcular las medidas de dispersión y hacer la interpretación para la distribución del número de hermanos por familia. k

Xi

fk

fk*Xi

8 7 6 5 4 3 2 1

7 6 5 4 3 2 1 0

5 7 17 11 4 8 3 1 56

35 42 85 44 12 16 3 0 237

(

fk * Xi − X

)

2

53,7103 18,7974 2,9645 0,2116 4,5387 9,9458 10,4329 0 100,6012

Procedimiento: 1.- De acuerdo con la fórmula, se requiere obtener el valor de la media aritmética X =

∑ fk * Xi = 237 = 4,23

n 56 2.- Obtener los productos de las frecuencias ordinarias absolutas y los desvíos cuadráticos y

(

)

2

luego sumarlos: ∑ fk * Xi − X = 100,6012

∑ fk * (Xi − X ) =

2

3.- Sustituir en la fórmula correspondiente: s

2

n

=

100,6012 = 1,7965 56

4.- Hallar la desviación típica: s = 1,7965 = 1,34 s 1,34 * 100 = * 100 = 31,68% 4,23 X 6.- Ubicar el resultado en la tabla para interpretar el coeficiente de variación: El valor 31,68% está situado en el intervalo 21 – 40 que corresponde a una dispersión “Baja”. 7.- Interpretación: Los valores del número de hermanos presentan una baja dispersión con respecto a la media aritmética. 5.- Calcular el coeficiente de variación: Cv =

Cálculo Manual de las Medidas de Dispersión en una Distribución por Datos Agrupados:

La expresión para calcular la varianza en una distribución por datos agrupados en intervalos de clase, es la siguiente:

∑ fk * (Xm − X ) =

2

s

2

n

Ejemplo: Calcular las medidas de dispersión y realizar la interpretación para la distribución de los puntajes de la prueba objetiva de Biología de noveno grado.

(

Nk

Xi – Xs

Xm

fk

Fk

fk*Xm

10 9 8 7 6 5 4 3 2 1

30,45 – 31,73 29,17 – 30,45 27,89 – 29,17 26,61 – 27,89 25,33 – 26,61 24,05 – 25,33 22,77 – 24,05 21,49 – 22,77 20,21 – 21,49 18,93 – 20,21 ∑

31,09 29,81 28,53 27,25 25,97 24,69 23,41 22,13 20,85 19,57

6 9 3 1 0 4 3 5 4 5

40 34 25 22 21 21 17 14 9 5

186,54 268,29 85,59 27,25 0 98,76 70,23 110,65 83,4 97,85 1028,56

40

Procedimiento: 1.- Hallar el valor de la media aritmética de la distribución: X =

fk * Xm − X

)

2

173,6664 151,29 23,8572 2,3716 0 4,1616 15,87 64,082 94,4784 188,498 718,2752

∑ fk * Xm = 25,71 puntos

n 2.- Calcular los productos de las frecuencias absolutas ordinarias y los desvíos cuadráticos,

(

)

2

y luego obtener la suma: ∑ fk * Xm − X = 718,2752 3.- Sustituir en la fórmula para obtener el valor de la varianza:

∑ fk * (Xm − X ) =

2

718,2752 = 17,9569 puntos 2 n 40 4.- Hallar la desviación estándar: s = 17,9569 = 4,24 puntos 5.- Calcular el coeficiente de variación: s 4,24 Cv = * 100 = * 100 = 16,49% 25,71 X s

2

=

6.- Ubicar el resultado del coeficiente de variación en la escala para interpretar la dispersión: El valor está contenido en el intervalo 01 – 20, para el cual corresponde una dispersión “Muy baja”. 7.- Interpretación: Los puntajes observados en la prueba objetiva de Biología por los alumnos de noveno grado, presentaron una dispersión muy baja con respecto a la media aritmética.

Cálculo de las Medidas de Dispersión mediante el Procesador Statgraphics Plus Procedimiento: 1.- Activar el menú Describe, opción Numeric Data, Análisis de una variable. 2.- Seleccionar, Entrar la variable de interés y pulsar OK. 3.- Pulsar el icono de Opciones Tabulares, deseleccionar Resumen Analítico y elegir Resumen de Estadísticos y OK. 4.- Estando el apuntador encima de la salida, pulse el botón Derecho del Mouse, active Panel de Opciones y OK. 5.- Elija Average (Media aritmética), Variance (Varianza), Standard desviation (Desviación estándar) y Coff of Variation (Coeficiente de Variación) y OK. Media aritmética = 25,73, varianza = 19,92 , desviación típica = 4,44 Cv = 17,26% Cálculo de las Medidas de Dispersión mediante el Procesador SPSS 10 Procedimiento: 1.- Activar el menú Analizar, Estadísticos descriptivos, Frecuencias, entrar la(s) Variable(s). 2.- Pulsar Estadísticos, seleccionar: Desviación típica, Varianza, Media (Media aritmética). 3.- Hacer clic en Continuar y Aceptar. Observación: Dado que el Paquete Estadístico SPSS no calcula el Coeficiente de Variación, usted debe calcularlo. Media aritmética = 25,73 Varianza = 19,72, desviación típica = 4,44, Cv = 17,26%. Medidas de Forma: Son medidas que suministran información relacionada con concentración de los valores en todo el recorrido de la variable. De esta manera, se puede determinar la forma de la distribución con respecto a la concentración de datos a ambos extremos de la media aritmética y la mediana. Las dos medidas estadísticas de forma, son: Asimetría y Curtosis. Asimetría: Indica cuando existe, hacia qué extremo de la media aritmética se ubica el mayor porcentaje de valores de una distribución. Esta medida se expresa numéricamente mediante el coeficiente de asimetría que señala la magnitud o cuantía de la acentuación del desequilibrio entre los porcentajes de datos concentrados en los dos extremos de la media aritmética. Tal como se mostró al comparar la media aritmética y la mediana, la asimetría puede ser: positiva o negativa. Si es positiva implica que más del 50 por ciento de los valores son menores que la media aritmética y si es negativa, entonces más del 50 por ciento de los valores son mayores que la media aritmética. Existen varias fórmulas para calcular el coeficiente de asimetría, en función de diversos procedimientos. En la siguiente tabla se presentan varias expresiones a través de las cuales

se puede obtener este coeficiente. De igual manera, se indica el porcentaje de recorrido de la información que ésta suministra, lo cual se puede asumir como el porcentaje de la precisión alcanzada al utilizarla. Fórmula en Función de Coef de Asimetría: As

MTC y la Moda

(

X − Xo 3 X − Xd = s s

Porcentaje de Precisión

)

Bowley

Percentiles

Q2 − Q1 Q2 + Q1

Xp90 − 2 Xp50 + Xp10 Xp90 − Xp10

50%

80%

Observación: Si el coeficiente de asimetría se calcula con alguna de las fórmulas anteriores, entonces su valor oscila entre – 1 y +1. Esto permite construir una escala que facilita la ubicación del grado de la asimetría y la correspondiente interpretación. Coeficiente de Asimetría As = 0 - 0,10 ≤ As ≤ + 0,10 ± 0,11 ≤ As ≤ ± 0,30 ± 0,31 ≤ As ≤ ± 1,00

Grado de la Asimetría: Distribución Simétrica Ligera Moderada Marcada

Observación: Entiéndase que si la asimetría es ligera, implica que la diferencia entre los porcentajes de valores situados a ambos lados de la media aritmética, es pequeña. Esta diferencia va aumentando en la medida en que crece el grado de la asimetría. Ejemplo: Determine si existe diferencia entre el porcentaje de valores ubicados a ambos extremos de la media aritmética en la distribución de la prueba de Biología de noveno grado. Interprete. Procedimiento: Tal como está elaborado el planteamiento, se debe calcular el coeficiente de asimetría con el cual se puede determinar la existencia o no de asimetría, lo que permite conocer si existe diferencia entre los porcentajes de valores que se ubican en ambos lados de la media aritmética. 1.- De acuerdo con la tabla de fórmula para calcular el coeficiente de asimetría, conviene utilizar la que señala un 80% de precisión.

Xp90 − 2 Xp50 + Xp10 Xp90 − Xp10 2.- Esta fórmula indica que para aplicarla, hay que conocer los percentiles 10, 50 y 90. Utilizando el paquete estadístico Statgraphics Plus 2.1, se obtiene que: Xp10 =19,35, Xp50 = 24,63 y Xp90 = 31,36 3.- Al sustituir se obtiene que: As =

Xp90 − 2 Xp50 + Xp10 31,36 − 2(24,63) + 19,35 1,45 = = = 0,121 31,36 − 19,35 12,01 Xp90 − Xp10 4.- Ubicar el grado de la asimetría utilizando la escala presentada previamente: Asimetría Moderada. As =

5.- Interpretación: Dado que la asimetría es positiva, implica que existe más del 50 por ciento de alumnos con notas menores que la media aritmética. El que la asimetría sea moderada, significa que la diferencia entre los porcentajes de puntajes ubicados en ambos extremos de la media aritmética, es moderado. Curtosis: Esta medida estadística permite determinar la magnitud de la dispersión en el centro de la distribución, es decir, alrededor de la mediana. Una distribución puede tener alguno de los tres siguientes tipos de curtosis: Mesocúrtica, Leptocúrtica y Platicúrtica. La dispersión central de las distribuciones se compara con la que correspondería una distribución Normal o Mesocúrtica donde se considera moderada o mediana. Si la distribución es Leptocúrtica significa que la dispersión central es menor que en una Normal, y cuando sea Platicúrtica, entonces la dispersión alrededor de la mediana es mayor que en una distribución Normal. La curtosis se mide a través del coeficiente de curtosis. Para calcular el coeficiente de curtosis se emplea la siguiente fórmula en función de percentiles: Xp75 − Xp 25 Cu = 2( Xp90 − Xp10 ) Una vez calculado el coeficiente con la fórmula anterior, para determinar el tipo de curtosis de la distribución se considera lo siguiente: • Si Cu = 0,263, la distribución es mesocúrtica o normal • Para un Cu < 0,263, es Leptocúrtica • Cuando Cu > 0,263, entonces es Platicúrtica. Ejemplo: Calcular e interpretar la curtosis de la distribución de la prueba objetiva de Biología presentada por el grupo de alumnos de noveno grado. Procedimiento: 1.- Obtener los percentiles 10, 25, 75 y 90. Se utilizó el paquete estadístico SPSS 10. Xp10 = 19,35, Xp25 = 21,52, Xp75 = 30,06 y Xp90 = 31,52. 2.- Sustituir los valores en la fórmula correspondiente Xp75 − Xp 25 30,06 − 21,52 8,54 Cu = = = = 0,351 2( Xp90 − Xp10 ) 2(31,52 − 19,35) 24,34 3.- Comparar con el valor patrón para determinar el tipo de curtosis: Como Cu = 0,351 > 0,263, entonces, la distribución de la prueba de Biología es Platicúrtica. 4.- Interpretación: La distribución de la prueba de Biología presenta en el centro una dispersión mayor que en una distribución normal. Atrás