Saltar al contenido principal
LibreTexts Español

16.5: Comprender los resultados de las pruebas

  • Page ID
    138952
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Para comprender los resultados de las pruebas a partir de pruebas estandarizadas es importante conocer una variedad de términos y conceptos que son fundamentales para la “teoría de la medición”, el estudio académico de medición y evaluación. En el capítulo anterior se discutieron dos áreas principales en teoría de la medición, confiabilidad y validez; en este capítulo, nos enfocamos en conceptos y términos asociados con los puntajes de las pruebas.


    Los Fundamentos

    Distribuciones de frecuencia

    Una distribución de frecuencias es un listado del número de estudiantes que obtuvieron cada puntaje en una prueba. Si 31 estudiantes toman una prueba, y las puntuaciones van de 11 a 30 entonces la distribución de frecuencias podría parecerse al Cuadro 44. Trazar una distribución de frecuencias nos ayuda a ver qué puntuaciones son típicas y cuánta variabilidad hay en las puntuaciones. A continuación se describen formas más precisas de determinar las puntuaciones típicas y la variabilidad.

    Tabla\(\PageIndex{1}\): Distribución de frecuencias para 30 puntajes

     

    Puntuación en la prueba Frecuencia Medidas de tendencia central
    17 1  
    18 1  
    19 0  
    20 3  
    21 2  
    22 6 Modo
    23 3 Mediana
    24 2 Media
    25 0  
    26 2  
    27 6 Modo
    28 2  
    29 2  
    30 1  
    TOTAL 31  

    Tendencia central y variabilidad

    Hay tres formas comunes de medir la tendencia central o cuál (s) puntuación (es) es típica (s). La media se calcula sumando todas las puntuaciones y dividiendo por el número de puntajes. La mediana es la puntuación “media” de la distribución, es decir, la mitad de las puntuaciones están por encima de la mediana y la mitad están por debajo. La mediana de la distribución es 23 porque 15 puntuaciones están por encima de 23 y 15 están por debajo.

    El modo es el puntaje que ocurre con mayor frecuencia. En el Cuadro 44 hay dos modos 22 y 27 y así esta distribución se describe como bimodal. El cálculo de la media, la mediana y el modo son importantes ya que cada uno proporciona información diferente para los maestros.

    La mediana representa la puntuación de los alumnos “medianos”, con media puntuación por encima y por debajo, pero no nos habla de los puntajes en la prueba que ocurrieron con mayor frecuencia.

    La media es importante para algunos cálculos estadísticos, pero está muy influenciada por unos pocos puntajes extremos (llamados valores atípicos) pero la mediana no lo es. Para ilustrar esto, imagina una prueba de 20 puntos tomados por 10 alumnos, y a la mayoría le va muy bien pero a un estudiante le va muy mal. Las puntuaciones podrían ser 4, 18, 18, 19, 19, 19, 19, 19, 19, 20, 20. La media es 17.5 (170/10) pero si se elimina la puntuación más baja (4) la media es ahora 1.5 puntos más alta en 19 (171/9).

    Sin embargo, en este ejemplo, la mediana se mantiene en 19 si se incluye la puntuación más baja. Cuando hay algunas puntuaciones extremas, la mediana suele ser más útil para los profesores para indicar la tendencia central de la distribución de frecuencias.

    Las medidas de tendencia central nos ayudan a resumir puntuaciones que son representativas, pero no nos dicen nada sobre cuán variables o qué tan dispersas son las puntuaciones. Una forma sencilla de resumir la variabilidad es el rango, que es la puntuación más baja restada de la puntuación más baja.

    Sin embargo, el rango solo se basa en dos puntuaciones en la distribución, las puntuaciones más altas y más bajas, y por lo tanto no representa variabilidad en todas las puntuaciones. La desviación estándar se basa en cuánto, en promedio, todas las puntuaciones se desvían de la media. En el siguiente ejercicio demostramos cómo calcular la desviación estándar.

    Cálculo de una desviación estándar

    Ejemplo: Las puntuaciones de 11 alumnos en un cuestionario son: 4, 7, 6, 3, 10, 7, 3, 7, 5, 5 y 9

    1. Ordenar puntuaciones.
    2. Calcular la puntuación media.
    3. Calcular las desviaciones de la media.
    4. Cuadrando las desviaciones de la media.
    5. Calcular la media de las desviaciones cuadradas de la media (es decir, sumar las desviaciones cuadradas de la media y luego dividir por el número de puntuaciones). Este número se llama varianza.
    6. Toma la raíz cuadrada y has calculado la desviación estándar.

    Exposición\(\PageIndex{1}\): Cálculo de una desviación estándar

    Puntuación
    (Paso 1, orden)

    Desviación de la media

    Desviación cuadrada de la media

     

    3

    -3

    9

     

    3

    -3

    9

     

    4

    -2

    4

    (Paso 4-5, complete los cálculos)

    5

    -1

    1

    Fórmula:

    5

    -1

    1

    \( \dfrac{\sqrt{\sum \left ( Score-Mean \right )^{2}}}{N} \)

    6

    0

    0

    N = Número de puntuación

    7

    1

    1

     

    7

    1

    1

     

    7

    1

    1

     

    9

    3

    9

     

    10

    4

    4

     

    TOTAL = 66

     

    40

     

    (Paso 2, calcular la media)

    MEDIA 66/11 = 6.0

     

    (Paso 3, calcular desviaciones)

    Media = 40/11 = 3.64

    (Paso 6, encontrar la desviación estándar)

    Estandar r d d ev iatio n=\( \sqrt{3.64} =1.91 \)

    La distribución normal

    Conocer la desviación estándar es particularmente importante cuando la distribución de las puntuaciones cae en una distribución normal. Cuando se administra una prueba estandarizada a un número muy grande de estudiantes, la distribución de los puntajes suele ser similar, con muchos estudiantes puntuando cerca de la media, y menos puntuando mucho más o menos que la media. Cuando la distribución de partituras parece que la forma de campana se llama distribución normal. Una distribución normal es simétrica, y la media, la mediana y el modo son todos iguales.

    Las distribuciones de curvas normales son muy importantes en educación y psicología debido a la relación entre la media, la desviación estándar y los percentiles. En todas las distribuciones normales 34 por ciento de las puntuaciones caen entre la media y una desviación estándar de la media. Las pruebas de inteligencia a menudo se construyen para tener una media de 100 y una desviación estándar de 15.

    IQ y desviación estándar
    Figura\(\PageIndex{1}\): Distribución normal (Wikimedia.org)

    En este ejemplo, 34 por ciento de los puntajes están entre 100 y 115 y también, 34 por ciento de los puntajes se encuentran entre 85 y 100. Esto significa que el 68 por ciento de las puntuaciones están entre -1 y +1 desviaciones estándar de la media (es decir, 85 y 115). Tenga en cuenta que solo el 14 por ciento de las puntuaciones están entre +1 y +2 desviaciones estándar de la media y solo el 2 por ciento cae por encima de +2 desviaciones estándar de la media.

    En una distribución normal, un estudiante que califica el valor medio está siempre en el percentil cincuenta porque la media y la mediana son las mismas. Una puntuación de +1 desviación estándar por encima de la media (por ejemplo 115 en el ejemplo anterior) es la ficha del 84 por ciento (50 por ciento y 34 por ciento de las puntuaciones estuvieron por debajo de 115). En el Gráfico 10 representamos los equivalentes de percentiles a la curva normal y también mostramos puntajes estándar.


    Tipos de puntajes de exámenes

    Una puntuación estándar expresa el desempeño en una prueba en términos de unidades de desviación estándar por encima o por debajo de la media (Linn & Miller, 2005). Hay una variedad de puntuaciones estándar:

    Puntaje Z: Un tipo de puntaje estándar es un puntaje z, en el que la media es 0 y la desviación estándar es 1. Esto significa que una puntuación z nos indica directamente cuántas desviaciones estándar está la puntuación por encima o por debajo de la media. Por ejemplo, si un estudiante recibe una puntuación z de 2 su puntaje es de dos desviaciones estándar por encima de la media o el percentil ochenta y cuarto. Un estudiante que recibió una puntuación z de -1.5 obtuvo una desviación y media por debajo de la media. Cualquier puntaje de una distribución normal se puede convertir a una puntuación z si se conoce la media y la desviación estándar. La fórmula es:

    \[ Z_{score} = \dfrac{Score - Mean\;\; Score}{Standard \;\; Deviation}\]

    Desviación estándar

    Entonces, si la puntuación es 130 y la media es 100 y la desviación estándar es 15 entonces el cálculo es:

    \[ Z_{score} = \dfrac{130-100}{15} = 2 \]

    Puntaje T: Una puntuación T tiene una media de 50 y una desviación estándar de 10. Esto significa que una puntuación T de 70 es dos desviaciones estándar por encima de la media y por lo tanto es equivalente a una puntuación z de 2.

    Estaninas: Las estaninas (staninas pronunciadas) se utilizan a menudo para informar las puntuaciones de los estudiantes y se basan en una escala estándar de nueve puntos y con una media de 5 y una desviación estándar de 2. Solo se reportan como números enteros y la Figura 11-10 muestra su relación con la curva normal.

    Grado equivalente a llagas

    Un puntaje equivalente de grado proporciona una estimación del desempeño de las pruebas con base en el nivel de grado y los meses del año escolar (Popham, 2005, p. 288). Un puntaje equivalente al grado de 3.7 significa que el desempeño es el esperado de un estudiante de tercer grado en el séptimo mes del ciclo escolar. Los equivalentes de grado proporcionan un rango continuo de niveles de grado y por lo tanto pueden considerarse puntajes de desarrollo. Los puntajes equivalentes de grado son populares y parecen fáciles de entender, sin embargo, suelen ser incomprendidos.

    Si James, un estudiante de cuarto grado, toma una prueba de lectura y la calificación equivalente de grado es 6.0; esto no significa que James pueda hacer trabajos de sexto grado. Significa que James se desempeñó en la prueba de cuarto grado ya que se espera que realice un estudiante de sexto grado. Las empresas de pruebas calculan equivalentes de grado dando una prueba a varios niveles de grado. Por ejemplo, también se daría una prueba diseñada para alumnos de cuarto grado a alumnos de tercer y quinto grado. Se trazan los puntajes brutos y se establece una línea de tendencia y ésta se utiliza para establecer los equivalentes de calificación.

    Los puntajes equivalentes de grado también asumen que la materia que se está probando se enfatiza en cada nivel de grado en la misma cantidad y que el dominio del contenido se acumula a una tasa mayormente constante (Popham, 2005). Muchos expertos en pruebas advierten que los puntajes equivalentes de grado deben interpretarse con considerable escepticismo y que los padres a menudo tienen serios conceptos erróneos sobre las calificaciones equivalentes de grado. Los padres de estudiantes de alto rendimiento pueden tener una idea inflada de cuál es el nivel de logro de su hijo.

    • En 1986 la Asociación Internacional de Lectura declaró que NO se deben utilizar equivalentes de grado.

    Debido a los problemas psicométricos inherentes asociados con los equivalentes de edad y grado que limitan seriamente su confiabilidad y validez, estos puntajes no deben ser utilizados para tomar decisiones diagnósticas o de colocación (Bracken, 1988; Reynolds, 1981).


    16.5: Comprender los resultados de las pruebas is shared under a not declared license and was authored, remixed, and/or curated by LibreTexts.