16.6: Problemas con las pruebas estandarizadas

Última actualización
Guardar como PDF

Page ID: 138933

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

¿Las pruebas estandarizadas están sesgadas?

En una sociedad multicultural, una pregunta crucial es: ¿Las pruebas estandarizadas están sesgadas contra ciertos grupos de clase social, raciales o étnicos?

Esta pregunta es mucho más complicada de lo que parece porque el sesgo tiene una variedad de significados. Un significado cotidiano de sesgo a menudo implica la equidad de usar resultados de pruebas estandarizadas para predecir el desempeño potencial de estudiantes desfavorecidos que previamente han tenido pocos recursos educativos.

Por ejemplo, si a Dwayne, un estudiante de secundaria que trabajaba duro pero que tenía oportunidades educativas limitadas debido a las malas escuelas de su barrio y pocos recursos educativos en su hogar, se le negara la graduación de la secundaria debido a su puntaje en una prueba. No fue su culpa que no tuviera los recursos educativos y si se le daba una oportunidad con un cambio su entorno (por ejemplo, yendo a la universidad) su desempeño puede florecer.

En esta visión, los puntajes de las pruebas reflejan desigualdades sociales y pueden castigar a los estudiantes menos privilegiados, y a menudo se interpretan erróneamente como un reflejo de una capacidad heredada fija. Los investigadores suelen considerar el sesgo de manera más técnica y se discutirán tres temas: contenido y formato del artículo; precisión de las predicciones y amenaza de estereotipo.

Contenido y formato del artículo. Los elementos de prueba pueden ser más difíciles para algunos grupos que para otros. Un ejemplo de sesgo de clase social en un ítem de opción múltiple preguntó a los estudiantes el significado del término campo. Se pidió a los alumnos que leyeran la oración inicial en cursiva y luego seleccionaran la respuesta que tuviera el mismo significado de campo (Popham 2004, p. 24):

El campo de mi papá son los gráficos por computadora.

El lanzador podría lanzar su posición
Preparamos el campo arándolo
El doctor examinó mi campo de visión
¿A qué campo ingresarás después de la universidad?

Los hijos de profesionales tienen más probabilidades de entender este significado de campo ya que los médicos, periodistas y abogados tienen “campos”, mientras que los cajeros y los trabajadores de mantenimiento tienen trabajos por lo que sus hijos tienen menos probabilidades de conocer este significado de campo. (La respuesta correcta es D).

Las empresas de pruebas intentan minimizar este tipo de problemas de contenido haciendo que los desarrolladores de pruebas de una variedad de orígenes revisen elementos y examinando estadísticamente si ciertos grupos encuentran algunos elementos más fáciles o más difíciles. Sin embargo, sí existen problemas y un análisis reciente de las pruebas verbales SAT indicó que los blancos tienden a obtener mejores puntuaciones en artículos fáciles, mientras que los afroamericanos, hispanoamericanos y asiáticoamericanos puntúan mejor en artículos duros (Freedle, 2002). Si bien estas diferencias no son grandes, pueden influir en los puntajes de las pruebas.

Los investigadores piensan que los elementos fáciles que involucran palabras que se usan en la conversación cotidiana pueden tener significados sutilmente diferentes en diferentes subculturas, mientras que las palabras duras (por ejemplo, vehemencia, sicofante) no se usan en todas las conversaciones y por lo tanto no tienen estas variaciones de significado. Los formatos de prueba también pueden influir en el rendimiento de las pruebas Las mujeres suelen obtener mejores resultados en las preguntas de ensayo y cuando el SAT agregó recientemente un componente de ensayo, las puntuaciones verbales del SAT en general de las mujeres mejoraron en relación con los hombres (Hoover, 2006).

Precisión de las predicciones

Se utilizan pruebas estandarizadas, entre otros criterios para determinar quiénes serán admitidos en colegios selectivos. Esta práctica se justifica por la evidencia de validez predictiva, es decir, que los puntajes en el ACT o SAT se utilizan para predecir los grados universitarios de primer año. Estudios recientes han demostrado que las predicciones para estudiantes negros y latinos son menos precisas que para estudiantes blancos y que los predictores para estudiantes femeninas son menos precisos que los estudiantes varones (Young, 2004).

Sin embargo, quizás sorprendentemente los puntajes de los exámenes tienden a predecir ligeramente el éxito en la universidad para estudiantes negros y latinos, es decir, es probable que estos estudiantes obtengan promedios de calificaciones de primer año más bajos que los previstos por sus puntajes de exámenes Por el contrario, los puntajes de los exámenes tienden a predecir ligeramente el éxito en la universidad para las estudiantes femeninas, es decir, es probable que estas estudiantes obtengan promedios de calificaciones de primer año más altos que los pronosticados por Los investigadores no están seguros por qué hay diferencias en la precisión con la que las pruebas SAT y ACT predicen las calificaciones de primer año.

Amenaza estereotipada

Los grupos que están estereotipados negativamente en alguna área, como el desempeño de las mujeres en matemáticas, están en peligro de amenaza estereotipada, es decir, preocupaciones de que otros los vean a través de la lente negativa o estereotipada (Aronson & Steele, 2005). Los estudios han demostrado que el desempeño de las pruebas de grupos estereotipados (por ejemplo, afroamericanos, latinos, mujeres) disminuye cuando se enfatiza a quienes toman la prueba que (a) la prueba es de alto riesgo, mide inteligencia o matemáticas y (b) se les recuerda su etnia, raza o género (por ejemplo, preguntándoles antes la prueba para completar un breve cuestionario demográfico).

Incluso si los individuos creen que son competentes, la amenaza de estereotipo puede reducir la capacidad de memoria de trabajo porque los individuos están tratando de suprimir los estereotipos negativos. La amenaza estereotipada parece particularmente fuerte para aquellos individuos que desean desempeñarse bien.

Los puntajes estandarizados de las pruebas de individuos de grupos estereotipados pueden subestimar significativamente su competencia real en situaciones de pruebas de bajo riesgo.

¿Los profesores enseñan a las pruebas?

Existe evidencia de que las escuelas y los maestros ajustan el plan de estudios para que refleje lo que hay en las pruebas y además prepara a los alumnos para el formato y tipos de ítems en la prueba. Varias encuestas realizadas a maestros de primaria indicaron que en 2004 se dedicó más tiempo a matemáticas y lectura y menos a estudios sociales y ciencias en 2004 que en 1990 (Jerald, 2006). Directores de escuelas de alta matrícula para minorías en cuatro estados informaron en 2003 que habían reducido el tiempo dedicado a las artes.

Investigaciones recientes en ciencias cognitivas sugieren que la comprensión lectora en una materia (por ejemplo, ciencias o estudios sociales) requiere que los estudiantes comprendan mucho vocabulario y conocimientos de fondo en esa materia (Recht y Leslie, 1988). Esto significa que aunque los estudiantes adquieran buenas habilidades de lectura, encontrarán difícil aprender ciencias y estudios sociales si se ha dedicado poco tiempo a estas materias.

Tomar una prueba con un formato desconocido puede ser difícil, por lo que los maestros ayudan a los estudiantes a prepararse para ítems y formatos específicos de prueba (por ejemplo, negativos dobles en ítems de opción múltiple; respuesta construida).

Existe una creciente preocupación por el hecho de que la cantidad de preparación de exámenes que ahora ocurre en las escuelas es excesiva y los estudiantes no están siendo educados, sino entrenados para hacer exámenes (Popham, 2004).