Saltar al contenido principal
LibreTexts Español

5.4: Experimentación y Validez

  • Page ID
    144662
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje

    1. Explicar qué es la validez interna y por qué los experimentos se consideran de alta validez interna.
    2. Explicar qué es la validez externa y evaluar los estudios en términos de su validez externa.
    3. Explicar los conceptos de constructo y validez estadística.

    Cuatro grandes valideces

    Cuando leemos sobre experimentos de psicología con una visión crítica, una pregunta que hacer es “¿este estudio es válido (exacto)?” Sin embargo, esa pregunta no es tan sencilla como parece porque, en psicología, hay muchos tipos diferentes de validedades. Los investigadores se han centrado en cuatro valideces para ayudar a evaluar si un experimento es sólido (Judd & Kenny, 1981; Morling, 2014) [1] [2]: validez interna, validez externa, validez de constructo y validez estadística. Exploraremos cada validez en profundidad.

    Validez interna

    Dos variables que están estadísticamente relacionadas no significa necesariamente que una cause la otra. En tu educación en psicología, probablemente hayas escuchado el término, “La correlación no implica causalidad”. Por ejemplo, si se diera el caso de que las personas que hacen ejercicio regularmente son más felices que las personas que no hacen ejercicio regularmente, esta implicación no necesariamente significaría que hacer ejercicio aumenta la felicidad de las personas. Podría significar en cambio que una mayor felicidad hace que las personas hagan ejercicio o que algo así como una mejor salud física haga que las personas hagan ejercicio y sean más felices.

    El propósito de un experimento, sin embargo, es mostrar que dos variables están estadísticamente relacionadas y hacerlo de manera que respalde la conclusión de que la variable independiente causó cualquier diferencia observada en la variable dependiente. La lógica se basa en esta suposición: Si el investigador crea dos o más condiciones muy similares y luego manipula la variable independiente para producir solo una diferencia entre ellas, entonces cualquier diferencia posterior entre las condiciones debe haber sido causada por el independiente variable. Por ejemplo, debido a que la única diferencia entre las condiciones de Darley y Latané era el número de estudiantes que los participantes creían que estaban involucrados en la discusión, esta diferencia de creencias debió haber sido responsable de las diferencias en la ayuda entre las condiciones.

    Se dice que un estudio empírico es alto en validez interna si la forma en que se realizó apoya la conclusión de que la variable independiente causó diferencias observadas en la variable dependiente. Por lo tanto, los experimentos tienen una alta validez interna porque la forma en que se llevan a cabo, con la manipulación de la variable independiente y el control de variables extrañas (como mediante el uso de asignación aleatoria para minimizar los confundidos), proporciona un fuerte apoyo para las conclusiones causales. En contraste, los diseños de investigación no experimentales (por ejemplo, diseños correlacionales), en los que las variables son medidas pero no son manipuladas por un experimentador, son de baja validez interna.

    Validez Externa

    Al mismo tiempo, la forma en que se llevan a cabo los experimentos a veces conduce a un tipo diferente de crítica. Específicamente, la necesidad de manipular la variable independiente y controlar variables extrañas significa que los experimentos a menudo se realizan en condiciones que parecen artificiales (Bauman, McGraw, Bartels, & Warren, 2014) [3]. En muchos experimentos de psicología, los participantes son todos estudiantes de pregrado y acuden a un aula o laboratorio para llenar una serie de cuestionarios en papel y lápiz o para realizar una tarea computarizada cuidadosamente diseñada. Consideremos, por ejemplo, un experimento en el que la investigadora Barbara Fredrickson y sus colegas hicieron que estudiantes de pregrado vinieran a un laboratorio en el campus y completaran una prueba de matemáticas mientras vestían traje de baño (Fredrickson, Roberts, Noll, Quinn, & Twenge, 1998) [4]. Al principio, esta manipulación puede parecer tonta. ¿Cuándo los estudiantes de pregrado tendrán que completar las pruebas de matemáticas en sus trajes de baño fuera de este experimento?

    El tema al que nos enfrentamos es el de la validez externa. Un estudio empírico es alto en validez externa si la forma en que se realizó apoya generalizar los resultados a personas y situaciones más allá de las realmente estudiadas. Por regla general, los estudios tienen mayor validez externa cuando los participantes y la situación estudiada son similares a las que los investigadores quieren generalizar y los participantes encuentran todos los días, a menudo descritos como realismo mundano. Imagínese, por ejemplo, que un grupo de investigadores esté interesado en cómo los compradores de las grandes tiendas de abarrotes se ven afectados por si el cereal para el desayuno se empaqueta en cajas amarillas o moradas. Su estudio sería alto en validez externa y tendría un alto realismo mundano si estudiaran las decisiones de la gente común haciendo sus compras semanales en una verdadera tienda de comestibles. Si los compradores compraran mucho más cereal en cajas moradas, los investigadores estarían bastante seguros de que este aumento sería cierto para otros compradores en otras tiendas. Su estudio sería relativamente bajo en validez externa, sin embargo, si estudiaran una muestra de estudiantes de pregrado en un laboratorio de una universidad selectiva que se limitaran a juzgar el atractivo de varios colores presentados en una pantalla de computadora; sin embargo, este estudio tendría un alto realismo psicológico donde se utiliza el mismo proceso mental tanto en el laboratorio como en el mundo real. Si los estudiantes juzgan que el púrpura es más atractivo que el amarillo, los investigadores no estarían muy seguros de que esta preferencia es relevante para las decisiones de compra de cereales de los compradores de abarrotes debido a la baja validez externa pero podrían estar seguros de que el procesamiento visual de los colores tiene un alto realismo psicológico .

    Debemos tener cuidado, sin embargo, de no sacar la conclusión general de que los experimentos son de baja validez externa. Una razón es que los experimentos no necesitan parecer artificiales. Considera que el experimento de Darley y Latané proporcionó una simulación razonablemente buena de una situación de emergencia real. O considere experimentos de campo que se realicen completamente fuera del laboratorio. En uno de esos experimentos, Robert Cialdini y sus colegas estudiaron si los huéspedes del hotel optan por reutilizar sus toallas por segundo día en lugar de lavarlas como una forma de conservar agua y energía (Cialdini, 2005) [5]. Estos investigadores manipularon el mensaje en una tarjeta dejada en una gran muestra de habitaciones de hotel. Una versión del mensaje enfatizó mostrar respeto por el medio ambiente, otra enfatizó que el hotel donaría una parte de sus ahorros a una causa ambiental, y una tercera enfatizó que la mayoría de los huéspedes del hotel optan por reutilizar sus toallas. El resultado fue que los huéspedes que recibieron el mensaje de que la mayoría de los huéspedes del hotel optan por reutilizar sus toallas, reutilizaron sus propias toallas sustancialmente más a menudo que los huéspedes que recibieron cualquiera de los otros dos mensajes. Dada la forma en que realizaron su estudio, parece muy probable que su resultado sea cierto para otros huéspedes en otros hoteles.

    Una segunda razón para no sacar la conclusión general de que los experimentos tienen poca validez externa es que a menudo se llevan a cabo para aprender sobre procesos psicológicos que probablemente operen en una variedad de personas y situaciones. Volvamos al experimento de Fredrickson y colegas. Encontraron que las mujeres en su estudio, pero no los hombres, se desempeñaron peor en la prueba de matemáticas cuando llevaban trajes de baño. Argumentaron que esta diferencia de género se debía a la mayor tendencia de las mujeres a objetivarse a sí mismas, a pensar en sí mismas desde la perspectiva de un observador externo, lo que desvía su atención de otras tareas. Argumentaron, además, que este proceso de autoobjetivación y su efecto en la atención es probable que opere en una variedad de mujeres y situaciones, aunque ninguna de ellas se encuentre realizando un examen de matemáticas en traje de baño.

    Validez de constructo

    Además de la generalizabilidad de los resultados de un experimento, otro elemento a escrutar en un estudio es la calidad de las manipulaciones del experimento o la validez de constructo. La pregunta de investigación con la que comenzaron Darley y Latané es “¿ayudar a que el comportamiento se difunda?” Ellos plantearon la hipótesis de que los participantes en un laboratorio serían menos propensos a ayudar cuando creían que había más ayudantes potenciales además de ellos mismos. Esta conversión de la pregunta de investigación al diseño de experimentos se denomina operacionalización (ver Capítulo 4 para más información sobre la definición operativa). Darley y Latané operacionalizaron la variable independiente de difusión de responsabilidad al aumentar el número de ayudantes potenciales. Al evaluar este diseño, diríamos que la validez de constructo fue muy alta porque las manipulaciones del experimento hablan muy claramente de la pregunta de investigación; hubo una crisis, una manera de que el participante ayudara, y aumentando el número de otros estudiantes involucrados en la discusión, proporcionaron una manera para probar la difusión.

    ¿Y si cambiara el número de condiciones en el estudio de Darley y Latané? Considera si solo hubo dos condiciones: un estudiante involucrado en la discusión o dos. A pesar de que podemos ver una disminución en la ayuda al agregar a otra persona, puede que no sea una clara demostración de difusión de responsabilidad, solo la presencia de otros. Podríamos pensar que era una forma del concepto de inhibición social de Bandura. La validez de constructo sería menor. No obstante, de haber habido cinco condiciones, tal vez veríamos que la disminución continuara con más gente en la discusión o tal vez se mesetearía después de cierto número de personas. En esa situación, podemos desarrollar una comprensión más matizada del fenómeno. Pero al agregar aún más condiciones, la validez del constructo puede no llegar a ser mayor. Al diseñar su propio experimento, considere qué tan bien la pregunta de investigación está operacionalizada su estudio.

    Validez estadística

    La validez estadística se refiere al tratamiento estadístico adecuado de los datos y a la solidez de las conclusiones estadísticas de los investigadores. Existen muchos tipos diferentes de pruebas estadísticas inferenciales (e.g., t- test, ANOVA, regresión, correlación) y la validez estadística se refiere al uso del tipo adecuado de prueba para analizar los datos. Al considerar el tipo adecuado de prueba, los investigadores deben considerar la escala de medida en la que se midió su variable dependiente y el diseño de su estudio. Además, muchas pruebas estadísticas inferenciales llevan ciertos supuestos (por ejemplo, los datos se distribuyen normalmente) y la validez estadística se ve amenazada cuando estos supuestos no se cumplen pero las estadísticas se utilizan no obstante.

    Una crítica común a los experimentos es que un estudio no tuvo suficientes participantes. La razón principal de esta crítica es que es difícil generalizar sobre una población a partir de una pequeña muestra. Al principio, parece que esta crítica trata de validez externa pero hay estudios donde los tamaños de muestra pequeños no son un problema (capítulos posteriores discutirán cómo las muestras pequeñas, incluso de una sola persona, siguen siendo muy esclarecedoras para la investigación psicológica). Por lo tanto, los tamaños de muestra pequeños son en realidad una crítica de la validez estadística. La validez estadística habla de si las estadísticas realizadas en el estudio son sólidas y sustentan las conclusiones que se hacen.

    Se debe realizar el análisis estadístico adecuado sobre los datos para determinar si efectivamente se encontró la diferencia o relación que se predijo. Curiosamente, la probabilidad de detectar un efecto de la variable independiente sobre la variable dependiente depende no solo de si realmente existe una relación entre estas variables, sino también del número de condiciones y el tamaño de la muestra. Por ello es importante realizar un análisis de potencia a la hora de diseñar un estudio, que es un cálculo que te informa del número de participantes que necesitas reclutar para detectar un efecto de un tamaño específico.

    Priorizar las valideces

    Estas cuatro grandes valideces, internas, externas, constructivas y estadísticas, son útiles para tener en cuenta al leer sobre otros experimentos y diseñar los tuyos propios. Sin embargo, los investigadores deben priorizar y muchas veces no es posible tener una alta validez en las cuatro áreas. En el estudio de Cialdini sobre el uso de toallas en hoteles, la validez externa fue alta pero la validez estadística fue más modesta. Esta discrepancia no invalida el estudio pero muestra dónde puede haber margen de mejora para futuros estudios de seguimiento (Goldstein, Cialdini, & Griskevicius, 2008) [6]. Morling (2014) señala que muchos estudios de psicología tienen una alta validez interna y constructo pero a veces sacrifican la validez externa.

    Referencias

    1. Judd, C.M. & Kenny, D.A. (1981). Estimación de los efectos de las intervenciones sociales. Cambridge, MA: Prensa de la Universidad de Cambridge.
    2. Morling, B. (2014, abril). Enseñe a sus alumnos a ser mejores consumidores. Observador APS. Recuperado a partir de [1]http://www.psychologicalscience.org/index.php/publications/observer/2014/april-14/teach-your-students-to-be-better-consumers.html
    3. Bauman, C.W., McGraw, A.P., Bartels, D.M., & Warren, C. (2014). Revisando la validez externa: Preocupaciones sobre problemas de carro y otros dilemas sacrificiales en psicología moral. Brújula de Psicología Social y de la Personalidad, 8/9, 536-554.
    4. Fredrickson, B. L., Roberts, T.-A., Noll, S. M., Quinn, D. M., & Twenge, J. M. (1998). El traje de baño se convierte en ti: Diferencias sexuales en la autoobjetivación, la alimentación restringida y el rendimiento matemático. Revista de Personalidad y Psicología Social, 75, 269—284.
    5. Cialdini, R. (2005, abril). No tires la toalla: Usa la investigación de influencia social. Observador APS. Recuperado a partir de [2]http://www.psychologicalscience.org/index.php/publications/observer/2005/april-05/dont-throw-in-the-towel-use-social-influence-research.html
    6. Goldstein, N. J., Cialdini, R. B., & Griskevicius, V. (2008). Una habitación con mirador: Utilizar normas sociales para motivar la conservación ambiental en los hoteles. Revista de Investigación del Consumidor, 35, 472—482.

    This page titled 5.4: Experimentación y Validez is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Rajiv S. Jhangiani, I-Chant A. Chiang, Carrie Cuttler, & Dana C. Leighton.