Saltar al contenido principal
LibreTexts Español

5.3: Diseño experimental

  • Page ID
    144656
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Objetivos de aprendizaje
    1. Explique la diferencia entre los experimentos entre sujetos y dentro de los sujetos, enumere algunos de los pros y los contras de cada enfoque y decida qué enfoque usar para responder a una pregunta de investigación en particular.
    2. Definir la asignación aleatoria, distinguirla del muestreo aleatorio, explicar su propósito en la investigación experimental y usar algunas estrategias simples para implementarla
    3. Defina varios tipos de efecto de arrastre, dé ejemplos de cada uno y explique cómo el contrapeso ayuda a lidiar con ellos.

    En esta sección, analizamos algunas formas diferentes de diseñar un experimento. La distinción principal que haremos es entre enfoques en los que cada participante experimenta un nivel de la variable independiente y enfoques en los que cada participante experimenta todos los niveles de la variable independiente. Los primeros se denominan experimentos entre sujetos y los segundos se denominan experimentos dentro de sujetos.

    Experimentos entre sujetos

    En un experimento entre sujetos, cada participante es probado en una sola condición. Por ejemplo, un investigador con una muestra de 100 estudiantes universitarios podría asignar la mitad de ellos a escribir sobre un evento traumático y la otra mitad escribir sobre un evento neutral. O un investigador con una muestra de 60 personas con agorafobia severa (miedo a los espacios abiertos) podría asignar 20 de ellas para recibir cada uno de tres tratamientos diferentes para ese trastorno. Es esencial en un experimento entre sujetos que el investigador asigne a los participantes a condiciones para que los diferentes grupos sean, en promedio, muy similares entre sí. Aquellos en una condición traumática y neutra, por ejemplo, deben incluir una proporción similar de hombres y mujeres, y deben tener un coeficiente de CI promedio similar, niveles promedio similares de motivación, números promedio similares de problemas de salud, etc. Esta coincidencia es una cuestión de controlar estas variables participantes extrañas a través de las condiciones para que no se conviertan en variables confusas.

    Asignación Aleatoria

    La principal forma en que los investigadores logran este tipo de control de variables extrañas a través de condiciones se llama asignación aleatoria, lo que significa usar un proceso aleatorio para decidir qué participantes se prueban en qué condiciones. No confundir la asignación aleatoria con el muestreo aleatorio. El muestreo aleatorio es un método para seleccionar una muestra de una población, y rara vez se utiliza en la investigación psicológica. La asignación aleatoria es un método para asignar a los participantes en una muestra las diferentes condiciones, y es un elemento importante de toda la investigación experimental en psicología y otros campos también.

    En su sentido más estricto, la asignación aleatoria debe cumplir dos criterios. Una es que cada participante tiene las mismas posibilidades de ser asignado a cada condición (por ejemplo, un 50% de probabilidad de ser asignado a cada una de las dos condiciones). El segundo es que a cada participante se le asigna una condición independientemente de los demás participantes. Así, una forma de asignar a los participantes a dos condiciones sería voltear una moneda para cada una. Si la moneda aterriza cabezas, el participante se asigna a la Condición A, y si aterriza colas, el participante se asigna a la Condición B. Para tres condiciones, se podría usar una computadora para generar un entero aleatorio de 1 a 3 para cada participante. Si el número entero es 1, al participante se le asigna a la Condición A; si es 2, al participante se le asigna a la Condición B; y si es 3, al participante se le asigna a la Condición C. En la práctica, una secuencia completa de condiciones, una para cada participante que se espera que esté en el experimento, generalmente se crea con anticipación. , y a cada nuevo participante se le asigna la siguiente condición en la secuencia a medida que se someten a prueba. Cuando el procedimiento es computarizado, el programa de computadora a menudo maneja la asignación aleatoria.

    Un problema con el volteo de monedas y otros procedimientos estrictos para la asignación aleatoria es que es probable que resulten en tamaños de muestra desiguales en las diferentes condiciones. Los tamaños de muestra desiguales generalmente no son un problema grave, y nunca debe desechar los datos que ya ha recopilado para lograr tamaños de muestra iguales. Sin embargo, para un número fijo de participantes, estadísticamente es más eficiente dividirlos en grupos de igual tamaño. Es una práctica estándar, por lo tanto, utilizar una especie de asignación aleatoria modificada que mantenga el número de participantes en cada grupo lo más similar posible. Un enfoque es la aleatorización de bloques. En la aleatorización de bloques, todas las condiciones ocurren una vez en la secuencia antes de que se repita alguna de ellas. Entonces todos vuelven a ocurrir antes de que alguno de ellos vuelva a repetirse. Dentro de cada uno de estos “bloques”, las condiciones ocurren en orden aleatorio. Nuevamente, la secuencia de condiciones generalmente se genera antes de que se pruebe a cualquier participante, y a cada nuevo participante se le asigna la siguiente condición en la secuencia. \(\PageIndex{1}\)La tabla muestra una secuencia de este tipo para asignar nueve participantes a tres condiciones. El sitio web de Research Randomizer (http://www.randomizer.org) generará secuencias de aleatorización de bloques para cualquier número de participantes y condiciones. Nuevamente, cuando el procedimiento es computarizado, el programa de computadora suele manejar la aleatorización de bloques.

    Secuencia\(\PageIndex{1}\) de aleatorización de bloques de tabla para asignar nueve participantes a tres condiciones
    Participante 1 2 3 4 5 6 7 8 9
    Condición A C B B C A C B A

    La asignación aleatoria no está garantizada para controlar todas las variables extrañas en todas las condiciones. El proceso es aleatorio, por lo que siempre es posible que solo por casualidad, los participantes en una condición puedan llegar a ser sustancialmente mayores, menos cansados, más motivados o menos deprimidos en promedio que los participantes en otra condición. No obstante, hay algunas razones por las que esta posibilidad no es una preocupación mayor. Una es que la asignación aleatoria funciona mejor de lo que cabría esperar, especialmente para muestras grandes. Otra es que las estadísticas inferenciales que utilizan los investigadores para decidir si una diferencia entre grupos refleja una diferencia en la población toma en cuenta la “falibilidad” de la asignación aleatoria. Otra razón más es que incluso si la asignación aleatoria da como resultado una variable de confusión y, por lo tanto, produce resultados engañosos, es probable que este error se detecte cuando se replica el experimento. El resultado es que la asignación aleatoria a condiciones, aunque no infalible en términos de controlar variables extrañas, siempre se considera una fortaleza de un diseño de investigación.

    Grupos coincidentes

    Una alternativa a la simple asignación aleatoria de participantes a condiciones es el uso de un diseño de grupos emparejados. Mediante este diseño, los participantes en las diversas condiciones son emparejados en la variable dependiente o en alguna (s) variable (s) extraña (s) previa a la manipulación de la variable independiente. Esto garantiza que estas variables no serán confundidas a través de las condiciones experimentales. Por ejemplo, si queremos determinar si la escritura expresiva afecta la salud de las personas, entonces podríamos comenzar midiendo diversas variables relacionadas con la salud en nuestros participantes de investigación prospectiva. Entonces podríamos usar esa información para clasificar a los participantes de acuerdo a lo saludables o insalubres que estén. A continuación, los dos participantes más sanos serían asignados aleatoriamente para completar diferentes condiciones (uno se asignaría aleatoriamente a la condición de escritura de experiencias traumáticas y el otro a la condición de escritura neutra). Los siguientes dos participantes más saludables serían entonces asignados aleatoriamente para completar diferentes condiciones, y así sucesivamente hasta los dos participantes menos saludables. Este método garantizaría que los participantes en la condición de escritura de experiencias traumáticas sean emparejados con los participantes en la condición de escritura neutra con respecto a la salud al inicio del estudio. Si al final del experimento se detectara una diferencia en la salud entre las dos condiciones, entonces sabríamos que se debe a la manipulación de la escritura y no a diferencias preexistentes en la salud.

    Experimentos dentro de los sujetos

    En un experimento dentro de los sujetos, cada participante es probado bajo todas las condiciones. Considerar un experimento sobre el efecto del atractivo físico de un acusado en los juicios de su culpabilidad. Nuevamente, en un experimento entre sujetos, a un grupo de participantes se le mostraría un atractivo acusado y se le pedía que juzgara su culpabilidad, y a otro grupo de participantes se le mostraría un acusado poco atractivo y se le pediría que juzgara su culpabilidad. En un experimento dentro de los sujetos, sin embargo, el mismo grupo de participantes juzgaría la culpabilidad tanto de un acusado atractivo como de un poco atractivo.

    La principal ventaja de este enfoque es que proporciona el máximo control de las variables externas de los participantes. Los participantes en todas las condiciones tienen el mismo coeficiente intelectual medio, el mismo nivel socioeconómico, el mismo número de hermanos, etc., porque son las mismas personas. Los experimentos dentro de los sujetos también permiten utilizar procedimientos estadísticos que eliminan el efecto de estas variables participantes extrañas sobre la variable dependiente y, por lo tanto, hacen que los datos sean menos “ruidosos” y el efecto de la variable independiente más fácil de detectar. Analizaremos más de cerca esta idea más adelante en el libro. Sin embargo, no todos los experimentos pueden utilizar un diseño dentro de los sujetos ni sería deseable hacerlo.

    Efectos de arrastre y contrapeso

    La principal desventaja de los diseños dentro de los sujetos es que pueden resultar en efectos de orden. Un efecto de orden ocurre cuando las respuestas de los participantes en las diversas condiciones se ven afectadas por el orden de condiciones a las que estuvieron expuestos. Un tipo de efecto de orden es un efecto de arrastre. Un efecto de arrastre es un efecto de ser probado en una condición sobre el comportamiento de los participantes en condiciones posteriores. Un tipo de efecto de arrastre es un efecto de práctica, donde los participantes realizan mejor una tarea en condiciones posteriores porque han tenido la oportunidad de practicarla. Otro tipo es un efecto de fatiga, donde los participantes realizan una tarea peor en condiciones posteriores porque se cansan o se aburren. Ser probado en una condición también puede cambiar la forma en que los participantes perciben los estímulos o interpretan su tarea en condiciones posteriores. Este tipo de efecto se denomina efecto de contexto (o efecto de contraste). Por ejemplo, un acusado de apariencia promedio podría ser juzgado con más dureza cuando los participantes acaban de juzgar a un acusado atractivo que cuando acaban de juzgar a un acusado poco atractivo. Los experimentos dentro de los sujetos también facilitan que los participantes adivinen la hipótesis. Por ejemplo, un participante al que se le pide que juzgue la culpabilidad de un acusado atractivo y luego se le pida que juzgue la culpabilidad de un acusado poco atractivo probablemente adivine que la hipótesis es que el atractivo del acusado afecta los juicios de culpabilidad. Este conocimiento podría llevar al participante a juzgar más duramente al acusado poco atractivo porque piensa que esto es lo que se espera que haga. O podría hacer que los participantes juzguen a los dos acusados de manera similar en un esfuerzo por ser “justos”.

    Los efectos de arrastre pueden ser interesantes por derecho propio. (¿El atractivo de una persona depende del atractivo de otras personas que hemos visto recientemente?) Pero cuando no son el foco de la investigación, los efectos de arrastre pueden ser problemáticos. Imagínese, por ejemplo, que los participantes juzguen la culpabilidad de un demandado atractivo y luego juzguen la culpabilidad de un acusado poco atractivo. Si juzgan más duramente al acusado poco atractivo, esto podría deberse a su falta de atractivo. Pero podría ser en cambio que lo juzguen con más dureza porque se están aburriendo o cansando. Es decir, el orden de las condiciones es una variable confusa. La condición atractiva es siempre la primera condición y la condición poco atractiva la segunda. Así, cualquier diferencia entre las condiciones en términos de la variable dependiente podría ser causada por el orden de las condiciones y no por la propia variable independiente.

    Hay una solución al problema de los efectos de orden, sin embargo, que puede ser utilizada en muchas situaciones. Se trata de contrapeso, lo que significa probar a diferentes participantes en diferentes órdenes. El mejor método de contrapeso es el contrapeso completo en el que un número igual de participantes completa cada orden posible de condiciones. Por ejemplo, la mitad de los participantes serían evaluados en la condición demandada atractiva seguida de la condición demandada poco atractiva, y otras la mitad se probarían en la condición poco atractiva seguida de la condición atractiva. Con tres condiciones, habría seis órdenes diferentes (ABC, ACB, BAC, BCA, CAB y CBA), por lo que algunos participantes serían probados en cada uno de los seis órdenes. Con cuatro condiciones, habría 24 órdenes diferentes; con cinco condiciones habría 120 órdenes posibles. Con el contrapeso, los participantes son asignados a órdenes de manera aleatoria, utilizando las técnicas que ya hemos comentado. Por lo tanto, la asignación aleatoria juega un papel importante en los diseños dentro de los sujetos al igual que en los diseños entre sujetos. Aquí, en lugar de asignar aleatoriamente a condiciones, se asignan aleatoriamente a diferentes órdenes de condiciones. De hecho, se puede decir con seguridad que si un estudio no implica asignación aleatoria de una forma u otra, no se trata de un experimento.

    Una forma más eficiente de contrapeso es a través de un diseño cuadrado latino que aleatoriza a través de tener filas y columnas iguales. Por ejemplo, si tienes cuatro tratamientos, debes tener cuatro versiones. Al igual que un rompecabezas de Sudoku, ningún tratamiento puede repetirse en fila o columna. Para cuatro versiones de cuatro tratamientos, el diseño del cuadrado latino se vería así:

    A B C D
    B C D A
    C D A B
    D A B C

    Se puede ver en el diagrama anterior que el cuadrado ha sido construido para asegurar que cada condición aparece en cada posición ordinal (A aparece primero una vez, segundo una vez, tercero una vez y cuarto una vez) y cada condición precede y se sigue una a otra condición una vez. Un cuadrado latino para un experimento con 6 condiciones sería de 6 x 6 en dimensión, uno para un experimento con 8 condiciones sería de 8 x 8 en dimensión, y así sucesivamente. Entonces, si bien el contrapeso completo de 6 condiciones requeriría 720 pedidos, un cuadrado latino solo requeriría 6 pedidos.

    Finalmente, cuando el número de condiciones es grande, los experimentos pueden usar contrapeso aleatorio en el que se determina aleatoriamente el orden de las condiciones para cada participante. Mediante esta técnica se determina cada orden posible de condiciones y luego se selecciona aleatoriamente una de estas órdenes para cada participante. Esta no es una técnica tan poderosa como el contrapeso completo o el contrapeso parcial usando un diseño de cuadrados latinos. El uso del contrapeso aleatorio dará como resultado un error más aleatorio, pero si es probable que los efectos de orden sean pequeños y el número de condiciones sea grande, esta es una opción disponible para los investigadores.

    Hay dos formas de pensar en lo que logra el contrapeso. Una es que controla el orden de las condiciones para que ya no sea una variable confusa. En lugar de que la condición atractiva siempre sea la primera y la condición poco atractiva siempre sea la segunda, la condición atractiva viene primero para algunos participantes y segunda para otros. De igual manera, la condición poco atractiva viene primero para algunos participantes y segundo para otros. Por lo tanto, cualquier diferencia global en la variable dependiente entre las dos condiciones no puede haber sido causada por el orden de las condiciones. Una segunda forma de pensar lo que logra el contrapeso es que si hay efectos de arrastre, permite detectarlos. Se pueden analizar los datos por separado para cada orden para ver si tuvieron algún efecto.

    Cuando 9 es “más grande” que 221

    El investigador Michael Birnbaum ha argumentado que la falta de contexto proporcionada por los diseños entre sujetos suele ser un problema mayor que los efectos de contexto creados por los diseños dentro de los sujetos. Para demostrar este problema, pidió a los participantes que calificaran dos números sobre qué tan grandes eran en una escala del 1 al 10 donde 1 era “muy muy pequeño” y 10 era “muy muy grande”. Se pidió a un grupo de participantes que calificaran el número 9 y a otro grupo se le pidió que calificara el número 221 (Birnbaum, 1999) 221: Recoger juicios en un diseño entre sujetos. Métodos Psicológicos, 4 (3), 243-249." href="/Bookshelves/Psychology/Book:_Research_Methods_in_Psychology_(Jhangiani_Cuttler_and_Leighton)/05:_Experimental_Research/5.03:_Experimental_Design#footnote-63-1">[1]. Los participantes en este diseño entre sujetos dieron al número 9 una calificación media de 5.13 y al número 221 una calificación media de 3.10. En otras palabras, ¡calificaron 9 como mayores que 221! Según Birnbaum, esta diferencia se debe a que los participantes compararon espontáneamente 9 con otros números de un dígito (en cuyo caso es relativamente grande) y compararon 221 con otros números de tres dígitos (en cuyo caso es relativamente pequeño).

    Diseños simultáneos dentro de sujetos

    Hasta el momento, hemos discutido un enfoque de diseños dentro de temas en los que los participantes son probados en una condición a la vez. Existe otro enfoque, sin embargo, que a menudo se usa cuando los participantes hacen múltiples respuestas en cada condición. Imagínese, por ejemplo, que los participantes juzguen la culpabilidad de 10 acusados atractivos y 10 acusados poco atractivos. En lugar de que la gente haga juicios sobre los 10 acusados de un tipo seguidos de los 10 acusados del otro tipo, el investigador podría presentar a los 20 acusados en una secuencia que mezclara los dos tipos. El investigador podría entonces calcular la calificación media de cada participante para cada tipo de acusado. O imagina un experimento diseñado para ver si las personas con trastorno de ansiedad social recuerdan adjetivos negativos (por ejemplo, “estúpido”, “incompetente”) mejor que los positivos (por ejemplo, “feliz”, “productivo”). El investigador podría hacer que los participantes estudien una sola lista que incluya ambos tipos de palabras y luego hacer que intenten recordar tantas palabras como sea posible. El investigador pudo entonces contar el número de cada tipo de palabra que se recordó.

    ¿Entre sujetos o dentro de los sujetos?

    Casi todos los experimentos se pueden realizar utilizando un diseño entre sujetos o un diseño dentro de los sujetos. Esta posibilidad significa que los investigadores deben elegir entre los dos enfoques en función de sus méritos relativos para la situación particular.

    Los experimentos entre sujetos tienen la ventaja de ser conceptualmente más simples y requieren menos tiempo de prueba por participante. También evitan los efectos de arrastre sin necesidad de contrapeso. Los experimentos dentro de sujetos tienen la ventaja de controlar variables de participantes extrañas, lo que generalmente reduce el ruido en los datos y facilita la detección de cualquier efecto de la variable independiente sobre la variable dependiente. Los experimentos dentro de los sujetos también requieren menos participantes que los experimentos entre sujetos para detectar un efecto del mismo tamaño.

    Una buena regla general, entonces, es que si es posible realizar un experimento dentro de los sujetos (con un contrapeso adecuado) en el tiempo que está disponible por participante y no tiene serias preocupaciones sobre los efectos de arrastre, este diseño es probablemente la mejor opción. Si un diseño dentro de los sujetos sería difícil o imposible de llevar a cabo, entonces deberías considerar un diseño entre sujetos en su lugar. Por ejemplo, si estaba evaluando a participantes en la sala de espera de un médico o compradores en fila en una tienda de comestibles, es posible que no tenga tiempo suficiente para evaluar a cada participante en todas las condiciones y, por lo tanto, optaría por un diseño entre temas. O imagina que estabas tratando de reducir el nivel de prejuicio de las personas haciéndolas interactuar con alguien de otra raza. Un diseño dentro de los sujetos con contrapeso requeriría probar primero a algunos participantes en la condición de tratamiento y luego en una condición de control. Pero si el tratamiento funciona y reduce el nivel de prejuicio de las personas, entonces ya no serían adecuadas para las pruebas en la condición de control. Esta dificultad es cierta para muchos diseños que involucran un tratamiento destinado a producir cambios a largo plazo en el comportamiento de los participantes (por ejemplo, estudios que prueban la efectividad de la psicoterapia). Claramente, aquí sería necesario un diseño entre sujetos.

    Recuerde también que usar un tipo de diseño no excluye usar el otro tipo en un estudio diferente. No hay razón para que un investigador no pueda usar tanto un diseño entre sujetos como un diseño dentro de sujetos para responder a la misma pregunta de investigación. De hecho, los investigadores profesionales suelen adoptar exactamente este tipo de enfoque de métodos mixtos.

    Referencias

    1. Birnbaum, M.H. (1999). Cómo demostrar que 9>221: Recoger juicios en un diseño entre sujetos. Métodos Psicológicos, 4 (3), 243-249.

    This page titled 5.3: Diseño experimental is shared under a CC BY-NC-SA license and was authored, remixed, and/or curated by Rajiv S. Jhangiani, I-Chant A. Chiang, Carrie Cuttler, & Dana C. Leighton.