4.3: Acondicionamiento y aprendizaje

Última actualización
Guardar como PDF

Page ID: 146554

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

Por Mark E. Bouton

Universidad de Vermont

Los principios básicos del aprendizaje siempre están operando e influyendo siempre en el comportamiento humano. Este módulo analiza las dos formas más fundamentales de aprendizaje: el condicionamiento clásico (pavloviano) y el instrumental (operante). A través de ellos, aprendemos respectivamente a asociar 1) estímulos en el ambiente, o 2) nuestros propios comportamientos, con eventos significativos, como recompensas y castigos. Los dos tipos de aprendizaje han sido estudiados intensamente porque tienen poderosos efectos sobre el comportamiento, y porque proporcionan métodos que permiten a los científicos analizar rigurosamente los procesos de aprendizaje. Este módulo describe algunas de las cosas más importantes que debes saber sobre el condicionamiento clásico e instrumental, e ilustra algunas de las muchas formas en que nos ayudan a entender el comportamiento normal y desordenado en los humanos. El módulo concluye introduciendo el concepto de aprendizaje observacional, que es una forma de aprendizaje que es en gran parte distinta del condicionamiento clásico y operante.

objetivos de aprendizaje

Distinguir entre el condicionamiento clásico (pavloviano) y el condicionamiento instrumental (operante).
Entender algunos datos importantes sobre cada uno que nos digan cómo funcionan.
Entender cómo trabajan por separado y juntos para influir en el comportamiento humano en el mundo fuera del laboratorio.
Los estudiantes podrán enumerar los cuatro aspectos del aprendizaje observacional de acuerdo con la Teoría del Aprendizaje Social.

Dos Tipos de Acondicionamiento

A pesar de que Ivan Pavlov ganó un Premio Nobel por estudiar digestión, es mucho más famoso por otra cosa: trabajar con un perro, una campana y un tazón de saliva. Muchas personas están familiarizadas con el estudio clásico del “perro de Pavlov”, pero rara vez entienden la importancia de su descubrimiento. De hecho, el trabajo de Pavlov ayuda a explicar por qué algunas personas se ponen ansiosas con solo mirar un autobús abarrotado, por qué se odia tanto el sonido de una alarma matutina, e incluso por qué renunciamos a ciertos alimentos que solo hemos probado una vez. El condicionamiento clásico (o pavloviano) es una de las formas fundamentales en que aprendemos sobre el mundo que nos rodea. Pero es mucho más que una simple teoría del aprendizaje; también podría decirse que es una teoría de la identidad. Porque, una vez que entiendas el condicionamiento clásico, reconocerás que tu música favorita, tu ropa, incluso candidato político, podría ser el resultado del mismo proceso que hace que un perro babee al son de campana.

Un perro levanta la vista desde el piso de la cocina con ojos expectantes y su lengua colgando. — El Pavlov en All of Us: ¿Tu perro aprende a mendigar comida porque la refuerzas alimentándola de la mesa? [Imagen: David Mease, https://goo.gl/R9cQV7, CC BY-NC 2.0, goo.gl/filc2e]

Hacia el cambio del siglo XX, los científicos que estaban interesados en comprender el comportamiento de los animales y los humanos comenzaron a apreciar la importancia de dos formas muy básicas de aprendizaje. Uno, que fue estudiado por primera vez por el fisiólogo ruso Ivan Pavlov, se conoce como acondicionamiento clásico, o pavloviano. En su famoso experimento, Pavlov tocó una campana y luego le dio algo de comida a un perro. Después de repetir este emparejamiento varias veces, el perro finalmente trató la campana como una señal de comida, y comenzó a salivar anticipándose a la golosina. Este tipo de resultado se ha reproducido en el laboratorio utilizando una amplia gama de señales (por ejemplo, tonos, luz, gustos, escenarios) emparejadas con muchos eventos diferentes además de la comida (por ejemplo, drogas, choques, enfermedades; ver más abajo).

Ahora creemos que este mismo proceso de aprendizaje se dedica, por ejemplo, cuando los humanos asocian una droga que han tomado con el ambiente en el que la han tomado; cuando asocian un estímulo (por ejemplo, un símbolo de vacaciones, como una gran toalla de playa) con un evento emocional (como una explosión de felicidad); y cuando ellos asociar el sabor de un alimento con la intoxicación alimentaria. Si bien el condicionamiento clásico puede parecer una teoría “vieja” o “demasiado simple”, todavía se estudia ampliamente hoy en día por al menos dos razones: Primero, es una prueba directa de aprendizaje asociativo que se puede utilizar para estudiar otras conductas más complejas. Segundo, debido a que el condicionamiento clásico siempre está ocurriendo en nuestras vidas, sus efectos sobre el comportamiento tienen implicaciones importantes para comprender el comportamiento normal y desordenado en los humanos.

De manera general, el condicionamiento clásico ocurre siempre que los estímulos neutros se asocian con eventos psicológicamente significativos. Con la intoxicación alimentaria, por ejemplo, aunque tener pescado para cenar normalmente puede no ser algo de lo que preocuparse (es decir, un “estímulo neutro”), si provoca que te enfermes, ahora probablemente asociarás esos estímulos neutros (el pez) con el evento psicológicamente significativo de enfermarte. Estos eventos emparejados a menudo se describen usando términos que se pueden aplicar a cualquier situación.

El alimento para perros en el experimento de Pavlov se llama estímulo incondicionado (US) porque provoca una respuesta incondicionada (UR). Es decir, sin ningún tipo de “entrenamiento” o “enseñanza”, el estímulo produce una reacción natural o instintiva. En el caso de Pavlov, la comida (EU) automáticamente hace que el perro babee (UR). Otros ejemplos de estímulos incondicionados incluyen ruidos fuertes (US) que nos sobresaltan (UR), o una ducha caliente (US) que produce placer (UR).

Por otro lado, un estímulo condicionado produce una respuesta condicionada. Un estímulo condicionado (CS) es una señal que no tiene importancia para el organismo hasta que se empareja con algo que sí tiene importancia. Por ejemplo, en el experimento de Pavlov, la campana es el estímulo condicionado. Antes de que el perro haya aprendido a asociar la campana (CS) con la presencia de comida (US), escuchar la campana no significa nada para el perro. No obstante, después de múltiples maridajes de la campana con la presentación de comida, el perro comienza a babear al son de la campana. Este babeo en respuesta a la campana es la respuesta condicionada (CR). Aunque puede resultar confuso, la respuesta condicionada es casi siempre la misma que la respuesta incondicionada. Sin embargo, se le llama la respuesta condicionada porque está condicionada a (o, depende de) estar emparejada con el estímulo condicionado (por ejemplo, la campana). Para ayudar a que esto sea más claro, considera tener mucha hambre cuando veas el logo de un restaurante de comida rápida. Hay una buena posibilidad de que empieces a salivar. Si bien es el consumo real de la comida (EU) lo que normalmente produce la salivación (UR), el simple hecho de ver el logotipo del restaurante (CS) puede desencadenar la misma reacción (CR).

Otro ejemplo con el que probablemente estés muy familiarizado involucra tu despertador. Si eres como la mayoría de la gente, despertarte temprano generalmente te hace infeliz. En este caso, despertarse temprano (US) produce una sensación natural de malhumorado (UR). Sin embargo, en lugar de despertarse temprano por su cuenta, es probable que tenga un despertador que reproduzca un tono para despertarlo. Antes de poner tu alarma a ese tono en particular, imaginemos que tenías sentimientos neutros al respecto (es decir, el tono no tenía significado previo para ti). No obstante, ahora que lo usas para despertarte todas las mañanas, psicológicamente “emparejas” ese tono (CS) con tus sentimientos de malhumor por la mañana (UR). Después de suficientes emparejamientos, este tono (CS) producirá automáticamente tu respuesta natural de malhumorado (CR). Así, esta vinculación entre el estímulo incondicionado (EU; despertar temprano) y el estímulo condicionado (CS; el tono) es tan fuerte que la respuesta incondicionada (UR; ser gruñón) se convertirá en una respuesta condicionada (CR; e.g., escuchar el tono en cualquier momento del día, ya sea despertando o caminando por el calle, te hará gruñón). Los estudios modernos de acondicionamiento clásico utilizan una amplia gama de CSS y USs y miden una amplia gama de respuestas condicionadas.

Una fila de máquinas de goma de mascar que funcionan con monedas. — Recibir una recompensa puede condicionarte hacia ciertos comportamientos. Por ejemplo, cuando eras niño, es posible que tu madre te haya ofrecido este trato: “No hagas ningún escándalo cuando estemos en el supermercado y obtendrás una golosina al salir”. [Imagen: Oliver Hammond, https://goo.gl/xFKiZL, CC BY-NC-SA 2.0, goo.gl/toc0zf]

Si bien el condicionamiento clásico es una explicación poderosa de cómo aprendemos muchas cosas diferentes, existe una segunda forma de condicionamiento que también ayuda a explicar cómo aprendemos. Estudiado primero por Edward Thorndike, y posteriormente extendido por B. F. Skinner, este segundo tipo de condicionamiento se conoce como condicionamiento instrumental u operante. El condicionamiento operante ocurre cuando un comportamiento (a diferencia de un estímulo) se asocia con la ocurrencia de un evento significativo. En el ejemplo más conocido, una rata en un laboratorio aprende a presionar una palanca en una jaula (llamada “caja Skinner”) para recibir comida. Debido a que la rata no tiene asociación “natural” entre presionar una palanca y obtener comida, la rata tiene que aprender esta conexión. Al principio, la rata puede simplemente explorar su jaula, trepándose encima de las cosas, enterrando debajo de las cosas, en busca de comida. Eventualmente mientras hurga alrededor de su jaula, la rata accidentalmente presiona la palanca, y un pellet de comida cae dentro. Este comportamiento voluntario se llama comportamiento operante, porque “opera” en el medio ambiente (es decir, es una acción que el propio animal realiza).

Ahora, una vez que la rata reconoce que recibe un trozo de alimento cada vez que presiona la palanca, se refuerza el comportamiento de presionar la palanca. Es decir, los pellets de comida sirven como refuerzos porque fortalecen el deseo de la rata de comprometerse con el medio ambiente de esta manera particular. En un ejemplo paralelo, imagina que estás jugando a un videojuego de carreras en la calle. A medida que conduces varias veces por un curso de la ciudad, intentas varias calles diferentes para llegar a la meta. En una de estas pruebas, descubres un atajo que mejora drásticamente tu tiempo general. Has aprendido este nuevo camino a través del condicionamiento operante. Es decir, al relacionarse con su entorno (respuestas operantes), realizó una secuencia de comportamientos que se reforzó positivamente (es decir, encontró la distancia más corta hasta la línea de meta). Y ahora que has aprendido a conducir este curso, realizarás esa misma secuencia de comportamientos de manejo (así como la rata presiona la palanca) para recibir tu recompensa de un acabado más rápido.

La investigación del condicionamiento operante estudia cómo los efectos de un comportamiento influyen en la probabilidad de que vuelva a ocurrir. Por ejemplo, los efectos del comportamiento de presión de palanca de la rata (es decir, recibir un pellet de comida) influyen en la probabilidad de que siga presionando la palanca. Porque, según la ley de efecto de Thorndike, cuando una conducta tiene un efecto o consecuencia positiva (satisfactoria), es probable que se repita en el futuro. Sin embargo, cuando un comportamiento tiene una consecuencia negativa (dolorosa/molesta), es menos probable que se repita en el futuro. Los efectos que aumentan los comportamientos se denominan reforzadores, y los efectos que los disminuyen se denominan castigadores.

Un ejemplo cotidiano que ayuda a ilustrar el condicionamiento operante es esforzarse por obtener una buena calificación en clase, lo que podría considerarse una recompensa para los estudiantes (es decir, produce una respuesta emocional positiva). Para obtener esa recompensa (similar a la rata aprendiendo a presionar la palanca), el alumno necesita modificar su comportamiento. Por ejemplo, el alumno puede aprender que hablar en clase le consigue puntos de participación (un reforzador), por lo que el alumno habla repetidamente. Sin embargo, el estudiante también aprende que él/ella no debe hablar sobre cualquier cosa; hablar de temas no relacionados con la escuela en realidad cuesta puntos. Por lo tanto, a través de las conductas libremente elegidas por el alumno, aprende qué comportamientos se refuerzan y cuáles son castigados.

Una distinción importante del condicionamiento operante es que proporciona un método para estudiar cómo las consecuencias influyen en el comportamiento “voluntario”. La decisión de la rata de presionar la palanca es voluntaria, en el sentido de que la rata es libre de hacer y repetir esa respuesta cuando quiera. El condicionamiento clásico, por otro lado, es justo lo contrario, dependiendo en cambio del comportamiento “involuntario” (por ejemplo, el perro no elige babear; simplemente lo hace). Entonces, mientras que la rata debe participar activamente y realizar algún tipo de comportamiento para lograr su recompensa, el perro en el experimento de Pavlov es un participante pasivo. Una de las lecciones de la investigación del condicionamiento operante, entonces, es que el comportamiento voluntario está fuertemente influenciado por sus consecuencias.

Una representación del condicionamiento clásico y operante. La imagen superior muestra campanas sonando que conducen a la comida. La imagen inferior muestra a una rata presionando una palanca que la lleva a recibir comida. — [Imagen cortesía de Bernard W. Balleine]

La ilustración de la izquierda resume los elementos básicos del condicionamiento clásico e instrumental. Los dos tipos de aprendizaje difieren de muchas maneras. Sin embargo, los pensadores modernos a menudo enfatizan el hecho de que difieren, como se ilustra aquí, en lo que se aprende. En el condicionamiento clásico, el animal se comporta como si hubiera aprendido a asociar un estímulo con un evento significativo. En el condicionamiento operante, el animal se comporta como si hubiera aprendido a asociar un comportamiento con un evento significativo. Otra diferencia es que la respuesta en la situación clásica (e.g., salivación) es suscitada por un estímulo que le precede, mientras que la respuesta en el caso operante no es suscitada por ningún estímulo en particular. En cambio, se dice que se emiten respuestas operantes. La palabra “emitido” transmite además la idea de que los comportamientos operantes son esencialmente de naturaleza voluntaria.

Comprender el condicionamiento clásico y operante proporciona a los psicólogos muchas herramientas para comprender el aprendizaje y el comportamiento en el mundo fuera del laboratorio. Esto se debe en parte a que los dos tipos de aprendizaje ocurren continuamente a lo largo de nuestras vidas. Se ha dicho que “al igual que las leyes de la gravedad, las leyes del aprendizaje están siempre vigentes” (Spreat & Spreat, 1982).

Cosas útiles que debe saber sobre el acondicionamiento clásico

El condicionamiento clásico tiene muchos efectos en el comportamiento

Un CS clásico (por ejemplo, la campana) no solo provoca un reflejo simple y unitario. Pavlov enfatizó la salivación porque esa fue la única respuesta que midió. Pero su campana casi con certeza provocó todo un sistema de respuestas que funcionaron para preparar al organismo para los próximos Estados Unidos (comida) (ver Timberlake, 2001). Por ejemplo, además de la salivación, los CSS (como la campana) que señalan que los alimentos están cerca también provocan la secreción de ácido gástrico, enzimas pancreáticas e insulina (que introduce glucosa en sangre a las células). Todas estas respuestas preparan al cuerpo para la digestión. Adicionalmente, el CS provoca un comportamiento de aproximación y un estado de excitación. Y presentar un CS como alimento también puede hacer que los animales cuyos estómagos estén llenos coman más alimentos si está disponible. De hecho, los CSS de comida son tan frecuentes en la sociedad moderna, los humanos también se inclinan a comer o sentir hambre en respuesta a las señales asociadas con la comida, como el sonido de una bolsa de papas fritas que se abre, la vista de un logotipo conocido (por ejemplo, Coca-Cola), o la sensación del sofá frente a la televisión.

El condicionamiento clásico también está involucrado en otros aspectos de la alimentación. Los sabores asociados a ciertos nutrientes (como el azúcar o la grasa) pueden llegar a ser preferidos sin despertar ninguna conciencia del maridaje. Por ejemplo, la proteína es un US que tu cuerpo anhela automáticamente más una vez que empiezas a consumirla (UR): dado que las proteínas están altamente concentradas en la carne, el sabor de la carne se convierte en un CS (o cue, que las proteínas están en camino), lo que perpetúa el ciclo de ansia de aún más carne (esta automática corporal reacción ahora un CR).

De manera similar, los sabores asociados con el dolor de estómago o enfermedad se evitan y desagradan. Por ejemplo, una persona que se enferma después de beber demasiado tequila puede adquirir una profunda aversión al sabor y olor del tequila, un fenómeno llamado condicionamiento de aversión al gusto. El hecho de que los sabores a menudo se asocien con tantas consecuencias de comer es importante para los animales (incluidas las ratas y los humanos) que con frecuencia están expuestos a nuevos alimentos. Y es clínicamente relevante. Por ejemplo, los medicamentos utilizados en la quimioterapia suelen enfermar a los pacientes con cáncer. Como consecuencia, los pacientes suelen adquirir aversiones a los alimentos ingeridos justo antes del tratamiento, o incluso aversiones a cosas como la sala de espera de la propia clínica de quimioterapia (ver Bernstein, 1991; Scalera & Bavieri, 2009).

El condicionamiento clásico ocurre con una variedad de eventos significativos. Si un experimentador suena un tono justo antes de aplicar un choque leve a los pies de una rata, el tono provocará miedo o ansiedad después de uno o dos emparejamientos. El condicionamiento similar del miedo juega un papel en la creación de muchos trastornos de ansiedad en los humanos, como las fobias y los trastornos de pánico, donde las personas asocian señales (como espacios cerrados, o un centro comercial) con pánico u otro trauma emocional (ver Mineka y Zinbarg, 2006). Aquí, más que una respuesta física (como babear), el CS desencadena una emoción.

Otro efecto interesante del condicionamiento clásico puede ocurrir cuando ingerimos drogas. Es decir, cuando se toma un medicamento, puede asociarse con las señales que están presentes al mismo tiempo (por ejemplo, habitaciones, olores, parafernalia de drogas). En este sentido, si alguien asocia un olor particular con la sensación inducida por la droga, siempre que esa persona huela el mismo olor después, puede indicar respuestas (físicas y/o emocionales) relacionadas con tomar el medicamento en sí. Pero las señales de drogas tienen una propiedad aún más interesante: provocan respuestas que a menudo “compensan” el próximo efecto de la droga (ver Siegel, 1989). Por ejemplo, la morfina misma suprime el dolor; sin embargo, si alguien está acostumbrado a tomar morfina, una señal que indique que “la droga llegará pronto” en realidad puede hacer que la persona sea más sensible al dolor. Debido a que la persona sabe que pronto se le administrará un supresor del dolor, el cuerpo se vuelve más sensible, anticipando que “el medicamento pronto se encargará de ello”. Notablemente, tales respuestas compensatorias condicionadas a su vez disminuyen el impacto de la droga en el cuerpo, porque el cuerpo se ha vuelto más sensible al dolor.

Esta respuesta compensatoria condicionada tiene muchas implicaciones. Por ejemplo, un consumidor de drogas será más “tolerante” a la droga en presencia de señales que se han asociado con ella (porque tales señales provocan respuestas compensatorias). Como resultado, la sobredosis generalmente no se debe a un aumento en la dosis, sino a tomar el medicamento en un nuevo lugar sin las señales familiares, lo que de otro modo habría permitido al usuario tolerar el medicamento (ver Siegel, Hinson, Krank, & McCully, 1982). Las respuestas compensatorias condicionadas (que incluyen una mayor sensibilidad al dolor y disminución de la temperatura corporal, entre otras) también pueden causar molestias, motivando así al consumidor de drogas a continuar el uso del medicamento para reducirlos. Esta es una de varias formas en que el condicionamiento clásico podría ser un factor en la drogadicción y dependencia.

Un efecto final de las señales clásicas es que motivan el comportamiento operante continuo (ver Balleine, 2005). Por ejemplo, si una rata ha aprendido a través del condicionamiento operante que presionar una palanca le dará un medicamento, ante la presencia de señales que indiquen que “la droga llegará pronto” (como el sonido de la palanca chirriando), la rata trabajará más duro para presionar la palanca que si esas señales no estuvieran presentes (es decir, no hay chirridos sonido de palanca). De manera similar, en presencia de señales asociadas a los alimentos (por ejemplo, olores), una rata (o un comedor excesivo) trabajará más duro para obtener comida. Y finalmente, incluso ante la presencia de señales negativas (como algo que señale miedo), una rata, un humano, o cualquier otro organismo trabajará más duro para evitar aquellas situaciones que puedan llevar a un trauma. Los CSS clásicos tienen así muchos efectos que pueden contribuir a fenómenos conductuales significativos.

Diagrama representa el bloqueo de un segundo estímulo, una luz, por el estímulo original, la campana que suena. El proceso se describe en la siguiente sección. — [Imagen cortesía de Bernard W. Balleine]

El proceso de aprendizaje

Como se mencionó anteriormente, el condicionamiento clásico proporciona un método para estudiar los procesos básicos de aprendizaje. Sin embargo, de manera algo contraintuitiva, los estudios muestran que emparejar un CS y un estadounidense no es suficiente para que se aprenda una asociación entre ellos. Considera un efecto llamado bloqueo (ver Kamin, 1969). En este efecto, un animal primero aprende a asociar un CS, llamarlo estímulo A, con un estadounidense. En la ilustración anterior, el sonido de una campana (estímulo A) se empareja con la presentación de alimentos. Una vez aprendida esta asociación, en una segunda fase, se presenta un segundo estímulo —el estímulo B— junto con el estímulo A, de tal manera que los dos estímulos se emparejan con Estados Unidos juntos. En la ilustración, se agrega una luz y se enciende al mismo tiempo que se toca la campana. Sin embargo, debido a que el animal ya ha aprendido la asociación entre el estímulo A (la campana) y la comida, el animal no aprende una asociación entre el estímulo B (la luz) y el alimento. Es decir, la respuesta condicionada sólo ocurre durante la presentación del estímulo A, porque el condicionamiento anterior de A “bloquea” el acondicionamiento de B cuando B se agrega a A. ¿La razón? El estímulo A ya predice EU, por lo que EU no sorprende cuando ocurre con el Estímulo B.

El aprendizaje depende de tal sorpresa, o de una discrepancia entre lo que ocurre en un ensayo de condicionamiento y lo que ya se predice por las señales que están presentes en el ensayo. Para aprender algo a través del condicionamiento clásico, primero debe haber algún error de predicción, o la posibilidad de que un estímulo condicionado no conduzca al resultado esperado. Con el ejemplo de la campana y la luz, porque la campana siempre lleva a la recompensa de la comida, no hay “error de predicción” que la adición de la luz ayude a corregir. No obstante, si el investigador de repente requiere que la campana y la luz ocurran ambas para recibir el alimento, la campana sola producirá un error de predicción que el animal tiene que aprender.

El bloqueo y otros efectos relacionados indican que el proceso de aprendizaje tiende a asimilar los predictores más válidos de eventos significativos e ignorar los menos útiles. Esto es común en el mundo real. Por ejemplo, imagina que tu supermercado pone grandes pegatinas en forma de estrella en los productos que están a la venta. Rápidamente, aprendes que los artículos con las grandes pegatinas en forma de estrella son más baratos. No obstante, imagina que vas a un supermercado similar que no solo usa estas pegatinas, sino que también usa etiquetas de precio naranja brillante para denotar un descuento. Debido al bloqueo (es decir, ya sabes que las pegatinas en forma de estrella indican un descuento), no tienes que aprender el sistema de color, también. Las pegatinas en forma de estrella te dicen todo lo que necesitas saber (es decir, no hay error de predicción para el descuento), y así el sistema de color es irrelevante.

El condicionamiento clásico es más fuerte si el CS y US son intensos o sobresalientes. También es mejor si el CS y EU son relativamente nuevos y el organismo no ha estado expuesto frecuentemente a ellos antes. Y es especialmente fuerte si la biología del organismo lo ha preparado para asociar un CS particular y EU. Por ejemplo, las ratas y los humanos están naturalmente inclinados a asociar una enfermedad con un sabor, más que con una luz o tono. Debido a que los alimentos se experimentan más comúnmente por el sabor, si hay algún alimento en particular que nos enferme, asociar el sabor (en lugar de la apariencia, que puede ser similar a otros alimentos) con la enfermedad asegurará en mayor medida que evitemos ese alimento en el futuro, y así evitar enfermarnos. Esta tendencia de clasificación, que se establece por la evolución, se llama preparación.

Hay muchos factores que afectan la fuerza del condicionamiento clásico, y estos han sido objeto de mucha investigación y teoría (ver Rescorla & Wagner, 1972; Pearce & Bouton, 2001). Los neurocientíficos del comportamiento también han utilizado el condicionamiento clásico para investigar muchos de los procesos cerebrales básicos que están involucrados en el aprendizaje (ver Fanselow & Poulos, 2005; Thompson & Steinmetz, 2009).

Borrando el aprendizaje clásico

Después del acondicionamiento, la respuesta al CS puede ser eliminada si el CS se presenta repetidamente sin el US. Este efecto se llama extinción, y se dice que la respuesta se “extingue”. Por ejemplo, si Pavlov seguía tocando la campana pero nunca le daba comida al perro después, eventualmente el CR (babeo) del perro ya no sucedería cuando escuchara el CS (la campana), porque la campana ya no sería un predictor de comida. La extinción es importante por muchas razones. Por un lado, es la base de muchas terapias que los psicólogos clínicos utilizan para eliminar conductas desadaptativas y no deseadas. Tomemos el ejemplo de una persona que tiene un miedo debilitante a las arañas: un enfoque podría incluir la exposición sistemática a las arañas. Mientras que, inicialmente la persona tiene un CR (por ejemplo, miedo extremo) cada vez que ve el CS (por ejemplo, la araña), después de que se le muestren repetidamente imágenes de arañas en condiciones neutras, muy pronto el CS ya no predice el CR (es decir, la persona no tiene la reacción de miedo al ver arañas, habiendo aprendido eso las arañas ya no sirven de “señal” para ese miedo). Aquí, la exposición repetida a las arañas sin una consecuencia aversiva provoca la extinción.

Los psicólogos deben aceptar un hecho importante sobre la extinción, sin embargo: no necesariamente destruye el aprendizaje original (ver Bouton, 2004). Por ejemplo, imagina que asocias fuertemente el olor de las pizarras con la agonía de la detención en la secundaria. Ahora imagina que, después de años de encontrarse con pizarras, el olor de las mismas ya no recuerda la agonía de la detención (ejemplo de extinción). Sin embargo, un día, después de entrar por primera vez a un edificio nuevo, de repente escuchas un olor a pizarra y ¡WHAM! , vuelve la agonía de la detención. Esto se llama recuperación espontánea: después de un lapso en la exposición al CS después de que se haya producido la extinción, en ocasiones la reexposición al CS (por ejemplo, el olor a pizarras) puede evocar nuevamente al CR (por ejemplo, la agonía de la detención).

Otro fenómeno relacionado es el efecto de renovación: Después de la extinción, si el CS se prueba en un nuevo contexto, como una habitación o ubicación diferente, el CR también puede regresar. En el ejemplo de la pizarra, la acción de entrar a un nuevo edificio —donde no se espera oler pizarras— renueva repentinamente las sensaciones asociadas a la detención. Estos efectos han sido interpretados para sugerir que la extinción inhibe más que borra el comportamiento aprendido, y esta inhibición se expresa principalmente en el contexto en el que se aprende (ver “contexto” en la sección Vocabulario Clave a continuación).

Esto no quiere decir que la extinción sea un mal tratamiento para los trastornos de la conducta. En cambio, los médicos pueden aumentar su efectividad mediante el uso de investigaciones básicas sobre el aprendizaje para ayudar a vencer estos efectos de recaída (ver Craske et al., 2008). Por ejemplo, llevar a cabo terapias de extinción en contextos donde los pacientes podrían ser más vulnerables a la recaída (por ejemplo, en el trabajo), podría ser una buena estrategia para mejorar el éxito de la terapia.

Cosas útiles que debe saber sobre el acondicionamiento instrumental

La mayoría de las cosas que afectan la fuerza del condicionamiento clásico también afectan la fuerza del aprendizaje instrumental, por lo que aprendemos a asociar nuestras acciones con sus resultados. Como se señaló anteriormente, cuanto “más grande” es el reforzador (o castigador), más fuerte es el aprendizaje. Y, si ya no se refuerza un comportamiento instrumental, también se extinguirá. La mayoría de las reglas del aprendizaje asociativo que se aplican al condicionamiento clásico también se aplican al aprendizaje instrumental, pero también vale la pena conocer otros hechos sobre el aprendizaje instrumental.

Las respuestas instrumentales están bajo control de estímulos

Como ya saben, la respuesta operante clásica en el laboratorio es el prensado de palanca en ratas, reforzado con alimentos. Sin embargo, las cosas se pueden organizar de manera que el prensado con palanca solo produzca pellets cuando un estímulo en particular está presente. Por ejemplo, el prensado de palanca solo se puede reforzar cuando se enciende una luz en la caja de Skinner; cuando la luz está apagada, no se libera comida al presionar la palanca. La rata pronto aprende a discriminar entre las condiciones de luz encendida y apagada, y presiona la palanca solo en presencia de la luz (las respuestas en la luz apagada se apagan). En la vida cotidiana, piensa en esperar en el carril de giro en un semáforo. Aunque sabes que verde significa ir, sólo cuando tienes la flecha verde giras. Al respecto, ahora se dice que el comportamiento operante está bajo control de estímulos. Y, como es el caso del semáforo, en el mundo real, el control de estímulos es probablemente la regla.

El estímulo que controla la respuesta operante se denomina estímulo discriminativo. Se puede asociar directamente a la respuesta, o al reforzador (ver abajo). Sin embargo, por lo general no provoca la respuesta como lo hace un CS clásico. En cambio, se dice que “marcó la ocasión” para la respuesta operante. Por ejemplo, un lienzo puesto frente a una artista no provoca el comportamiento de la pintura ni la obliga a pintar. Permite, o establece la ocasión para que ocurra la pintura.

Las técnicas de control de estímulos son ampliamente utilizadas en el laboratorio para estudiar la percepción y otros procesos psicológicos en animales. Por ejemplo, la rata no podría responder adecuadamente a las condiciones de encendido y apagado de luz si no pudiera ver la luz. Siguiendo esta lógica, experimentos que utilizan métodos de control de estímulos han probado qué tan bien los animales ven los colores, escuchan ultrasonidos y detectan campos magnéticos. Es decir, los investigadores emparejan estos estímulos discriminativos con aquellos que conocen que los animales ya entienden (como presionar la palanca). De esta manera, los investigadores pueden probar si los animales pueden aprender a presionar la palanca solo cuando se toca un ultrasonido, por ejemplo.

Estos métodos también pueden ser utilizados para estudiar procesos cognitivos “superiores”. Por ejemplo, las palomas pueden aprender a picotear diferentes botones en una caja de Skinner cuando se muestran imágenes de flores, autos, sillas o personas en una pantalla de televisión en miniatura (ver Wasserman, 1995). El botón de picoteo 1 (y ningún otro) se refuerza en presencia de una imagen de flor, el botón 2 en presencia de una imagen de silla, y así sucesivamente. Las palomas pueden aprender la discriminación fácilmente y, en las condiciones adecuadas, incluso picotearán los botones correctos asociados con imágenes de flores nuevas, autos, sillas y personas que nunca antes habían visto. Las aves han aprendido a categorizar los conjuntos de estímulos. Los métodos de control de estímulos se pueden utilizar para estudiar cómo se aprende dicha categorización.

El condicionamiento operante implica elección

Una paloma picotea un botón dentro de una caja de Skinner.

Otra cosa que hay que saber sobre el condicionamiento operante es que la respuesta siempre requiere elegir un comportamiento sobre otros. El estudiante que va al bar el jueves por la noche elige beber en lugar de quedarse en casa y estudiar. La rata elige presionar la palanca en lugar de dormir o rascarse la oreja en la parte posterior de la caja. Los comportamientos alternativos están asociados cada uno con sus propios refuerzos. Y la tendencia a realizar una acción en particular depende tanto de los reforzadores que se ganen por ella como de los reforzadores ganados por sus alternativas.

Para investigar esta idea, se ha estudiado la elección en la caja Skinner haciendo disponibles dos palancas para la rata (o dos botones disponibles para la paloma), cada una de las cuales tiene su propio refuerzo o tasa de recompensa. Un estudio minucioso de la elección en situaciones como esta ha llevado a una norma llamada ley cuantitativa del efecto (ver Herrnstein, 1970), que se puede entender sin entrar en detalles cuantitativos: La ley reconoce que los efectos de reforzar un comportamiento dependen crucialmente de cuánto el refuerzo se gana por las alternativas del comportamiento. Por ejemplo, si una paloma aprende que picotear una luz recompensará a dos bolitas de comida, mientras que la otra luz solo recompensa a una, la paloma solo picoteará la primera luz. No obstante, ¿qué pasa si la primera luz es más extenuante de alcanzar que la segunda? ¿El costo de la energía superará el aguinaldo de los alimentos? ¿O la comida extra valdrá la pena el trabajo? En general, un reforzador dado será menos reforzante si hay muchos refuerzos alternativos en el medio ambiente. Por esta razón, el alcohol, el sexo o las drogas pueden ser reforzadores menos poderosos si el ambiente de la persona está lleno de otras fuentes de refuerzo, como el logro en el trabajo o el amor de los miembros de la familia.

Cognición en el aprendizaje instrumental

La investigación moderna también indica que los reforzadores hacen más que simplemente fortalecer o “estampar” los comportamientos de los que son consecuencia, como fue la visión original de Thorndike. En cambio, los animales aprenden sobre las consecuencias específicas de cada comportamiento, y realizarán un comportamiento dependiendo de cuánto quieran actualmente, o “valoran”, su consecuencia.

La imagen representa el efecto de devaluación del reforzador descrito a continuación en el texto. — [Imagen cortesía de Bernard W. Balleine]

Esta idea se ilustra mejor con un fenómeno llamado efecto de devaluación reforzador (ver Colwill & Rescorla, 1986). Primero se entrena a una rata para realizar dos acciones instrumentales (por ejemplo, presionar una palanca a la izquierda y a la derecha), cada una emparejada con un reforzador diferente (por ejemplo, una solución de sacarosa dulce y un pellet de comida). Al final de este entrenamiento, la rata tiende a presionar ambas palancas, alternando entre la solución de sacarosa y el pellet alimenticio. En una segunda fase, uno de los refuerzos (por ejemplo, la sacarosa) se empareja entonces por separado con la enfermedad. Esto condiciona una aversión gustativa a la sacarosa. En una prueba final, la rata se devuelve a la caja de Skinner y se le permite presionar libremente cualquiera de las dos palancas. No se presentan refuerzos durante esta prueba (es decir, ninguna sacarosa o alimento proviene de presionar las palancas), por lo que el comportamiento durante las pruebas solo puede resultar del recuerdo de la rata de lo que ha aprendido antes. De manera importante aquí, la rata elige no realizar la respuesta que alguna vez produjo el reforzador al que ahora tiene aversión (por ejemplo, no presionará la palanca de sacarosa). Esto significa que la rata ha aprendido y recordado al reforzador asociado a cada respuesta, y puede combinar ese conocimiento con el conocimiento de que el reforzador ahora es “malo”. Los refuerzos no se limitan a estampar en las respuestas; el animal aprende mucho más que eso. Se dice que el comportamiento es “dirigido a objetivos” (ver Dickinson & Balleine, 1994), porque está influenciado por el valor actual de su meta asociada (es decir, cuánto quiere la rata/no quiere al reforzador).

Las cosas pueden complicarse más, sin embargo, si la rata realiza las acciones instrumentales de manera frecuente y repetida. Es decir, si la rata ha pasado muchos meses aprendiendo el valor de presionar cada una de las palancas, el acto de presionarlas se vuelve automático y rutinario. Y aquí, esta acción alguna vez dirigida por objetivos (es decir, la rata presionando la palanca para el objetivo de obtener sacarosa/comida) puede convertirse en un hábito. Así, si una rata pasa muchos meses realizando el comportamiento de presión de palanca (convirtiendo dicho comportamiento en un hábito), incluso cuando la sacarosa se empareja nuevamente con la enfermedad, la rata continuará presionando esa palanca (ver Holanda, 2004). Después de toda la práctica, la respuesta instrumental (presionar la palanca) ya no es sensible a la devaluación del reforzador. La rata sigue respondiendo automáticamente, independientemente de que la sacarosa de esta palanca la enferme.

Los hábitos son muy comunes en la experiencia humana, y pueden ser útiles. No necesitas volver a aprender cada día cómo hacer tu café por la mañana o cómo cepillarte los dientes. Los comportamientos instrumentales pueden llegar a ser habituales, permitiéndonos hacer el trabajo mientras somos libres de pensar en otras cosas.

Uniendo el Acondicionamiento Clásico e Instrumental

El condicionamiento clásico y operante generalmente se estudian por separado. Pero fuera del laboratorio casi siempre ocurren al mismo tiempo. Por ejemplo, una persona que está reforzada por beber alcohol o comer en exceso aprende estos comportamientos ante la presencia de ciertos estímulos: un pub, un grupo de amigos, un restaurante o posiblemente el sofá frente al televisor. Estos estímulos también están disponibles para su asociación con el reforzador. De esta manera, el condicionamiento clásico y operante siempre se entrelazan.

La siguiente figura resume esta idea, y ayuda a revisar lo que hemos comentado en este módulo. En términos generales, cualquier respuesta operante reforzada o castigada (R) se empareja con un desenlace (O) en presencia de algún estímulo o conjunto de estímulos (S).

La figura ilustra los tipos de asociaciones que se pueden aprender en este escenario tan general. Por un lado, el organismo aprenderá a asociar la respuesta y el resultado (R — O). Esto es condicionamiento instrumental. El proceso de aprendizaje aquí es probablemente similar al condicionamiento clásico, con todo su énfasis en la sorpresa y el error de predicción. Y, como discutimos al considerar el efecto de devaluación del reforzador, una vez que se aprenda R — O, el organismo estará listo para realizar la respuesta si se desea o valora el resultado. El valor del reforzador también puede ser influenciado por otros reforzadores ganados por otros comportamientos en la situación. Estos factores están en el centro del aprendizaje instrumental.

Segundo, el organismo también puede aprender a asociar el estímulo con el resultado reforzante (S — O). Este es el componente clásico del condicionamiento, y como hemos visto, puede tener muchas consecuencias sobre el comportamiento. Por un lado, el estímulo llegará a evocar un sistema de respuestas que ayuden al organismo a prepararse para el reforzador (no mostrado en la figura): El bebedor puede sufrir cambios en la temperatura corporal; el comensal puede salivar y tener un aumento en la secreción de insulina. Además, el estímulo evocará aproximación (si el resultado es positivo) o retroceso (si el resultado es negativo). La presentación del estímulo también provocará la respuesta instrumental.

La imagen representa la combinación de condicionamiento clásico y operante que suele ocurrir en el mundo real. El proceso, o la interacción entre estímulos, reforzadores y resultados, se describe en los párrafos anteriores.

La tercera asociación en el diagrama es la que existe entre el estímulo y la respuesta (S — R). Como se discutió anteriormente, después de mucha práctica, el estímulo puede comenzar a provocar la respuesta directamente. Se trata del aprendizaje de hábitos, mediante el cual la respuesta se produce de manera relativamente automática, sin mucho procesamiento mental de la relación entre la acción y el resultado y el valor actual del resultado.

El vínculo final en la figura es entre el estímulo y la asociación respuesta-resultado [S — (R — O)]. Más que simplemente entrar en una simple asociación con la R o la O, el estímulo puede indicar que la relación R — O está ahora vigente. Esto es lo que queremos decir cuando decimos que el estímulo puede “marcar la ocasión” para la respuesta operante: Establece la ocasión para la relación respuesta-reforzador. A través de este mecanismo, el pintor podría comenzar a pintar cuando se le den las herramientas adecuadas y la oportunidad que le brinda el lienzo. El lienzo teóricamente señala que el comportamiento de la pintura ahora se verá reforzado por consecuencias positivas.

La figura proporciona un marco que puedes usar para entender casi cualquier comportamiento aprendido que observes en ti mismo, tu familia o tus amigos. Si desea entenderlo más profundamente, considere tomar un curso sobre aprendizaje en el futuro, que le dará una apreciación más completa de cómo el aprendizaje clásico, el aprendizaje instrumental, el aprendizaje de hábitos y el entorno de ocasión realmente funcionan e interactúan.

Aprendizaje observacional

No todas las formas de aprendizaje se contabilizan enteramente por el condicionamiento clásico y operante. Imagínese a un niño caminando hacia un grupo de niños jugando un juego en el patio de recreo. El juego se ve divertido, pero es nuevo y desconocido. En lugar de unirse al juego de inmediato, el niño opta por sentarse y ver a los otros niños jugar una ronda o dos. Al observar a los demás, el niño toma nota de las formas en que se comporta mientras juega el juego. Al observar el comportamiento de los otros niños, el niño puede averiguar las reglas del juego e incluso algunas estrategias para que le vaya bien en el juego. Esto se llama aprendizaje observacional.

Un grupo de niños espera viendo a un adulto jugando una partida de ajedrez. — Niños observando un modelo social (un ajedrecista experimentado) para aprender las reglas y estrategias del juego de ajedrez. [Imagen: David R. Tribble, https://goo.gl/nWsgxI, CC BY-SA 3.0, goo.gl/uhhola]

El aprendizaje observacional es un componente de la Teoría del Aprendizaje Social de Albert Bandura (Bandura, 1977), que postula que los individuos pueden aprender respuestas novedosas a través de la observación de los comportamientos clave de otros. El aprendizaje observacional no necesariamente requiere refuerzo, sino que depende de la presencia de otros, denominados modelos sociales. Los modelos sociales suelen ser de mayor estatus o autoridad en comparación con el observador, ejemplos de los cuales incluyen padres, maestros y policías. En el ejemplo anterior, los niños que ya saben jugar el juego podrían ser considerados como autoridades —y por tanto son modelos sociales— aunque tengan la misma edad que el observador. Al observar cómo se comportan los modelos sociales, un individuo es capaz de aprender a actuar en una determinada situación. Otros ejemplos de aprendizaje observacional podrían incluir que un niño aprendiera a colocar su servilleta en su regazo observando a sus padres en la mesa, o un cliente aprendiendo dónde encontrar el ketchup y la mostaza después de observar a otros clientes en un puesto de hot dog.

Bandura teoriza que el proceso de aprendizaje observacional consta de cuatro partes. El primero es la atención —ya que, sencillamente, hay que prestar atención a lo que está observando para poder aprender. La segunda parte es la retención: para aprender uno debe ser capaz de retener el comportamiento s/él está observando en la memoria.La tercera parte del aprendizaje observacional, la iniciación, reconoce que el alumno debe ser capaz de ejecutar (o iniciar) el comportamiento aprendido. Por último, el observador debe poseer la motivación para dedicarse al aprendizaje observacional. En nuestra viñeta, el niño debe querer aprender a jugar el juego para poder participar adecuadamente en el aprendizaje observacional.

Los investigadores han realizado innumerables experimentos diseñados para explorar el aprendizaje observacional, el más famoso de los cuales es el “experimento de muñecas Bobo” de Albert Bandura.

Una ilustración de una muñeca bobo. La muñeca tiene una base ancha y redondeada y luego se vuelve progresivamente más estrecha hasta su cabeza. — Bobo [Imagen: © Sémhur/Wikimedia Commons/CC-BY-SA-3.0 (o Licencia de Arte Libre), goo.gl/Uhhola]

En este experimento (Bandura, Ross & Ross 1961), Bandura hizo que los niños observaran individualmente a un modelo social adulto interactuar con una muñeca payaso (“Bobo”). Para un grupo de niños, el adulto interactuó agresivamente con Bobo: golpeándolo, pateándolo, tirándolo e incluso golpeándolo en la cara con un mazo de juguete. Otro grupo de niños observó al adulto interactuar con otros juguetes, sin mostrar ninguna agresión hacia Bobo. En ambos casos el adulto se fue y a los niños se les permitió interactuar con Bobo por su cuenta. Bandura encontró que los niños expuestos al modelo social agresivo tenían significativamente más probabilidades de comportarse agresivamente hacia Bobo, golpeándolo y pateando, en comparación con los expuestos al modelo no agresivo. Los investigadores concluyeron que los niños del grupo agresivo utilizaron sus observaciones del comportamiento del modelo social adulto para determinar que el comportamiento agresivo hacia Bobo era aceptable.

Si bien no se requirió refuerzo para provocar el comportamiento de los niños en el primer experimento de Bandura, es importante reconocer que las consecuencias sí juegan un papel dentro del aprendizaje observacional. Una futura adaptación de este estudio (Bandura, Ross, & Ross, 1963) demostró que los niños del grupo de agresión mostraron un comportamiento menos agresivo si presenciaban que el modelo adulto recibía castigo por agredir a Bobo. Bandura se refirió a este proceso como refuerzo vicario, ya que los niños no experimentaron el refuerzo ni el castigo directamente, pero aún así fueron influenciados por observarlo.

Conclusión

Hemos cubierto tres explicaciones principales de cómo aprendemos a comportarnos e interactuar con el mundo que nos rodea. Considerando tus propias experiencias, ¿qué tan bien te aplican estas teorías? Quizás al reflexionar sobre tu sentido personal de la moda, te das cuenta de que tiendes a seleccionar ropa en la que otros te han felicitado (condicionamiento operante). O tal vez, pensando en un nuevo restaurante que probaste recientemente, te das cuenta de que lo elegiste porque sus comerciales tocan música feliz (condicionamiento clásico). O tal vez ahora siempre llegas a tiempo con tus tareas, porque viste cómo se castigaba a otros cuando llegaban tarde (aprendizaje observacional). Independientemente de la actividad, comportamiento o respuesta, es muy probable que su “decisión” de hacerlo pueda explicarse en base a una de las teorías presentadas en este módulo.

Recursos Externos

Artículo: Rescorla, R. A. (1988). Acondicionamiento pavloviano: No es lo que piensas que es. Psicólogo Americano, 43, 151—160.
Libro: Bouton, M. E. (2007). Aprendizaje y comportamiento: Una síntesis contemporánea. Sunderland, MA: Asociados Sinauer.
Libro: Bouton, M. E. (2009). Teoría del aprendizaje. En B. J. Sadock, V. A. Sadock, & P. Ruiz (Eds.), el libro de texto integral de psiquiatría de Kaplan & Sadock (9ª ed., Vol. 1, pp. 647—658). Nueva York, NY: Lippincott Williams & Wilkins.
Libro: Domjan, M. (2010). Los principios del aprendizaje y la conducta (6ª ed.). Belmont, CA: Wadsworth.
Video: Albert Bandura habla sobre el experimento Bobo Doll.

Preguntas de Discusión

Describe tres ejemplos de condicionamiento pavloviano (clásico) que has visto en tu propio comportamiento, o el de tus amigos o familiares, en los últimos días.
Describe tres ejemplos de condicionamiento instrumental (operante) que has visto en tu propio comportamiento, o el de tus amigos o familiares, en los últimos días.
Los fármacos pueden ser potentes reforzadores. Discuta cómo el condicionamiento pavloviano y el condicionamiento instrumental pueden trabajar juntos para influir en el consumo de
En el mundo moderno, los alimentos procesados están altamente disponibles y han sido diseñados para ser altamente apetecibles y reforzantes. Discuta cómo el condicionamiento pavloviano e instrumental pueden trabajar juntos para explicar por qué la gente suele comer demasiado.
¿Cómo desafía el bloqueo la idea de que los emparejamientos de un CS y EU son suficientes para causar condicionamiento pavloviano? ¿Qué es importante para crear el aprendizaje pavloviano?
¿Cómo desafía el efecto de devaluación del reforzador la idea de que los reforzadores simplemente “estampan” la respuesta operante? ¿Qué nos dice el efecto que los animales aprenden realmente en el condicionamiento operante?
Con respecto al aprendizaje social ¿crees que la gente aprende violencia al observar la violencia en las películas? ¿Por qué o por qué no?
¿Qué crees que has aprendido a través del aprendizaje social? ¿Quiénes son tus modelos sociales?

El vocabulario

Bloquear: En el condicionamiento clásico, el hallazgo de que no se produce condicionamiento a un estímulo si se combina con un estímulo previamente condicionado durante los ensayos de condicionamiento. Sugiere que la información, el valor sorpresa o el error de predicción son importantes en el condicionamiento.
Categorizar: Ordenar u organizar diferentes artículos en clases o categorías.
Acondicionamiento clásico: El procedimiento en el que un estímulo inicialmente neutro (el estímulo condicionado, o CS) se empareja con un estímulo no condicionado (o US). El resultado es que el estímulo condicionado comienza a provocar una respuesta condicionada (CR). El condicionamiento clásico hoy en día se considera importante tanto como fenómeno conductual como método para estudiar el aprendizaje asociativo simple. Igual que el acondicionamiento pavloviano.
Respuesta compensatoria condicionada: En el condicionamiento clásico, una respuesta condicionada que se opone, más que es la misma que, la respuesta incondicionada. Funciona para reducir la fuerza de la respuesta incondicionada. A menudo se ve en el acondicionamiento cuando los medicamentos se usan como estímulos incondicionados.
Respuesta condicionada (CR): Se ha dado la respuesta que se suscita por el estímulo condicionado después del condicionamiento clásico.
Estímulo condicionado (CS): Un estímulo inicialmente neutro (como una campana, luz o tono) que provoca una respuesta condicionada después de que se ha asociado con un estímulo incondicionado.
Contexto: Estímulos que están en segundo plano cada vez que ocurre el aprendizaje. Por ejemplo, la caja o sala Skinner en la que tiene lugar el aprendizaje es el ejemplo clásico de un contexto. Sin embargo, el “contexto” también puede ser proporcionado por estímulos internos, como los efectos sensoriales de las drogas (por ejemplo, estar bajo la influencia del alcohol tiene propiedades de estímulo que proporcionan un contexto) y estados de ánimo (por ejemplo, estar feliz o triste). También puede ser proporcionada por un período específico en el tiempo; a veces se dice que el paso del tiempo cambia el “contexto temporal”.
Estímulo discriminativo: En el condicionamiento operante, un estímulo que señala si se reforzará la respuesta. Se dice que “marcó la ocasión” para la respuesta operante.
Extinción: Disminución en la fuerza de un comportamiento aprendido que ocurre cuando el estímulo condicionado se presenta sin el estímulo incondicionado (en el condicionamiento clásico) o cuando el comportamiento ya no se refuerza (en condicionamiento instrumental). El término describe tanto el procedimiento (ya no se presenta el EU o reforzador) como el resultado del procedimiento (la respuesta aprendida disminuye). Se dice que los comportamientos que se han reducido en fuerza a través de la extinción están “extinguidos”.
Acondicionamiento del miedo: Un tipo de condicionamiento clásico o pavloviano en el que el estímulo condicionado (CS) se asocia con un estímulo aversivo incondicionado (US), como un choque en el pie. Como consecuencia del aprendizaje, el CS llega a evocar miedo. Se cree que el fenómeno está involucrado en el desarrollo de trastornos de ansiedad en humanos.
Comportamiento dirigido por objetivos: Comportamiento instrumental que está influenciado por el conocimiento del animal de la asociación entre el comportamiento y su consecuencia y el valor actual de la consecuencia. Sensible al efecto de devaluación del reforzador.
Hábito: Comportamiento instrumental que ocurre automáticamente en presencia de un estímulo y ya no está influenciado por el conocimiento del animal del valor del reforzador. Insensible al efecto de devaluación del reforzador.
Acondicionamiento instrumental: Proceso en el que los animales aprenden sobre la relación entre sus comportamientos y sus consecuencias. También conocido como condicionamiento operante.
Ley de efectos: La idea de que las respuestas instrumentales u operantes están influenciadas por sus efectos. Se fortalecerán las respuestas que vayan seguidas de un agradable estado de cosas y se debilitarán las que sean seguidas por el malestar. En la actualidad, el término se refiere a la idea de que las conductas operantes o instrumentales están legalmente controladas por sus consecuencias.
Aprendizaje observacional: Aprender observando el comportamiento de los demás.
Operante: Un comportamiento que está controlado por sus consecuencias. El ejemplo más simple es el prensado de palanca de la rata, que está controlado por la presentación del reforzador.
Acondicionamiento operante: Ver condicionamiento instrumental.
Acondicionamiento pavloviano: Ver acondicionamiento clásico.
Error de predicción: Cuando el resultado de un ensayo de condicionamiento es diferente al que se predice por los estímulos condicionados que están presentes en el ensayo (es decir, cuando Estados Unidos es sorprendente). El error de predicción es necesario para crear condicionamiento pavloviano (y aprendizaje asociativo en general). A medida que el aprendizaje ocurre en ensayos repetidos de condicionamiento, el estímulo condicionado predice cada vez más el estímulo incondicionado y disminuye el error de predicción. El acondicionamiento funciona para corregir o reducir el error de predicción.
Preparación: La idea de que la historia evolutiva de un organismo puede facilitar el aprendizaje de una asociación particular. Debido a la preparación, es más probable que asocies el sabor del tequila, y no las circunstancias que rodean a beberlo, con enfermarse. De manera similar, los humanos son más propensos a asociar imágenes de arañas y serpientes que flores y hongos con resultados aversivos como choques.
Castigador: Un estímulo que disminuye la fuerza de un comportamiento operante cuando se hace una consecuencia del comportamiento.
Ley Cuantitativa de Efecto: Una regla matemática que establece que la efectividad de un reforzador en el fortalecimiento de una respuesta operante depende de la cantidad de refuerzo ganado para todas las conductas alternativas. Un reforzador es menos efectivo si hay mucho refuerzo en el ambiente para otras conductas.
Refuerzo: Cualquier consecuencia de un comportamiento que fortalezca el comportamiento o aumente la probabilidad de que se vuelva a realizar.
Efecto de devaluación del reforzador: El hallazgo de que un animal dejará de realizar una respuesta instrumental que alguna vez llevó a un reforzador si el reforzador se hace por separado aversivo o indeseable.
Efecto Renovación: Recuperación de una respuesta extinguida que ocurre cuando se cambia el contexto después de la extinción. Especialmente fuerte cuando el cambio de contexto implica regresar al contexto en el que originalmente se produjo el condicionamiento. Puede ocurrir después de la extinción ya sea en condicionamiento clásico o instrumental.
Teoría del Aprendizaje Social: La teoría de que las personas pueden aprender nuevas respuestas y comportamientos observando el comportamiento de los demás.
Modelos sociales: Autoridades que son los objetivos de observación y que modelan comportamientos.
Recuperación espontánea: Recuperación de una respuesta extinguida que ocurre con el paso del tiempo después de la extinción. Puede ocurrir después de la extinción ya sea en condicionamiento clásico o instrumental.
Control de estímulos: Cuando un comportamiento operante es controlado por un estímulo que le precede.
Aprendizaje de aversión al gusto: El fenómeno en el que un sabor se empareja con la enfermedad, y esto hace que el organismo rechace —y no le guste— ese sabor en el futuro.
Respuesta no condicionada (UR): En el condicionamiento clásico, una respuesta innata que es suscitada por un estímulo antes (o en ausencia de) condicionamiento.
Estímulo no condicionado (US): En el condicionamiento clásico, el estímulo que provoca la respuesta antes de que se produzca el condicionamiento.
Refuerzo vicario: Aprendizaje que ocurre observando el refuerzo o castigo de otra persona.

Referencias

Balleine, B. W. (2005). Bases neuronales de la búsqueda de alimentos: Afecta, excitación y recompensa en circuitos corticostratolímbos. Fisiología y Comportamiento, 86, 717—730.
Bandura, A. (1977). Teoría del aprendizaje social. Englewood Cliffs, Nueva Jersey: Prentice Hall
Bandura, A., Ross, D., Ross, S (1963). Imitación de modelos agresivos mediados por película. Revista de Psicología Anormal y Social 66 (1), 3 - 11.
Bandura, A.; Ross, D.; Ross, S. A. (1961). “Transmisión de la agresión a través de la imitación de modelos agresivos”. Revista de Psicología Anormal y Social 63 (3), 575—582.
Bernstein, I. L. (1991). Acondicionamiento de aversión en respuesta al cáncer y tratamiento oncológico. Revisión de Psicología Clínica, 11, 185—191.
Bouton, M. E. (2004). Contexto y procesos conductuales en extinción. Aprendizaje y memoria, 11, 485—494.
Colwill, R. M., & Rescorla, R. A. (1986). Estructuras asociativas en el aprendizaje instrumental. En G. H. Bower (Ed.), La psicología del aprendizaje y la motivación, (Vol. 20, pp. 55—104). Nueva York, NY: Prensa Académica.
Craske, M. G., Kircanski, K., Zelikowsky, M., Mystkowski, J., Chowdhury, N., & Baker, A. (2008). Optimización del aprendizaje inhibidor durante la terapia de exposición. Investigación y Terapia del Comportamiento, 46, 5—27.
Dickinson, A., & Balleine, B. W. (1994). Control motivacional del comportamiento dirigido a objetivos. Aprendizaje y Comportamiento Animal, 22, 1—18.
Fanselow, M. S., & Poulos, A. M. (2005). La neurociencia del aprendizaje asociativo de mamíferos. Revisión Anual de Psicología, 56, 207—234.
Herrnstein, R. J. (1970). Sobre la ley de efectos. Revista del Análisis Experimental del Comportamiento, 13, 243—266.
Holland, P. C. (2004). Relaciones entre la transferencia pavlovia-instrumental y la devaluación del reforzador. Revista de Psicología Experimental: Procesos de Comportamiento Animal, 30, 104—117.
Kamin, L. J. (1969). Previsibilidad, sorpresa, atención y condicionamiento. En B. A. Campbell & R. M. Church (Eds.), Castigo y comportamiento aversivo (pp. 279—296). Nueva York, NY: Appleton-Century-Crofts.
Mineka, S., & Zinbarg, R. (2006). Una perspectiva contemporánea de la teoría del aprendizaje sobre la etiología de los trastornos de ansiedad: No es lo que pensabas que era. Psicólogo Americano, 61, 10—26.
Pearce, J. M., & Bouton, M. E. (2001). Teorías del aprendizaje asociativo en animales. Revisión Anual de Psicología, 52, 111—139.
Rescorla, R. A., & Wagner, A. R. (1972). Una teoría del condicionamiento pavloviano: Variaciones en la efectividad del refuerzo y del no refuerzo. En A. H. Black & W. F. Prokasy (Eds.), Condicionamiento clásico II: Investigación y teoría actuales (pp. 64—99). Nueva York, NY: Appleton-Century-Crofts.
Scalera, G., & Bavieri, M. (2009). Papel de la aversión al gusto condicionada sobre los efectos secundarios de la quimioterapia en pacientes con cáncer. En S. Reilly & T. R. Schachtman (Eds.), Aversión al gusto condicionada: procesos conductuales y neuronales (pp. 513—541). Nueva York, NY: Oxford University Press.
Siegel, S. (1989). Acondicionamiento farmacológico y efectos farmacológicos. En A. J. Goudie & M. Emmett-Oglesby (Eds.), Drogas psicoactivas (pp. 115—180). Clifton, NY: Prensa Humana.
Siegel, S., Hinson, R. E., Krank, M. D., & McCully, J. (1982). Muerte por “sobredosis” de heroína: Contribución de señales ambientales asociadas a drogas. Ciencia, 216, 436—437.
Spreat, S., & Spreat, S. R. (1982). Principios de aprendizaje. En V. Voith & P. L. Borchelt (Eds.), Clínicas veterinarias de América del Norte: Práctica de animales pequeños (pp. 593—606). Filadelfia, PA: W. B. Saunders.
Thompson, R. F., & Steinmetz, J. E. (2009). El papel del cerebelo en el condicionamiento clásico de las respuestas conductuales discretas. Neurociencia, 162, 732—755.
Timberlake, W. L. (2001). Modos motivacionales en sistemas de comportamiento. En R. R. Mowrer & S. B. Klein (Eds.), Manual de teorías de aprendizaje contemporáneo (pp. 155—210). Mahwah, Nueva Jersey: Lawrence Erlbaum Associates, Inc.
Wasserman, E. A. (1995). Las habilidades conceptuales de las palomas. Científico Americano, 83, 246—255.