18.1: Introducción

Última actualización
Guardar como PDF

Page ID: 135091

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

La lectura previa se centró en el tipo de aprendizaje asociativo conocido como condicionamiento clásico. Recuerda que en el condicionamiento clásico, algo en el ambiente desencadena un reflejo automáticamente, y los investigadores entrenan al organismo para que reaccione ante un estímulo diferente. Ahora pasamos al segundo tipo de aprendizaje asociativo, el condicionamiento operante. En el condicionamiento operante, los organismos aprenden a asociar un comportamiento y su consecuencia (Tabla\(\PageIndex{1}\)). Una consecuencia agradable hace que ese comportamiento sea más probable que se repita en el futuro. Por ejemplo, Spirit, un delfín en el Acuario Nacional de Baltimore, da una vuelta al aire cuando su entrenador hace sonar un silbato. La consecuencia es que ella consigue un pez.

Tabla\(\PageIndex{1}\): Comparación de Acondicionamiento Clásico y Operante
	Acondicionamiento Clásico	Acondicionamiento Operante
Enfoque de acondicionamiento	Un estímulo incondicionado (como la comida) se combina con un estímulo neutro (como una campana). El estímulo neutro finalmente se convierte en el estímulo condicionado, lo que provoca la respuesta condicionada (salivación).	El comportamiento objetivo es seguido de refuerzo o castigo para fortalecerlo o debilitarlo, de manera que el alumno tenga más probabilidades de exhibir el comportamiento deseado en el futuro.
Momento de estímulo	El estímulo ocurre inmediatamente antes de la respuesta.	El estímulo (ya sea refuerzo o castigo) ocurre poco después de la respuesta.

El psicólogo B. F. Skinner vio que el condicionamiento clásico se limita a comportamientos existentes que se obtienen reflexivamente, y no da cuenta de nuevos comportamientos como andar en bicicleta. Propuso una teoría sobre cómo se producen tales comportamientos. Skinner creía que el comportamiento está motivado por las consecuencias que recibimos por el comportamiento: los refuerzos y castigos. Su idea de que el aprendizaje es resultado de consecuencias se basa en la ley de efecto, la cual fue propuesta por primera vez por el psicólogo Edward Thorndike.

Según la ley del efecto, los comportamientos que van seguidos de consecuencias que son satisfactorias para el organismo tienen más probabilidades de repetirse, y los comportamientos que van seguidos de consecuencias desagradables tienen menos probabilidades de repetirse (Thorndike, 1898). Esencialmente, si un organismo hace algo que produce un resultado deseado, es más probable que el organismo vuelva a hacerlo. Si un organismo hace algo que no produce un resultado deseado, es menos probable que el organismo vuelva a hacerlo. Un ejemplo de la ley de efectos es en el empleo. Una de las razones (y muchas veces la razón principal) por las que nos presentamos al trabajo es porque nos pagan por hacerlo. Si dejamos de recibir pagos, es probable que dejemos de presentarnos, incluso si amamos nuestro trabajo.

Trabajando con la ley de efecto de Thorndike como su fundamento, Skinner comenzó a realizar experimentos científicos en animales (principalmente ratas y palomas) para determinar cómo los organismos aprenden a través del condicionamiento operante (Skinner, 1938). Colocó a estos animales dentro de una cámara de acondicionamiento operante, la cual ha llegado a conocerse como “Caja Skinner” (Figura\(\PageIndex{1}\)). Una caja de Skinner contiene una palanca (para ratas) o disco (para palomas) que el animal puede presionar o picotear para obtener una recompensa de comida a través del dispensador. Altavoces y luces pueden estar asociados con ciertos comportamientos. Un registrador cuenta el número de respuestas realizadas por el animal.

Figura\(\PageIndex{1}\): (a) B. F. Skinner desarrolló un condicionamiento operante para el estudio sistemático de cómo se fortalecen o debilitan los comportamientos según sus consecuencias. b) En una caja de Skinner, una rata presiona una palanca en una cámara de acondicionamiento operante para recibir una recompensa alimentaria. [(a) “B.F. Skinner en Harvard circa 1950” de Silly Rabbit/ Wikimedia Commons está licenciado bajo CC BY 3.0; (b) “Skinner Box” de Judy Schmitt está licenciado bajo CC BY-NC-SA 4.0.]

ENLACE AL APRENDIZAJE

Mira este breve videoclip para conocer más sobre el condicionamiento operante: Skinner es entrevistado y se demuestra el condicionamiento operante de palomas.

Al discutir el condicionamiento operante, usamos varias palabras diarias —positivas, negativas, de refuerzo y castigo— de manera especializada. En condicionamiento operante, positivo y negativo no significan bueno y malo. En cambio, positivo significa que estás agregando algo, y negativo significa que te estás quitando algo. Refuerzo significa que estás aumentando un comportamiento, y el castigo significa que estás disminuyendo un comportamiento. El refuerzo puede ser positivo o negativo, y el castigo también puede ser positivo o negativo. Todos los refuerzos (positivos o negativos) aumentan la probabilidad de una respuesta conductual. Todos los castigos (positivos o negativos) disminuyen la probabilidad de una respuesta conductual. Ahora combinemos estos cuatro términos: refuerzo positivo, refuerzo negativo, castigo positivo y castigo negativo (Tabla\(\PageIndex{2}\)).

Tabla\(\PageIndex{2}\): Refuerzo y Castigo Positivo y Negativo
	Refuerzo	Castigo
Positivo	Se agrega algo para aumentar la probabilidad de un comportamiento.	Se agrega algo para disminuir la probabilidad de un comportamiento.
Negativo	Algo se elimina para aumentar la probabilidad de un comportamiento.	Algo se elimina para disminuir la probabilidad de un comportamiento.