El campo de la Economía del Comportamiento (y Finanzas del Comportamiento) es un área de investigación en crecimiento que se enfoca en cómo se toman realmente las decisiones. Está estrechamente ligada a la psicología y la neurociencia. Los economistas del comportamiento rechazan la idea de maximización de la utilidad como una supuesta caja negra. Tanto los métodos experimentales como los procedimientos sofisticados (como las exploraciones cerebrales por resonancia magnética) se utilizan para examinar cómo se resuelven realmente los problemas del mundo real. Han surgido una serie de resultados que desafían la sabiduría convencional en la economía convencional.
Un área de interés de larga data en la psicología involucra problemas de elección repetidos. Este capítulo se centra en un tipo particular de elección repetida en la que la satisfacción obtenida actualmente depende de decisiones pasadas. Esto se llama elección distribuida.
Supongamos que está decidiendo si ver la televisión o jugar a un videojuego. Enfrentas esta elección repetidamente. La satisfacción de ver la televisión o jugar un videojuego depende de la frecuencia con la que se haya hecho antes esa elección. ¿Cuál es la mejor combinación de televisión y videojuegos a lo largo de un periodo de tiempo y, lo que es más importante, qué tan bien maneja la gente este tipo de opciones repetidas?
En lugar de explicar por qué el problema de optimización de elección repetida es difícil y presentar resultados de ensayos en humanos, es más divertido (y aprenderás más) dejarte participar primero en un experimento.
El juego Choice
PASO Abra el libro de Excel Melioration.xls y lea la hoja de introducción, luego vaya a la hoja Choice Game para jugar a este sencillo juego.
Tu objetivo es hacer clic en los botones A o B tantas veces como sea posible en 10 minutos. Cuando haces una elección, al hacer clic en uno de los botones, te ves obligado a esperar. Esperar es costoso porque no puedes hacer clic (hacer otra elección) mientras esperas.
PASO Haz clic en el botón de opción (cerca de la esquina superior izquierda de la pantalla) para ver cómo funciona el juego.
Obtienes hasta 100 juicios de práctica. En el modo de práctica, el tiempo no se mantiene. Puedes tomar el tiempo que quieras entre los clics de los botones. Practica ahora.
Definitivamente está pasando algo que estás tratando de entender y hay una estrategia óptima. Puede hacer clic en el mismo botón una y otra vez o cambiar de un lado a otro.
¿Estás listo para jugar? A diferencia de la práctica, cuando juegas, un temporizador estará funcionando. No usarás los botones de la hoja como lo hiciste en el modo de práctica. Los botones estarán en un cuadro de diálogo, uno al lado del otro. Tendrás 10 minutos para tomar tantas opciones como sea posible. El tiempo restante se mostrará a medida que juegues.
Diez minutos pueden ser demasiado largos para que juegues, así que haz clic en el botón si quieres dejar de jugar. Siempre y cuando empieces a jugar y tomes algunas elecciones, podrás seguir trabajando y aprendiendo sobre la mejora.
PASO Haga clic en el botón de opción. ¡Buena suerte!
Después de terminar el juego, un cuadro de mensaje muestra tu puntuación y una hoja de resultados muestra un registro de tus selecciones. Reporta resultados basados en diez minutos completos de juego, así que si te detuviste prematuramente, puedes ignorar tus resultados.
Vamos a deconstruir este juego y ver cómo funciona. La Figura 8.1 muestra las 10 primeras elecciones realizadas por un jugador. El jugador comenzó con A, luego cambió a B con su elección número 7, pero volvió a cambiar a A, luego terminó con B.
PASO Puedes ver el registro completo de otro jugador haciendo clic en el botón (cerca de la celda G9 en la hoja Resultados, que se reveló cuando terminaste de jugar el juego de elección).
Este jugador probó rachas de A y B. Observe cómo cambió el tiempo pausado.
Estas hojas de resultados también comparan el número de elecciones realizadas al máximo posible y computan una puntuación como porcentaje del máximo. Averigüemos cómo se puede alcanzar el máximo y por qué la gente suele ser tan mala jugando a este juego.
Resultados Reales
Los ensayos experimentales con este juego fueron conducidos por Herrnstein y Prelec (1991) y puedes comparar cómo te fue con el resultado promedio (y con el jugador en la hoja MoreResults).
PASO Haga clic en el botón de la hoja MásResultados.
La ficha de datos muestra cómo 17 sujetos jugaron el juego de elección que acabas de jugar. Cada punto de la tabla, reproducido en la Figura 8.2, muestra la fracción de veces que un jugador eligió A (en el eje x) y el retraso promedio correspondiente soportado por ese jugador (en el eje y). El jugador con el menor retraso, el primero de la tabla, también tiene la mayor cantidad de opciones (número de opciones = 600/retraso promedio) y es el ganador en este conjunto de jugadores. ¿Cómo te fue?
PASO Para agregar su resultado al gráfico en Excel, copie sus resultados de las celdas J2 y K2 de la hoja Resultados, seleccione la celda A23 en la Hoja de datos, y Pegar Especial (Valores) (o simplemente escriba los dos números). Aparecerá un punto rojo en el gráfico. Esto demuestra cómo lo hiciste.
¿Le ganaste al mejor jugador de los 17 en la tabla? Sabemos que podrías haberlo hecho porque incluso el mejor jugador de ese grupo de 17 no logró optimizar. La explicación de esta falla requiere que entendamos la función de retardo para cada elección.
El corazón del juego de elección es el tiempo de espera entre elecciones. La duración de la pausa es una función de las 10 elecciones anteriores (incluida la elección actual). Para la opción A, el tiempo de espera, en segundos, es de 2 + 0.4 x Proporción de A Choices en las últimas 10 opciones. Entonces, si las últimas 10 opciones hubieran sido B, entonces A tendría un tiempo de pausa muy corto y satisfactorio de tan solo 2 segundos. Al hacer clic en A, sin embargo, el tiempo de pausa para la elección A aumenta 0.4 segundos hasta alcanzar un máximo de 6 segundos.
El tiempo de espera de la Elección B está determinado por 8 - 0.4 x Proporción de Opciones B en las últimas 10 opciones. Al hacer clic en B, la duración de la pausa se vuelve cada vez más baja hasta alcanzar un mínimo de 4 segundos.
PASO Confirmar que los tiempos de espera se determinaron como se describe volviendo a las tres hojas de resultados y examinando los tiempos de pausa en las columnas B y C.
Se puede ver que los primeros clics de A y B tuvieron tiempos de pausa de 2 y 8 segundos, respectivamente. También puede verificar que cada tiempo de pausa esté siguiendo las funciones descritas anteriormente. La hoja MoreResults con la estrategia rayada A y B hace que sea fácil ver la mecánica del juego de elección.
Elección A exhibe un costo marginal cada vez que haces clic en A, te penalizan y te obligan a esperar más tiempo. Choice B te recompensa con una disminución en el tiempo de espera cuando se hace clic, pero el tiempo de espera comienza muy alto por lo que tienes que ser persistente y apegarte a él. Además, la opción A es siempre 2 segundos más baja que la opción B, por lo que constantemente te atraen hacia la elección A.
La mayoría de las personas juegan a este juego al sentirse atraídas por el corto tiempo de espera de A, hasta que se vuelve insoportable y cambian a B. Pero no pueden quedarse con B mucho tiempo porque es doloroso esperar al principio y no tienen la paciencia y la autodisciplina para quedarse con B. ¿Te suena familiar? B podría ser hacer ejercicio o hacer dieta o estudiar sabes que deberías y se vuelve más fácil si te apegas a ello, pero puede ser difícil comenzar.
Ahora que conoces las reglas del juego, ¿cómo optimizas realmente con este juego? Simplestart con opción B y nunca desviarse.
PASO Para ver esta estrategia óptima en acción, vaya a la hoja Solución haciendo clic en el botón de la ficha Datos (debajo de la tabla).
La columna B muestra lo que sucede cuando eliges exclusivamente A. Comienza bien, pero terminas con muchas pausas de 6 segundos.
PASO Desplácese hacia abajo para ver que toma 103 elecciones en 600 segundos, produciendo un retraso promedio de 5.8 segundos. Este es un mal resultado.
La columna F muestra lo que sucede cuando se elige exclusivamente B. Los primeros tiempos de espera son largos, pero cada elección de B disminuye el tiempo de espera hasta que se alcanza el mínimo, 4 segundos, se alcanza.
PASO Desplácese hacia abajo para ver que hacer clic en la opción B cada vez le permite tomar 144 elecciones (con un retraso promedio de 4.167 segundos).
La estrategia de elegir B exclusivamente no puede ser batida (a excepción de una corrección de final de juego, que es una de las preguntas del ejercicio). Si el jugador cambia de B a A, la ganancia temporal se ve inundada por tiempos de espera más altos cuando ocurre el inevitable cambio de nuevo a B.
Para estar seguros de que este punto es claro, considera cambiar después de haber alcanzado el tiempo mínimo de pausa de 4 segundos para la elección B. ¿Qué pasaría?
PASO Cambiar la celda K15 (en la hoja Solución) a A.
Se hacen cinco elecciones A consecutivas y cada una tiene un tiempo de pausa menor o igual a cuatro segundos, como se muestra en la columna L. Así, hemos ahorrado tiempo. Pero cuando volvemos a B (ya que sabemos que el tiempo de pausa de A seguirá subiendo y podemos llegar a 4 segundos con B), tenemos que sufrir mayores tiempos de pausa. El trade-off no vale la pena. Terminamos tomando menos elecciones (142 en lugar de 144) y sufriendo un retraso promedio más largo.
La hoja Solución deja claro el siguiente punto clave: La estrategia óptima es elegir B exclusivamente y nunca desviarse. Si no lograste hacer esto, no te preocupes; tienes mucha compañía. Muy pocos humanos se dan cuenta de esto.
Explicación de Melioración
Herrnstein y Prelec (1991) diseñaron el experimento para probar la presencia de algo llamado melioration (pronunciado Mee-lee-uh-ray-shun). Meliorar (o mejorar) significa hacer mejor o más tolerable. Melioration dice que nos atraen elecciones que inmediatamente reducen el dolor o dan satisfacción inmediata. Hacemos un mal trabajo maximizando cuando hay una compensación entre los rendimientos a corto y largo plazo. Somos miopes y buscamos hacer mejoras inmediatas. De hecho, la melioración se ha encontrado en otros animales además de los humanos.
La atracción de cambiar a A y tener la caída del tiempo de pausa es la mejora en el trabajo. Se disminuye el dolor inmediato de la espera y, así, los jugadores se sienten atraídos hacia la elección A.
Además de las elecciones reales de los 17 jugadores, la Figura 8.3 muestra los tiempos de espera para las elecciones A y B dada la proporción de elecciones A en los 10 anteriores. Es fácil ver, una vez más, que la solución óptima es elegir B exclusivamente porque eso te permite viajar por la línea continua hasta la intercepción a los 4 segundos. Si alguna vez te subes al tren A, te arrastran hacia arriba hacia un tiempo de espera de 6 segundos.
La Figura 8.3 muestra que si las últimas 10 elecciones fueran B y luego se eligiera A, el jugador obtendría inmediatamente una reducción en el tiempo de espera de 4 a 2 segundos (saltando de la línea superior a la inferior). Para algunas elecciones, el jugador estaría mejor, pero después de la 5ª elección consecutiva A, el tiempo de espera sería mayor a 4 segundos. El jugador se vería obligado a soportar tiempos de espera más largos de los que se habrían obtenido al quedarse con B.
Además, es difícil cambiar a B porque el tiempo de espera salta inmediatamente en 2 segundos. El jugador tendrá que sufrir a través del paseo por la línea B, con la elección A prometiendo una disminución de 2 segundos con cada clic. La atracción inmediata de la disminución de 2 segundos es el núcleo del proceso de melioración que guía a los sujetos a elegir A.
La Figura 8.3 deja claro que los 17 sujetos humanos que jugaron el juego de elección no lograron optimizar. La fracción de asignación a A debería ser cero, pero la mayoría de los jugadores no hacen esto. Esto plantea la pregunta, ¿y qué?
Herrnstein y Prelec (1991) argumentan que la falta de optimización es un gran problema. Para ellos, la elección no suele ser una decisión única, aislada, sino una serie de muchas decisiones, distribuidas a lo largo del tiempo. Frecuencia de ejercicio deportivo, compra de boletos de lotería, opciones de restaurantes y tasa de trabajo en ocupaciones independientes son algunos de los ejemplos ofrecidos.
Para todos estos problemas de elección distribuida, la mejora es común y esto significa que las personas sistemáticamente no logran optimizar. “Esto implicaría que las preferencias reveladas por el mercado pueden ser una distorsión de las verdaderas preferencias subyacentes” (Herrnstein y Prelec, 1991, p. 137). La melioración ayuda a explicar las quejas sobre el propio comportamiento (como hacer muy poco ejercicio), lo que forma parte de una creciente literatura sobre el autocontrol. También puede contribuir al estudio de la impulsividad y la adicción.
Por supuesto, esto supone que los hallazgos de laboratorio se trasladan a entornos del mundo real. Esto suele ser el talón de Aquiles de la economía experimental. Los resultados suelen ser criticados por tener poca validez externa porque se basan en escenarios falsos jugados por estudiantes universitarios. Herrnstein y Prelec (1991) reconocen que poco dinero estaba en juego (pagaban a sus jugadores en función del rendimiento), pero se basan en otros dos factores motivadores. “Primero, los retrasos son realmente molestos y la diferencia entre dos y cuatro segundos no es trivial, como cualquier usuario de computadora apreciará. En segundo lugar, la naturaleza 'puzzle' del experimento presenta un reto que presumiblemente es satisfactorio de resolver” (Herrnstein y Prelec, 1991, p. 144).
Otros han tratado de precisar exactamente qué causa la melioración y cómo se puede superar. Nth, Sims y Gray (2005, p. 357) se sorprendieron:
Se planteó la hipótesis de que la retroalimentación frecuente e informativa sobre el desempeño óptimo podría ser la clave para que las personas puedan superar la tendencia documentada a mejorar cuando las elecciones son recompensadas probabilísticamente. Para nuestra sorpresa, esta intuición resultó estar equivocada. En lugar de maximizar, 19 de 22 participantes demostraron un claro sesgo hacia la mejora, independientemente de la condición de retroalimentación.
El futuro de la economía del comportamiento
Con profesores, cursos, conferencias y revistas especializadas, no cabe duda de que Behavioral Economics llegó para quedarse. En 2002 se otorgó el Premio Nobel de Ciencias Económicas a Daniel Kahneman y Vernon Smith por su trabajo incorporando la psicología y los métodos de laboratorio en el estudio de la toma de decisiones. Richard Thaler ganó el Nobel en 2017 por sus contribuciones a la economía del comportamiento.
A diferencia de la economía convencional, que simplemente asume optimizar el comportamiento y la racionalidad, los economistas conductuales buscan determinar bajo qué condiciones los agentes luchan por optimizar. Trabajan con psicólogos y neurocientíficos para idear pruebas y experimentos de laboratorio. El resultado clave es que encuentran persistentemente un comportamiento sub-optimizador.
La melioración no es más que un simple ejemplo de trabajo en esta área. La mejora significa que los tomadores de decisiones no logran optimizar porque se enfocan en lo pequeño (opción inmediata, única) en lugar de lo grande (futuro, muchas opciones). Esto se puede aplicar en cualquier momento que los pasos incrementales conduzcan a un lugar indeseable:
Una persona normalmente no toma una decisión de una vez por todas de convertirse en un adicto al ejercicio, un avaro, un glotón, un derroche o un jugador; más bien, se desliza en el patrón a través de una miríada de elecciones inocentes, o casi inocentes, cada una de las cuales lleva poco peso. En efecto, puede ser el último en reconocer “hasta dónde se ha deslizado”, y puede tomar medidas correctivas sólo cuando lo pidan otros. (Herrnstein y Prelec, 1991, p. 149)
Según los economistas del comportamiento, la lista de ejemplos en los que los humanos luchan por optimizar es en realidad bastante larga. Evaluar las probabilidades (como el riesgo), la elección a lo largo del tiempo y la percepción errónea de la realidad son áreas que se están estudiando activamente.
No queda claro si los resultados que generan los economistas del comportamiento son meramente una serie de acertijos peculiares que extenderán los límites de la economía o anomalías más graves que algún día derribarán el paradigma de la racionalidad y la optimización del comportamiento que es el sello distintivo de lo moderno, mainstream economía.
Ejercicios
Si hiciste los problemas de preguntas y respuestas y cambiaste los parámetros, vuelve a ajustarlos a los valores originales (2 y 0.4 para A y 8 y\(-0.4\) para B).
Con su observación incluida, copie y pegue la tabla titulada Resultados reales del ensayo en un documento de Word. Comenta brevemente cómo te fue.
¿Qué corrección de final de juego podría implementarse para aumentar el número total de opciones? ¿Cuál es el número máximo verdadero y exacto de opciones? Explique.
Herrnstein y Prelec (1991), p. 142, señalan que, “De hecho, los sujetos no mostraron evidencia de haber sido influenciados por la contingencia del final del juego”.
Con las columnas Q:U en la hoja Solución, use Solver para encontrar la solución óptima para el juego de elección. Observe cómo se han restringido las variables de elección. ¿Cómo funciona Solver? Explique.
Capacitar a alguien para tocar el tipo no garantiza la escritura táctil continua en el lugar de trabajo. ¿Cómo explicaría la melioración este resultado?
El problema de elección repetida en este capítulo se basa en dos artículos: (1) Richard J. Herrnstein y Drazen Prelec, “Melioration: A Theory of Distributed Choice”, The Journal of Economic Perspectives, Vol. 5, No. 3 (Summer, 1991), pp. 137—156, www.jstor.org/stable/1942800 y (2) “Melioration” de Herrnstein y Prelec, páginas 235—263 en Choice Over Time, editado por George Loewenstein y Jon Elster (1992).
Herrnstein, psicólogo, se asoció con Charles Murray, politólogo, para escribir un polémico libro titulado La curva de campana: inteligencia y estructura de clases en la vida estadounidense (1994). El libro argumentó que la naturaleza (CI) es más importante que la crianza (estatus socioeconómico) para explicar una amplia gama de resultados.
Otro trabajo centrado específicamente en la mejora es Hansj ö rg Neth, Chris R. Sims, y Wayne D. Gray, “Melioration a pesar de más información: El papel de la frecuencia de retroalimentación en el desempeño subóptimo estable”, Actas de la 49ª Reunión Anual de la Sociedad de Factores Humanos y Ergonomía, 2005, doi.org/10.1177/154193120504900330.
Hay muchos libros sobre economía del comportamiento y finanzas. Un clásico es del ganador del Premio Nobel Richard Thaler, The Winner's Curse: Paradoxes and Anomalies of Economic Life (1994). Este es un buen lugar para comenzar a aprender sobre economía del comportamiento. Otras buenas lecturas incluyen las siguientes: