Saltar al contenido principal
LibreTexts Español

5.9: Momentos robóticos en el entorno social

  • Page ID
    143759
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El enfoque encarnado ha reconocido desde hace mucho tiempo que el entorno de un agente es mucho más que una matriz estática de estímulos (Gibson, 1979; Neisser, 1976; Scribner & Tobach, 1997; Vygotsky, 1986). “Las dotaciones más ricas y elaboradas del medio ambiente las proporcionan otros animales y, para nosotros, otras personas” (Gibson, 1979, p. 135). Un entorno social es una rica fuente de complejidad y abarca desde interacciones dinámicas con otros agentes hasta andamios cognitivos proporcionados por convenciones culturales. “Todos los procesos mentales superiores son principalmente fenómenos sociales, posibilitados por herramientas cognitivas y situaciones características que han evolucionado a lo largo de la historia” (Neisser, 1976, p. 134).

    En el sentido más básico de lo social, múltiples agentes en un mundo compartido producen una fuente particularmente compleja de retroalimentación entre las acciones de los demás. “Lo que el otro animal le da al observador no es sólo el comportamiento sino también la interacción social. A medida que uno se mueve también lo hace el otro, la secuencia de acción se adapta a la otra en una especie de bucle conductual” (Gibson, 1979, p. 42).

    Grey Walter (1963) exploró tales bucles conductuales cuando colocó dos Tortugas en la misma habitación. Las luces montadas proporcionaron estímulos particularmente complejos en este caso, ya que los movimientos de los robots cambiarían la posición de las dos luces, lo que a su vez alteró los comportamientos posteriores de los robots. Al describir un registro fotográfico de una de esas interacciones, Grey Walter llamó a la dinámica social de sus máquinas,

    la formación de una sociedad cooperativa y competitiva... Cuando las dos criaturas son liberadas al mismo tiempo en la oscuridad, cada una es atraída por el faro del otro pero cada una al ser atraída extingue la fuente de atracción hacia la otra. El resultado es un movimiento señorial circulante de carácter minutero; cada vez que las criaturas tocan se convierten en obstáculos y se retiran pero vuelven a ser atraídos de manera rítmica. (Holanda, 2003a, p. 2104)

    Se han explotado bucles de comportamiento similares para explicar el comportamiento de colecciones más grandes de agentes interdependientes, como bandadas de aves voladoras o bancos de peces nadadores (Nathan & Barbosa, 2008; Reynolds, 1987). Tal agregado se presenta como otro ejemplo de superorganismo, porque los movimientos sincronizados de los miembros del rebaño dan “la fuerte impresión de control intencional y centralizado” (Reynolds, 1987, p. 25). Sin embargo, esta impresión puede ser el resultado de interacciones locales estigmérgicas en las que un ambiente consiste principalmente en otros miembros del rebaño en las inmediaciones de un agente.

    En su trabajo pionero en simular el vuelo de una bandada de aves artificiales, llamadas boides, Reynolds (1987) creó un comportamiento realista de flocado al hacer que cada boide volador independientemente adapte su trayectoria de acuerdo con tres reglas simples: evitar colisiones con compañeros de rebaño cercanos, igualar la velocidad de los cercanos compañeros de rebaño, y permanecer cerca de compañeros de rebaño cercanos. Un modelo relacionado (Couzin et al., 2005) se ha utilizado con éxito para predecir el movimiento de multitudes humanas (Dyer et al., 2008; Dyer et al., 2009; Faria et al., 2010).

    Sin embargo, muchas interacciones sociales humanas probablemente estén más involucradas que los simples bucles conductuales que definieron las interacciones sociales entre las Tortugas de Grey Walter (1963) o el comportamiento de flocado de los boides de Reynolds (1987). Estas interacciones son posiblemente todavía bucles conductuales, pero pueden ser bucles que implican procesar aspectos especiales del entorno social. Esto se debe a que parece que el cerebro humano tiene una gran cantidad de circuitos neuronales dedicados a procesar tipos específicos de información social.

    La cognición social está fundamentalmente involucrada en cómo entendemos a los demás (Lieberman, 2007). Una vía clave para tal comprensión es nuestra capacidad de usar e interpretar expresiones faciales (Cole, 1998; Etcoff & Magee, 1992). Existe una larga historia de evidencia que indica que nuestros cerebros cuentan con circuitos especializados para procesar rostros. A lo largo de los siglos XVIII y XIX, hubo muchos reportes de pacientes cuyas lesiones cerebrales produjeron incapacidad para reconocer rostros pero no alteraron la capacidad de los pacientes para identificar otros objetos visuales. Esta condición fue llamada prosopagnosia, por “ceguera facial”, por el neurocientífico alemán Joachim Bodamer en un famoso manuscrito de 1947 (Ellis & Florence, 1990). En la década de 1980, las grabaciones de neuronas individuales en el cerebro de mono revelaron células que parecían estar adaptadas para responder a puntos de vista específicos de las caras de los monos (Perrett, Mistlin, & Chitty, 1987; Perrett, Rolls, & Caan, 1982). En ese momento, sin embargo, no estaba claro si las neuronas análogas para el procesamiento facial estaban presentes en el cerebro humano.

    Las técnicas modernas de imágenes cerebrales sugieren ahora que el cerebro humano tiene una elaborada jerarquía de sistemas neuronales cooperantes para procesar rostros y sus expresiones (Haxby, Hoffman, & Gobbini, 2000, 2002). Haxby, Hoffman y Gobbini (2000, 2002) argumentan por la existencia de múltiples regiones cerebrales bilaterales involucradas en diferentes funciones de percepción facial. Algunos de estos son sistemas centrales que se encargan de procesar invariantes faciales, como las posiciones relativas de los ojos, la nariz y la boca, que son necesarias para reconocer rostros. Otros son sistemas extendidos que procesan aspectos dinámicos de rostros para interpretar, por ejemplo, los significados de las expresiones faciales. Estos incluyen subsistemas que dan cuenta de manera cooperativa para la lectura de labios, el seguimiento de la dirección de la mirada y la asignación de afecto a los cambios dinámicos en la expresión.

    Las expresiones faciales no son la única fuente de información social. Los gestos y las acciones, también, son estímulos sociales críticos. La evidencia también sugiere que las neuronas espejo en el cerebro humano (Gallese et al., 1996; Iacoboni, 2008; Rizzolatti & Craighero, 2004; Rizzolatti, Fogassi, & Gallese, 2006) están especializadas tanto para la generación como para la interpretación de gestos y acciones.

    Las neuronas espejo fueron descubiertas fortuamente en experimentos en los que se registraron neuronas motoras en la región F5 cuando los monos realizaron diversas acciones de alcance (Di Pellegrino et al., 1992). Por accidente, se descubrió que muchas de las neuronas que estaban activas cuando un mono realizaba una acción también respondían cuando se observaban acciones similares siendo realizadas por otro:

    Después de los experimentos iniciales de grabación, observamos incidentalmente que algunas acciones de los experimentadores, como recoger el alimento o colocarlo dentro de la caja de prueba, activaron una proporción relativamente grande de neuronas F5 en ausencia de cualquier movimiento manifiesto del mono. (Di Pellegrino et al., 1992, p. 176)

    El descubrimiento casual de neuronas espejo ha llevado a una explosión de investigación sobre su comportamiento (Iacoboni, 2008). Se ha descubierto que cuando las neuronas disparan, lo hacen durante toda la duración de la acción observada, no sólo en su inicio. Son específicos de agarre: algunos responden a acciones que involucran agarres de precisión, mientras que otros responden a acciones que involucran objetos más grandes. Algunos están ampliamente sintonizados, en el sentido de que se activarán cuando se observen diversas acciones, mientras que otros están estrechamente sintonizados a acciones específicas. Todos parecen estar sintonizados a la acción orientada a objetos: una neurona espejo responderá a una acción particular sobre un objeto, pero no responderá a la acción idéntica si no hay ningún objeto presente.

    Si bien la mayoría de los resultados descritos anteriormente se obtuvieron de estudios del cerebro de mono, existe una literatura en constante crecimiento que indica que el cerebro humano también tiene un sistema espejo (Buccino et al., 2001; Iacoboni, 2008).

    Las neuronas espejo no se preocupan únicamente por los movimientos de las manos y los brazos. Por ejemplo, algunas neuronas espejo de mono responden a los movimientos de la boca, como los golpes de labios (Ferrari et al., 2003). De igual manera, el cerebro humano tiene un sistema espejo para el acto de tocar (Keysers et al., 2004). Asimismo, otra parte del cerebro humano, la insula, puede ser un sistema espejo para la emoción (Wicker et al., 2003). Por ejemplo, genera actividad cuando un sujeto experimenta disgusto, y también cuando un sujeto observa las expresiones faciales de otra persona que tiene una experiencia similar.

    Dos décadas después de su descubrimiento, una extensa investigación sobre el sistema de neuronas espejo ha llevado a algunos investigadores a afirmar que proporciona el sustrato neuronal para la cognición social y el aprendizaje imitativo (Gallese & Goldman, 1998; Gallese, Keysers, & Rizzolatti, 2004; Iacoboni, 2008), y que las interrupciones de este sistema puede ser responsable del autismo (Williams et al., 2001). La creciente comprensión del sistema espejo y los avances en el conocimiento sobre la neurociencia de la percepción facial han proclamado un nuevo programa de investigación interdisciplinar, llamado neurociencia cognitiva social (Blakemore, Winston, & Frith, 2004; Lieberman, 2007; Ochsner & Lieberman, 2001).

    Alguna vez pudo haber parecido temerario elaborar conexiones entre los mecanismos neurofisiológicos fundamentales y el comportamiento social altamente complejo, y mucho menos decidir si los mecanismos son específicos de los procesos sociales. Sin embargo... los estudios de neuroimagen han proporcionado algunos ejemplos alentadores. (Blakemore, Winston, & Frith, 2004, p. 216)

    La existencia de la neurociencia cognitiva social es consecuencia de la evolución humana, encarnada y se sitúa, en un entorno social que incluye a otros humanos y sus expresiones faciales, gestos y acciones. El campo moderno de la robótica sociable (Breazeal, 2002) intenta desarrollar robots humanoides que también están socialmente encarnados y situados. Un propósito de tales robots es proporcionar un medio para estudiar la cognición social humana a través de la ingeniería avanzada.

    Un segundo propósito aplicado de la robótica sociable es diseñar robots para trabajar cooperativamente con humanos aprovechando un entorno social compartido. Breazeal (2002) argumentó que debido a que el cerebro humano ha evolucionado para ser experto en interacción social, “si una tecnología se comporta de manera socialmente competente, evocamos nuestra maquinaria social evolucionada para interactuar con ella” (p. 15). Esto es particularmente cierto si el comportamiento socialmente competente de un robot está mediado por su encarnación humanoide, lo que le permite hacer gestos o generar expresiones faciales. “Cuando un robot sostiene nuestra mirada, el cableado de la evolución nos hace pensar que el robot está interesado en nosotros. Cuando eso sucede, sentimos la posibilidad de una conexión más profunda” (Turkle, 2011, p. 110). La robótica sociable explota los mecanismos humanos que ofrecen esta conexión más profunda para que los humanos no requieran entrenamiento experto en la interacción con robots sociables.

    Un tercer propósito de la robótica sociable es explorar andamios cognitivos, que en esta literatura a menudo se llama apalancamiento, con el fin de ampliar las capacidades de los robots. Por ejemplo, muchas de las famosas plataformas de la robótica sociable, entre ellas Cog (Brooks et al., 1999; Scassellati, 2002), Kismet (Breazeal, 2002, 2003, 2004), Domo (Edsinger-Gonzales & Weber, 2004) y Leanardo (Breazeal, Gray, & Berlin, 2009), son humanoides en forma y son aprendices sociales, sus capacidades avanzar a través de la imitación y mediante la interacción con parejas humanas. Además, el éxito de la contribución del robot al entorno social compartido se apoya en gran medida en las contribuciones de la pareja humana. “Edsinger piensa en ello como conseguir que Domo haga más 'aprovechando a la gente'. Domo necesita la ayuda. Entiende muy poco sobre cualquier tarea en su conjunto” (Turkle, 2011, p. 157).

    El apalancamiento explotado por un robot sociable aprovecha los bucles conductuales mediados por las expresiones y gestos tanto del robot como de la pareja humana. Por ejemplo, consideremos el robot Kismet (Breazeal, 2002). Kismet es un “infante” robótico sociable, una cabeza dinámica y mecanizada que participa en las interacciones sociales. Kismet tiene sistemas perceptivos auditivos y visuales que están diseñados para percibir las señales sociales proporcionadas por un “cuidador” humano. Kismet también puede ofrecer tales señales sociales cambiando su expresión facial, dirigiendo su mirada a un lugar en un ambiente compartido, cambiando su postura y vocalizando.

    Cuando Kismet se está comunicando con un ser humano, utiliza la interacción para satisfacer impulsiones o necesidades internas (Breazeal, 2002). Kismet tiene tres impulsos: un impulso social para estar en presencia y ser estimulado por las personas, un impulso de estimulación para ser estimulado por el entorno en general (por ejemplo, por juguetes coloridos) y un impulso de fatiga que hace que el robot “duerma”. Kismet envía señales sociales para satisfacer estas impulsiones. Puede manipular su expresión facial, vocalización y postura para comunicar seis emociones básicas: ira, asco, miedo, alegría, tristeza y sorpresa. Estas expresiones trabajan para satisfacer las impulsiones manipulando el entorno social de tal manera que el entorno cambie para satisfacer las necesidades de Kismet.

    Por ejemplo, un impulso social incumplido hace que Kismet exprese tristeza, lo que inicia respuestas sociales de un cuidador. Cuando Kismet percibe el rostro del cuidador, mueve los oídos en saludo e inicia un diálogo lúdico para involucrar al cuidador. Kismet eventualmente se habituará a estas interacciones y luego buscará cumplir un impulso de estimulación persuadiendo al cuidador para que presente un juguete colorido. Sin embargo, si esta presentación es demasiado estimulante, si el juguete se presenta demasiado de cerca o se mueve demasiado rápido, el impulso de fatiga producirá cambios en el comportamiento de Kismet que intentan disminuir esta estimulación. Si el mundo no cambia de la manera deseada, Kismet terminará la interacción “durmiendo”. “Pero incluso en su peor momento, Kismet da la apariencia de tratar de relacionarse. En su mejor momento, Kismet parece estar en una conversación continua y expresiva” (Turkle, 2011, p. 118).

    El comportamiento de Kismet conduce a interacciones largas y dinámicas que son realistas y sociales. Una joven que interactúa con Kismet “se vuelve cada vez más feliz y relajada. Al ver a chica y robot juntos, es fácil ver a Kismet como cada vez más feliz y relajado también. Niño y robot son una pareja feliz” (Turkle, 2011, p. 121). Resultados similares ocurren cuando los adultos conversan con Kismet. “Un momento, Rich juega en una conversación con Kismet, y al siguiente, es arrastrado por algo que empieza a sentirse real” (p. 154).

    Incluso el diseñador de un robot humanoide puede ser “barrido” por sus interacciones con él. Domo (Edsinger-Gonzales & Weber, 2004) es un robot humanoide con extremidades que pretende ser un ayudante físico, al realizar acciones como colocar objetos en estantes. Aprende a comportarse interactuando físicamente con un maestro humano. Estas interacciones físicas dan incluso a los usuarios sofisticados, incluido su diseñador, Edsinger, una fuerte sensación de que Domo es una criatura social. Edsinger se encuentra vacilando de un lado a otro entre ver a Domo como una criatura o simplemente como un dispositivo que ha diseñado.

    Para Edsinger, esta secuencia —experimentar a Domo como tener deseos y luego hablar a sí mismo de la idea— se vuelve familiar. Porque aunque es el programador de Domo, el comportamiento del robot no se ha vuelto aburrido ni predecible.Trabajando juntos, Edsigner y Domo parecen estar aprendiendo el uno del otro. (Turkle, 2011, p. 156)

    Que los robots sociables puedan generar reacciones tan fuertes dentro de los humanos es potencialmente preocupante. El sentimiento de lo extraño ocurre cuando lo familiar se presenta en forma desconocida (Freud, 1976). Los resultados extraños cuando las categorías estándar utilizadas para clasificar al mundo desaparecen (Turkle, 2011). Turkle (2011) llamó a una de esas instancias, cuando un robot sociable es aceptado acríticamente como criatura, el momento robótico. Las reacciones de Edsinger a Domo ilustraron su ocurrencia: “Y aquí es donde estamos en el momento robótico. Uno de los 'usuarios' de robots más sofisticados del mundo no puede resistirse a la idea de que la presión de la mano de un robot implica cuidar” (p. 160).

    En cuestión en el momento robótico se encuentra una refundición radical de lo posthumano (Hayles, 1999). “Los límites entre las personas y las cosas están cambiando” (Turkle, 2011, p. 162). Los diseñadores de robots sociables andamian sus creaciones aprovechando las habilidades sociales expertas de los humanos. El momento robótico, sin embargo, implica un replanteamiento dramático de lo que implican tales habilidades humanas. ¿Podrían reducirse las interacciones sociales humanas a meros ciclos sensoriales del tipo empleado en dispositivos como Kismet? “A la objeción de que un robot sólo puede parecer importarle o entender, se ha vuelto algo común obtener la respuesta que a la gente, también, puede parecer que sólo le importa o entiende” (p. 151).

    En la definición de posthumanismo de Hayes (1999), el cuerpo es prescindible, porque la esencia de la humanidad es la información. Pero esta es una visión sumamente clásica. Una alternativa, el posthumanismo encarnado es aquel en el que se dispensa a la mente, porque lo fundamental para la humanidad es el cuerpo y su compromiso con la realidad. “Desde sus inicios, la inteligencia artificial ha trabajado en este espacio entre una visión mecánica de las personas y una visión psicológica, incluso espiritual, de las máquinas” (Turkle, 2011, p. 109). El momento robótico lleva a Turkle a preguntar “¿Qué será el amor? ¿Y qué significará lograr una intimidad cada vez mayor con nuestras máquinas? ¿Estamos listos para vernos en el espejo de la máquina y para ver el amor como nuestras actuaciones de amor?” (p. 165).


    This page titled 5.9: Momentos robóticos en el entorno social is shared under a not declared license and was authored, remixed, and/or curated by Michael R. W. Dawson (Athabasca University Press) .