5.8: Reorientación sin representación

Última actualización
Guardar como PDF

Page ID: 143731

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

El trabajo robótico de Grey Walter ha sido descrito con precisión como una inspiración para los estudios modernos de sistemas autónomos (Reeve & Webb, 2003). De hecho, el tipo de investigación realizada por Grey Walter parece notablemente similar a la “nueva ola” de robótica basada en el comportamiento o inspirada biológicamente (Arkin, 1998; Breazeal, 2002; Sharkey, 1997; Webb & Consi, 2001).

En muchos aspectos, esto representa un importante renacimiento de la búsqueda de Grey Walter por la “mímica de la vida” (Grey Walter, 1963, p. 114). A pesar de que las Tortugas fueron descritas en su muy popular libro de 1963 The Living Brain, esencialmente desaparecieron del panorama científico durante aproximadamente un cuarto de siglo. Grey Walter estuvo involucrado en un accidente de motocicleta de 1970 que puso fin a su carrera; luego de este accidente, se perdió el paradero de la mayoría de las Tortugas. Uno quedó en posesión de su hijo tras la muerte de Grey Walter en 1977; fue localizado en 1995 tras una extensa búsqueda por parte de Owen Holland. Este descubrimiento renovó el interés por la obra de Grey Walter (Hayward, 2001; Holland, 2003a, 2003b), y ha restablecido su importante lugar en la investigación moderna.

El propósito de la sección actual es introducir brevemente un pequeño segmento de investigación robótica que ha descendido del trabajo pionero de Grey Walter. En el Capítulo 3, presentamos la tarea de reorientación que se usa frecuentemente para estudiar cómo un agente usa las señales geométricas y características para navegar por su mundo. También describimos una teoría clásica, el módulo geométrico (Cheng, 1986; Gallistel, 1990), que se ha utilizado para explicar algunos de los hallazgos básicos sobre esta tarea. En el capítulo 4, señalamos que la tarea de reorientación también se ha abordado desde la perspectiva de la ciencia cognitiva conexionista. Una simple red neuronal artificial, el perceptrón, se ha ofrecido como una alternativa viable a la teoría clásica (Dawson et al., 2010). En esta sección describimos brevemente una tercera aproximación a la tarea de reorientación, ya que la ciencia cognitiva encarnada la ha estudiado en el contexto de la robótica basada en el comportamiento.

La ciencia cognitiva clásica y conexionista proporciona relatos muy diferentes de las interacciones cooperativas y competitivas entre señales geométricas y featurales cuando un agente intenta reubicar la ubicación objetivo en un campo de reorientación. Sin embargo, estas diferentes cuentas son ambas representacionales. Uno de los temas que invade la ciencia cognitiva encarnada es una reacción contra las explicaciones representacionales del comportamiento inteligente (Shapiro, 2011). Un campo que ha sido un banco de pruebas para el abandono de representaciones internas se conoce como new wave robotics (Sharkey, 1997).

Los roboticistas de la nueva ola se esfuerzan por reemplazar la representación con la reacción (Brooks, 1999), para utilizar ciclos de acto sensorial en lugar del procesamiento representacional senso-pensar-acto. Esto se debe a que “los sistemas encarnados y situados pueden resolver tareas bastante complicadas sin requerir estados internos o representaciones internas” (Nolfi & Floreano, 2000, p. 93). Una habilidad que se ha demostrado con éxito en la robótica new wave es la navegación en el contexto de la tarea de reorientación (Lund & Miglino, 1998).

El robot Khepera (Bellmore & Nemhauser, 1968; Boogaarts, 2007) es una plataforma estándar para la práctica de la robótica new wave. Tiene la apariencia de un disco de hockey motorizado, utiliza dos ruedas motorizadas para moverse, y cuenta con ocho sensores distribuidos alrededor de su chasis que le permiten detectar la proximidad de obstáculos. Los robólogos tienen el objetivo de combinar las señales del detector de proximidad para controlar la velocidad del motor con el fin de producir el comportamiento dinámico deseado. Un enfoque para lograr este objetivo es emplear la robótica evolutiva (Nolfi & Floreano, 2000). La robótica evolutiva implica utilizar un algoritmo genético (Holland, 1992; Mitchell, 1996) para encontrar un conjunto de pesos entre cada detector de proximidad y cada motor.

En general, la robótica evolutiva procede de la siguiente manera (Nolfi & Floreano, 2000). En primer lugar, se define una función de acondicionamiento físico, para evaluar la calidad del rendimiento del robot. La evolución comienza con una población inicial de diferentes sistemas de control, como diferentes conjuntos de pesos sensor a motor. La función de fitness se utiliza para evaluar cada uno de estos sistemas de control, y aquellos que producen valores de aptitud más altos “sobreviven”. Los sobrevivientes son utilizados para crear la próxima generación de sistemas de control a través de métodos prescritos de “mutación”. Todo el proceso de evaluar-sobrevivir-mutar es iterado; se espera que la aptitud promedio mejore con cada nueva generación. El proceso evolutivo termina cuando las mejoras en la aptitud se estabilizan. Cuando la evolución se detiene, el resultado es un sistema de control que debe ser bastante capaz de realizar la tarea que fue evaluada por la función de fitness.

Lund y Miglino (1998) utilizaron este procedimiento para desarrollar un sistema de control que permitió a los robots Khepera realizar la tarea de reorientación en una arena rectangular sin señales de características. Su objetivo era ver si se podía producir un resultado estándar —error rotacional— en un agente que no empleara el módulo geométrico, y de hecho que no representara en absoluto las propiedades de la arena. La función de fitness de Lund y Miglino simplemente midió la cercanía de un robot a la ubicación de la meta. Después de 30 generaciones de evolución, produjeron un sistema que navegaría a un robot hasta la ubicación de meta desde cualquiera de las 8 ubicaciones iniciales diferentes con una tasa de éxito del 41 por ciento. Sus robots también produjeron error rotacional, pues navegaron incorrectamente a la esquina 180° de la portería en otro 41 por ciento de los ensayos de prueba. Estos resultados fueron sorprendentemente similares a los observados cuando las ratas realizan reorientación en arenas rectangulares sin rasgos (e.g., Gallistel, 1990).

Es importante destacar que el sistema de control que evolucionaron Lund y Miglino (1998) era simplemente un conjunto de conexiones ponderadas entre detectores de proximidad y motores, y no una codificación de forma de arena.

Las propiedades geométricas del entorno se pueden asimilar en el esquema sensorymotor del comportamiento del robot sin ninguna representación explícita. En general, nuestro trabajo, en contraste con los modelos cognitivos tradicionales, muestra cómo se puede alcanzar el conocimiento ambiental sin ninguna forma de representación directa. (Lund y Miglino, 1998, p. 198)

Si la forma de la arena no se representa explícitamente, ¿cómo produce el comportamiento de las tareas de reorientación el sistema de control desarrollado por Lund y Miglino (1998)? Cuando el robot está lo suficientemente lejos de las paredes de la arena como para que ninguno de los sensores detecte un obstáculo, los pesos del controlador son tales que el robot se mueve en una curva suave hacia la izquierda. Como resultado, ¡nunca se encuentra con una pared corta cuando sale de cualquiera de sus ocho ubicaciones iniciales! Cuando se encuentra (inevitablemente) una pared larga, el robot gira a la izquierda y sigue la pared hasta que se detiene en una esquina. El resultado es que el robot estará en la ubicación objetivo o en su equivalente rotacional.

El sistema de control desarrollado por Lund y Miglino (1998) está restringido a arenas rectangulares de un tamaño de conjunto. Si uno de sus robots se coloca en una arena de incluso un tamaño ligeramente diferente, su rendimiento se ve perjudicado (Nolfi, 2002). Nolfi utilizó un proceso evolutivo mucho más largo (500 generaciones), y también colocó robots en arenas de diferentes tamaños, para producir con éxito dispositivos que generarían resultados típicos no solo en una arena rectangular sin rasgos distintivos, sino también en arenas de diferentes dimensiones. Nuevamente, estos robots lo hicieron sin representar la forma o la geometría de la arena.

El sistema de control más general de Nolfi (2002) funcionó de la siguiente manera. Sus robots comenzarían moviéndose hacia adelante y evitando muros, lo que eventualmente los llevaría a una esquina. Al enfrentar una esquina, las señales de las dos paredes de la esquina provocaron que el robot girara primero para orientarse en un ángulo de 45° con respecto a una de las paredes de la esquina. Entonces el robot haría un giro adicional que era ya sea en sentido horario o antihorario, dependiendo de si la pared detectada estaba a la izquierda o a la derecha del robot.

El giro final lejos de la esquina apuntaba necesariamente al robot en una dirección que haría que siguiera una pared larga, ya que detectar una pared a 45° es una medida indirecta de la longitud de la pared:

Si el robot encuentra una pared a aproximadamente 45° en su lado izquierdo y previamente dejó una esquina, significa que la pared real es una de las dos paredes más largas. Por el contrario, si encuentra una pared a 45° en su lado derecho, la pared real es necesariamente una de las dos paredes más cortas. Lo interesante es que el robot “mide” la longitud relativa de las paredes a través de la acción (es decir, explotando la coordinación sensorial-motora) y no necesita ningún estado interno para hacerlo. (Nolfi, 2002, p. 141)

Como resultado, el robot detectó la pared larga en una arena rectangular sin representar la longitud de la pared. Siguió la pared larga, que necesariamente llevó al robot a la esquina de la portería o a la esquina que resulta en un error rotacional, independientemente de las dimensiones reales de la arena rectangular.

Los robots más simples que los Khepera también pueden realizar la tarea de reorientación, y al mismo tiempo pueden generar algunos de sus resultados centrales. La arquitectura de subsunción se ha utilizado para diseñar un simple robot LEGO, AntiSlam (Dawson, Dupuis, & Wilson, 2010), que demuestra el error rotacional e ilustra cómo un robot de nueva ola puede combinar señales geométricas y featurales, una habilidad no incluida en los robots evolucionados que se han discutido anteriormente.

La capacidad de los robots autónomos para navegar es fundamental para su éxito. A diferencia de los robots descritos en los párrafos anteriores, uno de los principales enfoques para proporcionar dicha navegación se llama SLAM, que es un acrónimo de un enfoque representacional llamado “localización y mapeo simultáneos” (Jefferies & Yeap, 2008). Los representacionalistas asumieron que los agentes navegan por su entorno al detectar su ubicación actual y referenciarla en algún mapa interno. ¿Cómo va a proceder esa navegación si un agente es colocado en un entorno novedoso para el que no existe tal mapa? SLAM es un intento de responder a esta pregunta. Propone métodos que permiten a un agente construir un nuevo mapa de un entorno novedoso y al mismo tiempo utilizar este mapa para determinar la ubicación actual del agente.

Los supuestos representacionales que subyacen a enfoques como el SLAM han suscitado recientemente preocupaciones en algunos investigadores que estudian la navegación animal (Alerstam, 2006). ¿Hasta qué punto un robot completamente reactivo y sensato podría ser capaz de demostrar un comportamiento de navegación interesante? El propósito de AntiSlam (Dawson, Dupuis, & Wilson, 2010) era explorar esta cuestión en una plataforma increíblemente simple: el nombre del robot proporciona cierto sentido de la motivación para su construcción.

AntiSlam es un ejemplo de un Braitenberg Vehicle 3 (Braitenberg, 1984), porque utiliza seis sensores diferentes, cada uno de los cuales contribuye a la velocidad de dos motores que lo impulsan y dirigen. Dos son sensores ultrasónicos que se utilizan como sonar para detectar obstáculos, dos son detectores de rotación que se utilizan para determinar cuándo el robot ha dejado de moverse, y dos son sensores de luz que se utilizan para atraer al robot a ubicaciones de iluminación brillante. Los reflejos sensoriales de AntiSlam no fueron evolucionados, sino que fueron creados usando la arquitectura de subsunción.

El nivel más bajo de procesamiento en AntiSlam es “drive”, que esencialmente utiliza las salidas de los sensores ultrasónicos para controlar la velocidad del motor. Cuanto más cerca de un obstáculo se pone un sensor, más lenta es la velocidad del motor que el sensor ayuda a controlar. El siguiente nivel es “escape”. Cuando ambos sensores de rotación están señalando que el robot está estacionario (es decir, detenido por un obstáculo detectado por ambos sensores), el robot ejecuta un giro para apuntarse en una dirección diferente. El siguiente nivel arriba es “seguimiento de pared”: la velocidad del motor se manipula de tal manera que el robot tiene un fuerte sesgo para mantenerse más cerca de una pared a la derecha que a una pared de la izquierda. El nivel más alto es “característica”, que utiliza dos sensores de luz para contribuir a la velocidad del motor de tal manera que se acerca a áreas de luz más brillante.

AntiSlam realiza un comportamiento exploratorio complejo y real cuando se coloca en entornos generales. Sigue paredes, se dirige alrededor de obstáculos, explora regiones de luz más brillante, y se da la vuelta y escapa cuando se encuentra detenido en una esquina o frente a un gran obstáculo.

Cuando se coloca en una arena de tareas de reorientación, AntiSlam genera comportamientos que le dan la ilusión de representar señales geométricas y características (Dawson, Dupuis, & Wilson, 2010). Sigue paredes en una arena rectangular, desacelerándose hasta detenerse cuando entra en una esquina. Luego inicia una rutina de giro para salir de la esquina y continuar explorando. Sus sensores de luz le permiten encontrar de manera confiable una ubicación objetivo asociada con características geométricas y locales particulares. Cuando se eliminan las entidades locales, navega por la arena usando solo señales geométricas y produce errores de rotación. Cuando se mueven las características locales (es decir, se ilumina una esquina incorrecta), su elección de ubicaciones desde una variedad de puntos de partida imita la misma combinación de señales geométricas y características demostradas en experimentos con animales. En resumen, produce algunas de las características clave de la tarea de reorientación, sin embargo, lo hace sin crear un mapa cognitivo, e incluso sin representar una meta. Además, las observaciones del comportamiento de la tarea de reorientación de AntiSlam indicaron que una medida conductual crucial, el camino que toma un agente a medida que avanza por la arena, es crítica. Tales caminos rara vez se reportan en estudios de reorientación.

Los robots reorientadores discutidos anteriormente son descendientes bastante recientes de las Tortugas de Grey Walter (1963), pero sus ancestros más antiguos son los autómatas mecánicos que imitan la vida del siglo XVIII (Wood, 2002). Estos dispositivos pusieron de relieve las cuestiones filosóficas relativas a la comparación del hombre y la máquina que era central en la filosofía cartesiana (Grenville, 2001; Wood, 2002). Las tensiones religiosas sobre la naturaleza mecanicista del hombre, y la naturaleza espiritual de los autómatas mecánicos, fueron suavizadas por el dualismo: los autómatas y los animales eran máquinas. Los hombres también eran máquinas, pero a diferencia de los autómatas, también tenían almas. Fue la aparición de autómatas mecánicos lo que llevó a su popularidad, así como a sus conflictos con la iglesia. “Hasta la era científica, lo que más le parecía vivo a la gente era lo que más parecía un ser vivo. La vitalidad otorgada a un objeto era función principalmente de su forma” (Grey Walter, 1963, p. 115).

En contraste, las Tortugas de Grey Walter no fueron intentos de reproducir apariencias, sino simulaciones de habilidades más generales y abstractas centrales para los agentes biológicos,

exploración, curiosidad, libre voluntad en el sentido de imprevisibilidad, búsqueda de metas, autoregulación, evitación de dilemas, previsión, memoria, aprendizaje, olvido, asociación de ideas, reconocimiento de formas y los elementos de acomodación social. Así es la vida. (Grey Walter, 1963, p. 120)

Al situar y encarnar sus máquinas, Grey Walter inventó un nuevo tipo de herramienta científica que producía comportamientos creativos e impredecibles, gobernados por relaciones no lineales entre los mecanismos internos y el mundo dinámico circundante.

Las máquinas modernas que imitan un comportamiento real siguen planteando serias dudas sobre lo que es ser humano. Para Wood (2002, p. xxvii) todos los autómatas eran presunciones “de que la vida puede ser simulada por el arte o la ciencia o la magia. Y encarnado en cada invención hay un enigma, un reto fundamental para nuestra percepción de lo que nos hace humanos”. El desafío es que si los comportamientos realistas de las Tortugas y sus descendientes son meramente bucles de retroalimentación entre mecanismos simples y sus entornos, ¿entonces podría ser lo mismo cierto de la inteligencia humana?

Este reto se refleja en algunos de los comentarios del roboticista Rodney Brooks en el documental de 1997 de Errol Morris Fast, Cheap & Out of Control. Brooks comienza describiendo uno de sus primeros robots: “A un observador le parece que el robot tiene intenciones y tiene metas y está siguiendo a la gente y persiguiendo presas. Pero es solo la interacción de muchos y muchos procesos mucho más simples”. Brooks considera entonces extender esta visión a la cognición humana: “Quizás eso es todo lo que hay. A lo mejor mucho de lo que están haciendo los humanos podría explicarse de esta manera”.

Pero a medida que avanza el segmento del documental, Brooks, el pionero de la robótica basada en el comportamiento, es reacio a creer que los humanos son tipos similares de dispositivos:

Cuando lo pienso, casi puedo verme a mí mismo como formado por miles y miles de pequeños agentes que hacen cosas casi independientemente. Pero al mismo tiempo vuelvo a creer las cosas sobre los humanos que todos creemos sobre los humanos y vivir la vida de esa manera. De lo contrario lo analizo demasiado; la vida se vuelve casi sin sentido. (Morris, 1997)

Conflictos como los expresados por Brooks se ponen en primer plano cuando la ciencia cognitiva encarnada se aventura a estudiar robots humanoides que están diseñados para explotar entornos e interacciones sociales (Breazeal, 2002; Turkle, 2011).