Saltar al contenido principal
LibreTexts Español

4.19: ¿Qué es la Ciencia Cognitiva Coneccionista?

  • Page ID
    143839
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    El propósito del capítulo actual era introducir los elementos de la ciencia cognitiva conexionista, el “sabor” de la ciencia cognitiva que se vio primero como Viejo Connectionism en la década de 1940 (McCulloch & Pitts, 1943) y que alcanzó su punto máximo a finales de los cincuenta (Rosenblatt, 1958, 1962; Widrow, 1962; Widrow y Hoff, 1960). Las críticas a las limitaciones de tales redes (Minsky & Papert, 1969) provocaron que la investigación coneccionista desapareciera casi por completo hasta mediados de la década de 1980 (Papert, 1988), cuando surgió el Nuevo Conexionismo en forma de técnicas capaces de entrenar poderosas redes multicapa (McClelland & Rumelhart, 1986; Rumelhart & McClelland, 1986c).

    El conexionismo está ahora bien establecido como parte de la ciencia cognitiva convencional, aunque su relación con la ciencia cognitiva clásica está lejos de ser clara. Las redes neuronales artificiales se han utilizado para modelar una vertiginosa variedad de fenómenos incluyendo el aprendizaje animal (Enquist & Ghirlanda, 2005; Schmajuk, 1997), desarrollo cognitivo (Elman et al., 1996), sistemas expertos (Gallant, 1993), lenguaje (Mammone, 1993; Sharkey, 1992), reconocimiento de patrones y percepción (Pao , 1989; Ripley, 1996; Wechsler, 1992), y cognición musical (Griffith & Todd, 1999; Todd & Loy, 1991).

    Dada la amplitud de la ciencia cognitiva conexionista, solo se ha introducido en este capítulo una selección de sus elementos; no es posible capturar todas las contribuciones importantes del conexionismo en un solo capítulo. Un tratamiento adecuado del conexionismo requiere mucha lectura adicional; afortunadamente el conexionismo se describe en una literatura rica y creciente (Amit, 1989; Anderson, 1995; Anderson & Rosenfeld, 1998; Bechtel & Abrahamsen, 2002; Carpenter & Grossberg, 1992; Caudill & Butler, 1992a, 1992b; Churchland, 1986; Churchland y Sejnowski, 1992; Clark, 1989, 1993; Dawson, 2004, 2005; Grossberg, 1988; Horgan & Tianson, 1996; Quinlan, 1991; Ramsey, Stich, y Rumelhart, 1991; Ripley, 1996; Rojas, 1996).

    La ciencia cognitiva conexionista se describe frecuentemente como una reacción contra los supuestos fundamentales de la ciencia cognitiva clásica. Las raíces de la ciencia cognitiva clásica se inspiran en la filosofía racionalista de Descartes, con énfasis en el nativismo y el logicismo (Chomsky, 1966; Devlin, 1996). En contraste, los fundamentos de la ciencia cognitiva conexionista son la filosofía empirista de Locke y la psicología asociacionista que se puede rastrear desde los primeros empiristas británicos hasta los conductistas estadounidenses más modernos. Las redes coneccionistas adquieren estructura o conocimiento a través de la experiencia; a menudo comienzan como pizarras en blanco (Pinker, 2002) y adquieren estructura a medida que aprenden sobre sus entornos (Bechtel, 1985; Clark, 1989, 1993; Hillis, 1988).

    La ciencia cognitiva clásica se apartó de la filosofía cartesiana buscando relatos materialistas de mentalidad. Esta visión se inspiró en la computadora digital y el hecho de que a los interruptores electrónicos se les podían asignar interpretaciones lógicas abstractas (Shannon, 1938).

    El conexionismo también es materialista, pero posiblemente en un sentido más restringido que la ciencia cognitiva clásica. El enfoque clásico apela al argumento de la realización múltiple cuando señala que bajo la interpretación adecuada, casi cualquier sustrato físico podría instanciar el procesamiento de información o la manipulación de símbolos (Hillis, 1998). En contraste, el conexionismo ve la metáfora de la computadora digital como equivocada. Los conexionistas afirman que las operaciones de dicho dispositivo, independientemente de su naturaleza material, son demasiado lentas, quebradizas e inflexibles para ser apropiadas para modelar la cognición. El conexionismo postula en cambio que el cerebro es el único material apropiado para realizar la mente y los investigadores intentan enmarcar sus teorías en términos de procesamiento de información que es biológicamente plausible o inspirado neuronalmente (Amit, 1989; Burnod, 1990; Gluck & Myers, 2001).

    Al adoptar la metáfora digital de la computadora y la visión lógica que la acompaña de que la cognición es el resultado de la manipulación de símbolos regida por reglas, la ciencia cognitiva clásica se caracteriza por una marcada distinción estructura/proceso. Es decir, los modelos clásicos, tipificados por máquinas Turing (Turing, 1936) o sistemas de producción (Newell & Simon, 1972), distinguen entre los símbolos que se manipulan y las reglas explícitas que hacen la manipulación. Esta distinción suele estar marcada en los modelos al tener ubicaciones separadas para la estructura y el proceso, como una memoria que contiene símbolos y un controlador central que contiene los procesos.

    Al abandonar la metáfora de la computadora digital y adoptar una noción de procesamiento de información de inspiración biológica, la ciencia cognitiva coneccionista abandona o difumina la distinción estructura/proceso. Las redes neuronales pueden verse como estructura y proceso; se les ha llamado estructuras de datos activas (Hillis, 1985). Esto ha llevado a un extenso debate sobre si las teorías de la cognición requieren reglas explícitas (Ramsey, Stich, & Rumelhart, 1991).

    La metáfora informática digital adoptada por la ciencia cognitiva clásica la lleva a adoptar también una noción particular de control. En particular, los modelos clásicos invocan una noción de control serial en la que las representaciones solo pueden manipularse una regla a la vez. Cuando los solucionadores de problemas clásicos buscan un espacio problemático para resolver un problema (Newell & Simon, 1972), lo hacen para descubrir una secuencia de operaciones a realizar.

    En contraste, cuando la ciencia cognitiva coneccionista abandona la metáfora de la computadora digital, abandona con ella la asunción del control serial centralizado. Lo hace porque ve esto como una falla fatal en los modelos clásicos, generando un “cuello de botella de von Neumann” que hace que las teorías clásicas sean demasiado lentas para ser útiles en tiempo real (Feldman & Ballard, 1982; Hillis, 1985). En lugar del control serial centralizado, los coneccionistas proponen un control descentralizado en el que muchos procesos simples pueden estar operando en paralelo (ver Dawson & Schopflocher, 1992a).

    Claramente, desde una perspectiva, existen diferencias obvias e importantes entre la ciencia cognitiva conexionista y la ciencia cognitiva clásica. Sin embargo, un cambio de perspectiva puede revelar una visión en la que se evidencian sorprendentes similitudes entre estos dos enfoques. Anteriormente vimos que la ciencia cognitiva clásica se realiza en múltiples niveles de análisis, utilizando métodos formales para explorar el nivel computacional, métodos conductuales para investigar el nivel algorítmico, y una variedad de técnicas conductuales y biológicas para elaborar la arquitectura e implementación niveles. Es cuando se examina la ciencia cognitiva conexionista desde este mismo punto de vista de múltiples niveles que se hace evidente su relación con la ciencia cognitiva clásica (Dawson, 1998).

    Los análisis a nivel computacional implican el uso de algún lenguaje formal para hacer pruebas sobre los sistemas cognitivos. Por lo general, estas pruebas se refieren a declaraciones sobre qué tipo de cálculo se está realizando o cuáles son las capacidades generales de un sistema. Los análisis a nivel computacional han tenido una larga e importante historia en la ciencia cognitiva coneccionista, y han sido responsables, por ejemplo, de pruebas de que reglas particulares de aprendizaje convergerán a estados deseados de menor energía o de bajo error (Ackley, Hinton, & Sejnowski, 1985; Hopfield, 1982; Rosenblatt, 1962; Rumelhart, Hinton, & Williams, 1986b). Otros ejemplos de análisis computacionales se proporcionaron anteriormente en este capítulo, en la discusión de tallar espacios de patrones en regiones de decisión y la determinación de que las actividades de la unidad de salida podrían interpretarse como probabilidades condicionales.

    Ese análisis computacional es posible tanto para la ciencia cognitiva conectcionista como para la clásica, resalta una similitud entre estos dos enfoques. Los resultados de algunos análisis computacionales, sin embargo, revelan una similitud más llamativa. Un debate en la literatura se ha referido a si la naturaleza asociacionista de las redes neuronales artificiales limita su poder computacional, en la medida en que no son apropiadas para la ciencia cognitiva. Por ejemplo, ha habido un debate considerable sobre si las redes PDP demuestran una sistematicidad y componencialidad adecuadas (Fodor & McLaughlin, 1990; Fodor & Pylyshyn, 1988; Hadley, 1994a, 1994b, 1997; Hadley y Hayward, 1997), dos características importantes para el uso de la recursión en modelos clásicos. Sin embargo, comenzando con los análisis matemáticos de Warren McCulloch (McCulloch & Pitts, 1943) y continuando con los análisis computacionales modernos (Girosi & Poggio, 1990; Hartman, Keeler, & Kowalski, 1989; Lippmann, 1989; McCulloch & Pitts, 1943; Moody & Darken, 1989; Poggio y Girosi, 1990; Renals, 1989; Siegelmann, 1999; Siegelmann & Sontag, 1991), hemos visto que las redes neuronales artificiales pertenecen a la clase de máquinas universales. La ciencia cognitiva clásica y conexionista no son distinguibles a nivel computacional del análisis (Dawson, 1998, 2009).

    Pasemos ahora al siguiente nivel de análisis, el nivel algorítmico. Para la ciencia cognitiva clásica, el nivel algorítmico implica detallar los pasos específicos de procesamiento de información que están involucrados en la resolución de un problema. En general, esto casi siempre implica analizar sistemas de comportamiento para determinar cómo se manipulan las representaciones, un enfoque tipificado al examinar la resolución de problemas humanos con el uso del análisis de protocolos (Ericsson & Simon, 1984; Newell & Simon, 1972). Los análisis a nivel algorítmico para conexionistas también implican analizar la estructura interna de sistemas intactos (redes entrenadas) para determinar cómo median las regularidades de estímulo-respuesta. Hemos visto ejemplos de una variedad de técnicas que pueden y han sido utilizadas para descubrir las representaciones que están ocultas dentro de las estructuras de red, y que permiten a las redes realizar asignaciones de entrada y salida deseadas. Algunas de estas representaciones, como los códigos gruesos, parecen alternativas a las representaciones clásicas. Así, una de las contribuciones de la ciencia cognitiva clásica puede ser permitir descubrir y explorar nuevos tipos de representaciones.

    Sin embargo, los análisis a nivel algorítmico también revelan más similitudes entre la ciencia cognitiva conexionista y la clásica. Si bien estos dos enfoques pueden proponer diferentes tipos de representaciones, siguen siendo ambas representacionales. No hay diferencia de principios entre el sándwich clásico y el sándwich coneccionista (Calvo & Gomila, 2008). Además, ni siquiera se garantiza que el contenido de estos dos tipos de sándwiches difiera. Uno puede mirar dentro de una red neuronal artificial y encontrar reglas clásicas para la lógica (Berkeley et al., 1995) o incluso un sistema de producción completo (Dawson et al., 2000).

    A nivel arquitectónico del análisis, se pueden establecer diferencias más fuertes entre la ciencia cognitiva conexionista y la ciencia cognitiva clásica. En efecto, el debate entre estos dos planteamientos es en esencia un debate sobre la arquitectura. Esto se debe a que muchas de las dicotomías introducidas anteriormente —racionalismo vs. empirismo, computadora digital vs. cerebro analógico, estructura/proceso vs. datos dinámicos, serialismo vs. paralelismo— son diferencias de opinión sobre la arquitectura cognitiva.

    A pesar de estas diferencias, y a pesar de la búsqueda del conexionismo por el procesamiento de la información biológicamente plausible, existe una similitud clave a nivel arquitectónico entre la ciencia cognitiva conectcionista y la clásica: en este nivel, ambas proponen arquitecturas que son funcionales, no físico. La arquitectura conexionista consiste en un conjunto de bloques de construcción: unidades y sus funciones de activación, conexiones modificables, reglas de aprendizaje. Pero estos bloques de construcción son relatos funcionales de las propiedades de procesamiento de información de las neuronas; otras propiedades similares al cerebro son ignoradas. Consideremos una respuesta (Churchland & Churchland, 1990) a la afirmación de que la mente es producto de los poderes causales del cerebro (Searle, 1990):

    Presumimos que Searle no está afirmando que una mente artificial exitosa debe tener todos los poderes causales del cerebro, como el poder de oler mal al pudrirse, para albergar virus lentos como el kuru, teñirse de amarillo con peroxidasa de rábano picante y así sucesivamente. Requerir una paridad perfecta sería como requerir que un dispositivo volador artificial ponga huevos. (Churchland & Churchland, 1990, p. 37)

    Es la naturaleza funcional de la arquitectura coneccionista lo que permite estudiarla casi siempre simulándola, ¡en una computadora digital!

    La naturaleza funcional de la arquitectura coneccionista plantea algunas complicaciones cuando se considera el nivel implementacional de análisis. Por un lado, muchos investigadores ven el conexionismo como proporcionar teorías a nivel implementacional de los fenómenos cognitivos. En este nivel, se encuentran investigadores explorando las relaciones entre los campos biológico-receptivos y patrones de conectividad y propiedades similares de redes artificiales (Ballard, 1986; Bankes & Margoliash, 1993; Bowers, 2009; Guzik, Eaton, & Mathis, 1999; Keith, Blohm, & Crawford, 2010; Moorhead, Haig, & Clement, 1989; Poggio, Torre, & Koch, 1985; Zipser & Andersen, 1988). También se encuentra con investigadores que encuentran mecanismos biológicos que mapean propiedades arquitectónicas como reglas de aprendizaje. Por ejemplo, existe un gran interés en relacionar las acciones de ciertos neurotransmisores con el aprendizaje de Hebb (Brown, 1990; Gerstner & Kistler, 2002; van Hemmen & Senn, 2002). De igual manera, se ha argumentado que las redes coneccionistas proporcionan un relato implementacional del aprendizaje asociativo (Shanks, 1995), posición que ignora sus posibles contribuciones en otros niveles de análisis (Dawson, 2008).

    Por otro lado, la naturaleza funcional de la arquitectura coneccionista ha dado como resultado que su estado biológico sea cuestionado o cuestionado. Existen muchas diferencias importantes entre las redes neuronales biológicas y artificiales (Crick & Asanuma, 1986; Douglas & Martin, 1991; McCloskey, 1991). Hay muy poca evidencia biológica en apoyo de importantes reglas de aprendizaje coneccionista como la retropropagación del error (Mazzoni, Andersen, & Jordan, 1991; O'Reilly, 1996; Shimansky, 2009). Douglas y Martin (1991, p. 292) descartaron las redes neuronales artificiales como simplemente “modelos de palo y pelota”. Por lo tanto, si la ciencia cognitiva coneccionista es una alternativa biológicamente plausible a la ciencia cognitiva clásica sigue siendo un tema abierto.

    Esa ciencia cognitiva conexionista se ha establecido como una reacción contra la ciencia cognitiva clásica no se puede negar. Sin embargo, como hemos visto en esta sección, no está del todo claro que el conexionismo represente una alternativa radical al enfoque clásico (Schneider, 1987), o que esté más estrechamente relacionado con la ciencia cognitiva clásica de lo que podría sugerir una breve mirada a alguna literatura (Dawson, 1998). Es cierto que la ciencia cognitiva conexionista ha aportado críticas importantes al enfoque clásico y, por lo tanto, ha sido un importante contribuyente a la teoría de la mente.

    Curiosamente, muchas de las críticas que han sido destacadas por la ciencia cognitiva conexionista —lentitud, fragilidad, inverosimilitud biológica, sobreénfasis del logicismo y desencarnamiento— se han hecho eco de una tercera escuela, la ciencia cognitiva encarnada. Además, las críticas relacionadas han sido aplicadas por científicos cognitivos encarnados contra la ciencia cognitiva conexionista. No en vano, entonces, la ciencia cognitiva encarnada ha generado un enfoque muy diferente para tratar estos temas que el que tiene la ciencia cognitiva conexionista.

    En el capítulo 5 pasamos a los elementos de este tercer “sabor” de la ciencia cognitiva. Como se ha señalado en esta última sección del Capítulo 4, parece haber amplio espacio para encontrar relaciones entre el conexionismo y el clasicismo de tal manera que la ciencia cognitiva paraguas pueda aplicarse acertadamente a ambos. Vemos que la ciencia cognitiva encarnada plantea algunos desafíos interesantes y radicales, y que su existencia cuestiona muchas de las características centrales compartidas por el conexionismo y el clasicismo.


    This page titled 4.19: ¿Qué es la Ciencia Cognitiva Coneccionista? is shared under a CC BY-NC-ND license and was authored, remixed, and/or curated by Michael R. W. Dawson (Athabasca University Press) .