Saltar al contenido principal
LibreTexts Español

9.6: Sintaxis y semántica en una gestalt de oración

  • Page ID
    123152
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    fig_lang_phrase_stru.png
    Figura\(9.10\): Diagrama sintáctico de una oración básica. S = oración; NP = frase sustantiva; Art = artículo; N = sustantivo; VP = frase verbal; V = verbo.

    Habiendo cubierto algunas de las interesantes propiedades del lenguaje a nivel de palabras individuales, ahora damos un paso más alto, al nivel de las oraciones. Este paso nos trae cara a cara con el espinoso tema de la sintaxis. El enfoque tradicional de la sintaxis supone que las personas ensamblan algo parecido a esas estructuras sintácticas arbóreas que aprendiste (o tal vez no) en la escuela (Figura 9.10). Pero dado que estas cosas necesitan ser enseñadas explícitamente, y no parecen ser la forma más natural de pensar para muchas personas, parece quizás poco probable que así sea como nuestros cerebros procesan realmente el lenguaje.

    Estas estructuras sintácticas también asumen una capacidad de unión de relleno de roles que en realidad es bastante difícil de lograr en las redes neuronales. Por ejemplo, la suposición es que de alguna manera “ata” al sustantivo boy en una ranura variable que se designa para contener el tema de la oración. Y una vez que pasas a la siguiente oración, esta encuadernación se sustituye por la siguiente. Esta constante unión y desatadura es más bien como la rotación de una rueda en un automóvil; tiende a destrozar cualquier cosa que de otra manera intentaría sujetarse a la rueda. Una razón importante por la que las personas tienen piernas en lugar de ruedas es que necesitamos proporcionar a esas piernas un suministro de sangre, nervios, etc, todo lo cual no podría sobrevivir a la rotación de una rueda. De manera similar, nuestras neuronas prosperan en el desarrollo de conexiones estables a largo plazo a través de sinapsis físicas, y no son buenas en este rápido proceso de unión y desunión. Nos enfocamos en estos temas con mayor profundidad en el Capítulo de Función Ejecutiva.

    Una forma alternativa de pensar sobre el procesamiento de oraciones que se basa más directamente en los principios de redes neuronales se captura en el modelo Sentence Gestalt de St. John & McClelland (1990). La idea clave es que tanto la sintaxis como la semántica se funden en una representación distribuida en evolución que captura el significado gestáltico general de una oración, sin requerir todas las vinculaciones sintácticas precisas asumidas en el enfoque tradicional. No vinculamos explícitamente al niño al sujeto, sino que codificamos el significado más amplio de la oración general, lo que implica que el niño es el sujeto (o más precisamente, el agente), porque está haciendo la persecución.

    Una ventaja de esta forma de pensar es que trata de manera más natural toda la ambigüedad que rodea el proceso de análisis sintáctico, donde la semántica específica de la colección de palabras puede alterar dramáticamente la interpretación sintáctica. Una demostración clásica de esta ambigüedad es la frase:

    • El tiempo vuela como una flecha.

    lo que puede no parecer muy ambiguo, hasta que considere alternativas, como:

    • La fruta vuela como un plátano.

    La palabra vuela puede ser un verbo o un sustantivo dependiendo del contexto semántico. Una reflexión más profunda revela varias interpretaciones más ambiguas de la primera oración, que es divertido tener que apoderarse de tu cerebro mientras vuelves a leer la oración. Otro ejemplo de Rohde (2002) es:

    • Las zapatillas fueron encontradas por el perro entrometido.
    • Las zapatillas fueron encontradas por el perro durmiente.

    solo un cambio sutil de palabra recasta todo el significado de la oración, de una en la que el perro es el agente a otra en la que juega un papel más periférico (el término sintáctico exacto para el cual es desconocido para los autores).

    Si no te molestas con el análisis sintáctico en primer lugar, y solo intentas capturar el significado de la oración, entonces nada de esta ambigüedad realmente importa. El significado de una oración es generalmente mucho menos ambiguo que el análisis sintáctico; obtener la sintaxis exactamente correcta requiere hacer muchas distinciones de grano fino con las que la gente puede que en realidad no se moleste. Pero el significado sí depende de la combinación exacta de palabras, así que hay mucho significado emergente en una oración; aquí hay otro ejemplo de Rohde (2002) donde las dos oraciones son sintácticamente idénticas pero tienen un significado muy diferente:

    • Finalmente pusimos al bebé a dormir.
    • Finalmente pusimos al perro a dormir.

    La noción de una representación gestáltica semánticamente orientada de una oración parece atractiva, pero hasta que un modelo implementado muestra realmente que tal cosa realmente funciona, todo es solo una bonita historia. El modelo de St. John & McClelland (1990) demuestra que una representación distribuida formada incrementalmente a medida que las palabras se procesan en una oración puede ser utilizada para responder a diversas preguntas de comprensión sobre esa oración. Sin embargo, lo hace usando un espacio muy pequeño de lenguaje, y no está claro qué tan bien se generaliza a nuevas palabras, o escala a un lenguaje más realista y complejo. Un modelo más sofisticado de Rohde (2002) que adopta una estrategia general similar proporciona algunas promesas de respuestas positivas a estos desafíos. La formación del modelo Rohde utiliza representaciones semánticas estructuradas en forma de proposiciones de relleno de ranura sobre los roles temáticos de diversos elementos de la oración. Estos incluyen los roles: agente, experienciador, meta, instrumento, paciente, fuente, tema, beneficiario, compañero, ubicación, autor, posesión, subtipo, propiedad, si, porque, mientras, y aunque. Este enfoque de vinculación temática es ampliamente utilizado en el campo del procesamiento del lenguaje natural para codificar la semántica, pero se aleja de la noción de una representación gestáltica no estructurada del significado semántico. El modelo de frase gestalt utiliza una forma mucho más simple de esta formación temática de rol, lo que parece menos polémico al respecto.

    El Modelo de Sentencia Gestalt

    El modelo de frase gestalt (SG) se entrena en un mundo de juguetes muy pequeño, que consta de los siguientes elementos:

    • Personas: conductor de autobús (hombre adulto), profesor, (hembra adulta), colegiala, lanzador (niño). adulto, niño, alguien también usó.
    • Acciones: comer, beber, revolver, extender, besar, dar, golpear, lanzar, conducir, levantarse.
    • Objetos: mancha (el perro), bistec, sopa, helado, galletas saladas, jalea, té helado, kool-aid, cuchara, cuchillo, dedo, rosa, murciélago (animal), bate (béisbol), pelota (esfera), pelota (fiesta), autobús, lanzador, pelaje.
    • Ubicaciones: cocina, sala, cobertizo, parque.

    Los roles semánticos utilizados para sondear la red durante el entrenamiento son: agente, acción, paciente, instrumento, coagente, co-paciente, ubicación, adverbio, receptor.

    La principal variable sintáctica es la presencia de construcción activa vs. pasiva, y cláusulas que especifican más eventos. También, como puede ver, varias de las palabras son ambiguas por lo que ese contexto debe ser utilizado para desambiguar.

    El modelo se entrena en oraciones generadas aleatoriamente de acuerdo con una gramática semántica y sintáctica que especifica qué palabras tienden a coexistir, etc. Luego se prueba en un conjunto de oraciones clave de prueba para sondear su comportamiento de varias maneras:

    • Semántica activa: La colegiala agitó el kool-aid con una cuchara. (kool-aid sólo puede ser el paciente, no el agente de esta frase)
    • Sintáctica activa: El conductor de autobús le dio la rosa al maestro. (el profesor podría ser paciente o agente — la sintaxis del orden de las palabras lo determina).
    • Semántica pasiva: La jalea la extendió el conductor del autobús con el cuchillo. (la gelatina no puede ser agente, por lo que debe ser paciente)
    • Sintáctica pasiva: El maestro fue besado por el conductor del autobús. vs. El conductor del autobús besó al maestro. (ya sea maestro o conductor de autobús podría ser agente, la sintaxis sola determina cuál es).
    • Ambigüedad de palabras: El conductor del autobús tiró la pelota al parque. , El maestro tiró la pelota en el salón. (la pelota es ambigua, pero semánticamente, conductor de autobús lanza pelotas en el parque, mientras que la maestra lanza bolas en la sala)
    • Instanciación conceptual: El maestro besó a alguien. (masculino). (la maestra siempre besa a un varón — ¿la modelo ha captado esto?)
    • Elaboración de roles: La colegiala comió galletas. (con dedo); La colegiala comió. (sopa) (estos son casos predominantes)
    • Actualización en línea: El niño comió sopa con delicadeza. vs. La jarra comió sopa con delicadeza. (colegiala suele comer sopa, por lo que el niño ambiguo se resuelve como colegiala en primer caso después de ver sopa, pero entrada específica de jarra en segundo caso impide esta actualización).
    • Conflicto: El adulto bebió té helado en la cocina. (salón) (siempre se toma té helado en el salón).
    fig_sg_net.png
    Figura\(9.11\): El modelo gestalt de la oración. Una sola palabra a la vez se presenta en la entrada, que se codifica en la capa gestalt. La gestalt tiene una capa de contexto que mantiene una copia de la gestalt del paso de tiempo anterior (una simple red recurrente o SRN) — este es el mecanismo de memoria simple utilizado para integrar información a través del tiempo. Esta gestalt se sondea consultando el rol semántico, con entrenamiento basado en la capacidad de producir la salida de relleno correcta.

    La estructura del modelo (Figura 9.11) tiene entradas de una sola palabra (usando representaciones localistas de una sola unidad de palabras) que se proyectan hacia arriba a través de una capa oculta de codificación a la capa gestalt, que es donde se desarrolla la representación distribuida del significado de la oración. La memoria de palabras anteriores e interpretaciones de significado de la oración se codifica a través de una capa de contexto, que es una copia del estado de activación de la capa gestalt de la entrada de palabras anterior. Esta capa de contexto se conoce como una red recurrente simple (SRN), y es ampliamente utilizada en modelos de redes neuronales de tareas temporalmente extendidas (lo discutimos más en el siguiente capítulo sobre la función ejecutiva). El entrenamiento de la red proviene del sondeo repetido de la red para los diversos roles semánticos enumerados anteriormente (por ejemplo, “agente vs paciente). Se activa una unidad de entrada de roles y luego se entrena la red para activar la respuesta adecuada en la capa de salida de relleno.

    631px-fig_sg_noun_clust.png
    Figura\(9.12\): Gráfica de conglomerados sobre la capa gestáltica de patrones asociados a los diferentes sustantivos, mostrando que estas representaciones distribuidas capturan las similitudes semánticas de las palabras (tanto como en el modelo semántico similar al LSA explorado en la sección anterior).
    642px-fig_sg_verb_clust.png
    Figura\(9.13\): Gráfica de conglomerados sobre la capa gestáltica de patrones asociados a los diferentes verbos, mostrando que estas representaciones distribuidas capturan las similitudes semánticas de las palabras.
    630px-fig_sg_sent_clust.png
    Figura\(9.14\): Gráfica de conglomerados sobre la capa gestáltica de patrones asociados a un conjunto de oraciones de prueba diseñadas para probar las relaciones de similitud apropiadas. sc = colegiala; st = agitada; ko = kool-aid; te = profesor; bu= conductor de autobús; pi = jarra; dr = bebió; ic = té helado; at = comió; so = sopa; st = bistec;

    La Figura 9.12 muestra una gráfica de conglomerados de las representaciones de capa gestáltica de los diferentes sustantivos, mientras que la Figura 9.13 muestra los diferentes verbos. Estos indican que la red sí desarrolla una estructura de similitud semántica sensible para estas palabras. Sondeando más, la Figura 9.14 muestra la gráfica de conglomerados para un rango de oraciones relacionadas, lo que indica una organización semántica sensata centrada en los verbos (las oraciones que comparten el mismo verbo están todas agrupadas juntas).

    Exploración

    • Abrir Sentence Gestalt para explorar el modelo de frase gestalt.

    This page titled 9.6: Sintaxis y semántica en una gestalt de oración is shared under a CC BY-SA license and was authored, remixed, and/or curated by O'Reilly, Munakata, Hazy & Frank.