Saltar al contenido principal
LibreTexts Español

4.11: Clasificación de acordes por un perceptrón multicapa

  • Page ID
    143885
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Las redes neuronales artificiales proporcionan un medio en el que explorar el empirismo, ya que adquieren conocimiento a través de la experiencia. Este conocimiento se utiliza para mediar un mapeo input-output y generalmente toma la forma de una representación distribuida. Las representaciones distribuidas proporcionan algunas de las ventajas supuestas conexionistas sobre la ciencia cognitiva clásica: resistencia al daño, degradación agraciada, etc. Desafortunadamente, las representaciones distribuidas también son difíciles de interpretar, lo que les dificulta proporcionar nuevas teorías para la ciencia cognitiva.

    Sin embargo, interpretar las estructuras internas de redes multicapa, aunque difícil, no es imposible. Para ilustrar esto, consideremos un perceptrón multicapa entrenado para clasificar diferentes tipos de acordes musicales. El propósito de esta sección es discutir el papel de las unidades ocultas, demostrar que las redes que utilizan unidades ocultas también pueden ser interpretadas, e introducir una noción decididamente coneccionista llamada código grueso.

    Los acordes son combinaciones de notas que están relacionadas con escalas musicales, donde una escala es una secuencia de notas que está sujeta a ciertas restricciones. Una escala cromática es aquella en la que cada nota tocada es un semitono más alta que la nota anterior. Si uno tocara las primeras trece teclas de piano numeradas de Figura\(\PageIndex{1}\) en orden, entonces el resultado sería una escala cromática que comienza en una C baja y termina en otra C una octava más alta.

    numerado keyboard.JPG
    Figura\(\PageIndex{1}\). Un pequeño teclado de piano con teclas numeradas. La clave 1 es C.

    Una escala mayor resulta al restringir una escala cromática de tal manera que algunas de sus notas no se tocan. Por ejemplo, la escala C mayor se produce si solo las teclas blancas numeradas del 1 al 13 en la Figura\(\PageIndex{1}\) se reproducen en secuencia (es decir, si no se reproducen las teclas negras numeradas 2, 4, 7, 9 y 11).

    C-Major.JPG
    Figura\(\PageIndex{2}\). La escala de Do mayor y algunos de sus acordes de notas añadidas.

    La notación musical para la escala C mayor se proporciona en la secuencia de notas ilustrada en la primera parte de la Figura\(\PageIndex{2}\). Los griegos definieron una variedad de modos para cada escala; se utilizaron diferentes modos para provocar diferentes experiencias estéticas (Hanslick, 1957). La escala C mayor en el primer pentagrama de la Figura\(\PageIndex{2}\) se encuentra en el modo Jónico porque comienza en la nota C, que es la nota raíz, designada I, para la clave C mayor.

    Se pueden definir varios acordes musicales en el contexto de Do mayor en dos sentidos diferentes. Primero, la firma clave de cada acorde es la misma que C mayor (es decir, sin punzantes ni planos). Segundo, cada uno de estos acordes se construye sobre la raíz de la escala C mayor (la nota C). Por ejemplo, un acorde básico es la tríada mayor. En la clave de Do mayor, la raíz de este acorde, la nota más baja del acorde, es C (por ejemplo, la tecla de piano #1 en la Figura\(\PageIndex{1}\)). La tríada mayor para esta clave se completa agregando otras dos notas a esta raíz. La segunda nota en la tríada es 4 semitonos superior a C, que es la nota E (la tercera nota en la escala mayor en la Figura\(\PageIndex{2}\)). La tercera nota en la tríada es 3 semitonos superior a la segunda nota, que en este caso es G (la quinta nota en la escala mayor en la Figura\(\PageIndex{2}\)). Así, las notas C-E-G definen la tríada mayor para la clave de C; esta es la primera cuerda ilustrada en la Figura\(\PageIndex{2}\).

    Una cuarta nota puede agregarse a cualquier tríada mayor para crear un tetrachordo de “nota agregada” (Baker, 1982). El tipo de acorde de nota añadida que se crea depende de la relación entre la nota agregada y la tercera nota de la tríada mayor. Si la nota agregada es 4 semitonos más alta que la tercera nota, el resultado es un acorde mayor del , como el Cmaj 7 ilustrado en la Figura\(\PageIndex{2}\). Si la nota agregada es 3 semitonos más alta que la tercera nota, el resultado es un acorde dominante como el acorde C 7 presentado en la Figura\(\PageIndex{2}\). Si la nota agregada es 2 semitonos más alta que la tercera nota, entonces el resultado es un acorde , como el acorde C 6 ilustrado en la Figura\(\PageIndex{2}\).

    En los párrafos anteriores se describía la tríada mayor y algunos acordes de nota añadidos para la clave de Do mayor. En la música occidental, Do mayor es una de las doce claves principales posibles. El conjunto de todas las claves principales posibles se proporciona en la Figura\(\PageIndex{3}\), que las organiza en una importante estructura cíclica, llamada el círculo de quintas.

    El círculo de Fifths.JPG

    Figura\(\PageIndex{3}\). El círculo de quintas.

    El círculo de quintas incluye las 12 notas en una escala cromática, pero las arregla de manera que las notas adyacentes en el círculo sean un intervalo musical de una quinta perfecta (es decir, 7 semitonos) separadas. El círculo de quintas es un tema estándar para los estudiantes de música, y es fundamental para muchos conceptos en teoría musical. Se proporciona aquí, sin embargo, para ser contrastado posteriormente con “círculos extraños” que se revelan en la estructura interna de una red entrenada para identificar acordes musicales.

    Cualquiera de las notas en el círculo de quintas se puede utilizar para definir una clave musical y por lo tanto puede servir como nota raíz de una escala mayor. De igual manera, cualquiera de estas notas puede ser la raíz de una tríada mayor creada usando el patrón de raíz + 4 semitonos + 3 semitonos que se describió anteriormente para la clave de Do mayor (Baker, 1982). Además, las reglas descritas anteriormente también se pueden aplicar para producir acordes de nota agregados para cualquiera de las 12 firmas clave principales. Estas posibles tríadas mayores y acordes de notas agregadas se utilizaron como entradas para entrenar una red para clasificar correctamente diferentes tipos de acordes, ignorando la clave musical.

    Se creó un conjunto de entrenamiento de 48 acordes construyendo la tríada mayor, así como el acorde mayor , dominante y para cada una de las 12 posibles firmas clave mayores (es decir, usando cada una de las notas de la Figura\(\PageIndex{3}\) como raíz). Cuando se le presentó un acorde, la red fue entrenada para clasificarla en uno de los cuatro tipos de interés: tríada mayor, mayor, dominante, o sexta. Para ello, la red contaba con 4 unidades de salida, una por cada tipo de acorde. Para cualquier entrada, la red aprendió a encender la unidad de salida correcta y a apagar las otras tres unidades de salida.

    Los acordes de entrada fueron codificados con una representación de clase de tono (Laden & Keefe, 1989; Yaremchuk & Dawson, 2008). En una representación de clase de tono, solo se emplean 12 unidades de entrada, una para cada una de las 12 notas diferentes que pueden aparecer en una escala. Diferentes versiones de la misma nota (es decir, la misma nota reproducida en diferentes octavas) se mapean en la misma representación de entrada. Por ejemplo, las notas 1, 13, 25 y 37 de la Figura corresponden\(\PageIndex{1}\) todas a diferentes tonos pero pertenecen a la misma clase de tono; todas son notas C, tocadas en diferentes octavas del teclado. En una representación de clase de tono, la reproducción de cualquiera de estas notas de entrada se codificaría activando una sola unidad de entrada, la unidad utilizada para representar la clase de tono de C.

    Se utilizó una representación de acordes de clase de tono por dos razones. Primero, requiere un número muy pequeño de unidades de entrada para representar todos los estímulos posibles. En segundo lugar, se trata de una representación bastante abstracta que dificulta la tarea de clasificación de acordes, lo que a su vez requiere el uso de unidades ocultas en una red ante esta tarea.

    Por qué la clasificación de acordes puede ser difícil para una red cuando se emplea la codificación de clase de tono se hace evidente al pensar en cómo podríamos abordar el problema si nos enfrentamos a él nosotros mismos. Clasificar los acordes mayores es simple: son los únicos estímulos de entrada que activan tres unidades de entrada en lugar de cuatro. Sin embargo, clasificar los otros tipos de acordes es muy desafiante. Primero hay que determinar en qué clave se encuentra el estímulo, identificar qué tres notas definen su componente de acorde mayor y luego determinar la relación entre la tercera nota del componente de acorde mayor y la cuarta nota “agregada”. Esto es particularmente difícil debido a la representación de la clase de tono, que arroja información de orden de notas que podría ser útil para identificar el tipo de acorde.

    Se decidió que la red que se entrenaría en la tarea de clasificación de acordes sería una red de unidades de valor (Dawson & Schopflocher, 1992b). Las unidades ocultas y las unidades de salida en una red de unidades de valor utilizan una función de activación gaussiana, lo que significa que se comportan como si tallaran dos planos paralelos a través de un espacio patrón. Dichas redes pueden ser entrenadas con una variación de la regla delta generalizada. Este tipo de red se eligió para este problema por dos razones. Primero, las redes de unidades de valor tienen propiedades emergentes que las hacen más fáciles de interpretar que otros tipos de redes entrenadas en problemas similares (Dawson, 2004; Dawson et al., 1994). Una razón para esto es porque las unidades de valor se comportan como si estuvieran “sintonizadas” para responder a señales de entrada muy particulares. En segundo lugar, investigaciones previas sobre diferentes versiones de problemas de clasificación de acordes habían producido redes que revelaban una estructura interna elegante (Yaremchuk & Dawson, 2005, 2008).

    La red más simple de unidades de valor que podría aprender a resolver el problema de clasificación de acordes requirió tres unidades ocultas. Al inicio del entrenamiento, el valor de m para cada unidad se inicializó como 0. (El valor de m para una unidad de valor es análogo a un umbral en otros tipos de unidades [Dawson, Kremer, & Gannon, 1994; Dawson & Schopflocher, 1992b]; si la entrada neta de una unidad de valor es igual a m entonces la unidad genera una actividad máxima de 1.00.) Todos los pesos de conexión se establecieron en valores seleccionados aleatoriamente del rango entre —0.1 y 0.1. La red se entrenó con una tasa de aprendizaje de 0.01 hasta que produjo un “hit” para cada unidad de salida en cada patrón. Debido a la naturaleza continua de la función de activación, se definió un hit de la siguiente manera: un valor de 0.9 o superior cuando la salida deseada era 1, y un valor de 0.1 o menor cuando la salida deseada era 0. La red que se interpreta a continuación aprendió la tarea de clasificación de acordes después de 299 presentaciones del conjunto de entrenamiento.

    ¿Cuál es el papel de una capa de unidades ocultas? En un perceptrón, que no tiene unidades ocultas, los patrones de entrada solo se pueden representar en un espacio de patrones. Recordemos de la discusión de la Figura 4-2 que un espacio de patrón representa cada patrón como un punto en el espacio. La dimensionalidad de este espacio es igual al número de unidades de entrada. Las coordenadas del punto de cada patrón en este espacio vienen dadas por las actividades de las unidades de entrada. Para algunas redes, el posicionamiento de los puntos en el espacio de patrones impide que algunos patrones se clasifiquen correctamente, ya que las unidades de salida son incapaces de tallar adecuadamente el espacio de patrones en las regiones de decisión apropiadas.

    En un perceptrón multicapa, las unidades ocultas sirven para resolver este problema. Lo hacen transformando el espacio de patrones en un espacio unitario oculto (Dawson, 2004). La dimensionalidad de un espacio unitario oculto es igual al número de unidades ocultas en la capa. Los patrones se representan nuevamente como puntos en este espacio; sin embargo, en este espacio sus coordenadas están determinadas por las actividades que producen en cada unidad oculta. El espacio de unidad oculto es una transformación del espacio de patrón que implica detectar entidades de orden superior. Esto generalmente produce un cambio en la dimensionalidad (el espacio unitario oculto a menudo tiene un número de dimensiones diferente al del espacio de patrón) y un reposicionamiento de los puntos en el nuevo espacio. Como resultado, las unidades de salida son capaces de tallar el espacio de unidad oculto en un conjunto de regiones de decisión que permiten clasificar correctamente todos los patrones, reposicionados en el espacio de unidad oculto.

    Este relato del papel de las unidades ocultas indica que la interpretación de la estructura interna de un perceptrón multicapa implica responder a dos preguntas diferentes. Primero, ¿qué tipo de entidades están detectando las unidades ocultas para mapear patrones desde el espacio de patrones hacia el espacio de unidades ocultas? Segundo, ¿cómo procesan las unidades de salida el espacio oculto de la unidad para resolver el problema de interés? La red de clasificación de acordes se puede utilizar para ilustrar cómo se pueden abordar ambas preguntas.

    Primero, al mapear los patrones de entrada en el espacio oculto de la unidad, las unidades ocultas deben estar detectando algún tipo de regularidades musicales. Una pista sobre cuáles pueden ser estas regularidades se proporciona simplemente examinando los pesos de conexión que alimentan en ellas, proporcionados en la Tabla\(\PageIndex{1}\).

    Nota de entrada Oculto 1 Hidden 1 Clase Oculto 2 Hidden 2 Clase Oculto 3 Hidden 3 Clase
    B 0.53 Círculo de Tercios Mayores 1 0.12 Círculo de Tercios Mayores 1 0.75 Círculo de Segundos Mayores 1
    D# 0.53 0.12 0.75
    G 0.53 0.12 0.75
    A -0.53 Círculo de Tercios Mayores 2 -0.12 Círculo de Tercios Mayores 2 0.75
    C# -0.53 -0.12 0.75
    F -0.53 -0.12 0.75
    C 0.12 Círculo de Tercios Mayores 3 -0.53 Círculo de Tercios Mayores 3 -0.77 Círculo de Segundos Mayores 2
    G# 0.12 -0.53 -0.77
    E 0.12 -0.53 -0.77
    F# -0.12 Círculo de Tercios Mayores 4 0.53 Círculo de Tercios Mayores 4 -0.77
    A# -0.12 0.53 -0.77
    D -0.12 0.53 -0.77

    Mesa\(\PageIndex{3}\). Pesos de conexión de las 12 unidades de entrada a cada una de las tres unidades ocultas. Tenga en cuenta que las dos primeras unidades ocultas adoptan pesos que asignan notas de entrada a los cuatro círculos de los tercios mayores. La tercera unidad oculta adopta pesos que asignan notas de entrada a los dos círculos de segundos mayores.

    En la representación de clase de tono utilizada para esta red, cada unidad de entrada representa una nota musical distinta. En lo que respecta a las unidades ocultas, el “nombre” de cada nota es proporcionado por el peso de conexión entre la unidad de entrada y la unidad oculta. Curiosamente, Table\(\PageIndex{1}\) revela que las tres unidades ocultas toman notas de entrada que tomaríamos como diferentes (porque tienen nombres diferentes, como en el círculo de quintas en la Figura\(\PageIndex{3}\)) y las trataríamos como idénticas. Es decir, las unidades ocultas asignan el mismo “nombre”, o peso de conexión, a las notas de entrada a las que le daríamos nombres diferentes.

    Además, la asignación del mismo “nombre” a diferentes notas por las unidades ocultas no se realiza aleatoriamente. Las notas se asignan según círculos extraños, es decir, círculos de tercios mayores y círculos de segundos mayores. Describamos brevemente estos círculos, y luego volvamos a un análisis de Table\(\PageIndex{1}\).

    El círculo de quintas (Figura\(\PageIndex{3}\)) no es la única manera en que las notas pueden disponerse geométricamente. Se pueden producir otros arreglos circulares explotando otros intervalos musicales. Se trata de círculos extraños en el sentido de que muy pocas veces se les enseñaría a estudiantes de música como parte de un plan de estudios de teoría musical. Sin embargo, estos extraños círculos son dispositivos formales que pueden definirse tan fácilmente como puede ser el círculo de quintas.

    Por ejemplo, si uno comienza con la nota C y se mueve hacia arriba un segundo mayor (2 semitonos) entonces uno llega a la nota D. De aquí, al subir otro segundo mayor llega a la nota E. Esto puede continuar hasta que uno da vueltas de vuelta a C pero una octava más alta que la original, que es un segundo mayor mayor mayor que A#. Este círculo de segundos mayores captura la mitad de las notas en la escala cromática, como se muestra en la parte superior de la Figura\(\PageIndex{4}\). También se puede construir un círculo complementario de segundos mayores (círculo inferior de la Figura\(\PageIndex{4}\)); este círculo contiene todas las notas restantes que no forman parte del primer círculo.

    Los dos círculos de los principales seconds.JPG

    Figura\(\PageIndex{4}\). Los dos círculos de segundos mayores.

    Un conjunto alternativo de círculos musicales se puede definir explotando un intervalo musical diferente. En cada círculo representado en la Figura\(\PageIndex{5}\), las notas adyacentes están separadas por un tercio mayor (4 semitonos). Como se muestra en la Figura\(\PageIndex{5}\) cuatro de tales círculos son posibles.

    Los cuatro círculos de thirds.JPG principales
    Figura\(\PageIndex{5}\). Los cuatro círculos de las terceras mayores.

    ¿Qué tienen que ver estos extraños círculos con la estructura interna de la red entrenada para clasificar los diferentes tipos de acordes? Un examen minucioso de Table\(\PageIndex{1}\) indica que estos extraños círculos se reflejan en los pesos de conexión que alimentan a las unidades ocultas de la red. Para las Unidades Ocultas 1 y 2, si las notas pertenecen al mismo círculo de tercios mayores (Figura\(\PageIndex{5}\)), entonces se les asigna el mismo peso de conexión. Para la Unidad Oculta 3, si las notas pertenecen al mismo círculo de segundos mayores (Figura\(\PageIndex{4}\)), entonces se les asigna el mismo peso de conexión. En definitiva, cada una de las unidades ocultas reemplaza los 12 posibles nombres de notas diferentes por un conjunto mucho menor, lo que equipara las notas que pertenecen al mismo círculo de intervalos y diferencia las notas que pertenecen a diferentes círculos.

    Una mayor inspección de Table\(\PageIndex{1}\) revela regularidades adicionales de interés. Cualitativamente, ambas Unidades Ocultas 1 y 2 asignan notas de entrada a clases de equivalencia basadas en círculos de tercios mayores. Lo hacen usando la misma nota “nombres”: 0.53, 0.12, —0.12 y —0.53. Sin embargo, las dos unidades ocultas tienen una diferencia importante: asignan los mismos nombres a diferentes conjuntos de notas de entrada. Es decir, a las notas a las que se les asigna un peso de conexión por Unidad Oculta 1 se les asigna un peso de conexión diferente por Unidad Oculta 2.

    La razón por la que la diferencia en la asignación de peso entre las dos unidades ocultas es que el comportamiento de cada unidad oculta no se rige por una sola señal entrante, sino que se rige por una combinación de tres o cuatro señales de entrada provenientes de todas las unidades. Los pesos de conexión utilizados por las unidades ocultas imponen restricciones significativas sobre cómo se combinan estas señales.

    Consideremos el papel de los pesos de conexión particulares utilizados por las unidades ocultas. Dada la naturaleza binaria de la codificación de entrada, la entrada neta de cualquier unidad oculta es simplemente la suma de los pesos asociados con cada una de las unidades de entrada activadas. Para una unidad de valor, si la entrada neta es igual al valor de m de la unidad, entonces la salida genera un valor máximo de 1.00. A medida que la entrada neta se aleja de m en una dirección positiva o negativa, la actividad disminuye rápidamente. Al finalizar el entrenamiento, los valores de m para las tres unidades ocultas fueron 0.00, 0.00 y —0.03 para las Unidades Ocultas 1, 2 y 3, respectivamente. Por lo tanto, para cada unidad oculta, si las señales entrantes son esencialmente cero, es decir, si todas las señales entrantes se cancelan entre sí, entonces se producirá una alta actividad.

    ¿Por qué entonces las Unidades Ocultas 1 y 2 usan el mismo conjunto de cuatro pesos de conexión pero asignan estos pesos a diferentes conjuntos de notas de entrada? La respuesta es que estas unidades ocultas capturan relaciones de acordes similares pero lo hacen usando notas de diferentes círculos extraños.

    Esto se muestra examinando las respuestas de cada unidad oculta a cada acorde de entrada después del entrenamiento. Tabla\(\PageIndex{2}\) resume estas respuestas, y muestra que cada unidad oculta generó respuestas idénticas a diferentes subconjuntos de acordes de entrada.

    Acorde de entrada Activación
    Acorde Raíz de Acorde Hid1 Hid2 Hid3

    Mayor

    C, D, A, F#, G#, A# 0.16 0.06 0.16
    C#, D#, F, G, A, B 0.06 0.16 0.16

    Mayor 7

    C, D, A, F#, G#, A# 0.01 0.12 1.00
    C#, D#, F, G, A, B 0.12 0.01 1.00

    Dom 7

    C, D, A, F#, G#, A# 0.27 0.59 0.00
    C#, D#, F, G, A, B 0.59 0.27 0.00

    6 th

    C, D, A, F#, G#, A# 0.84 0.03 1.00
    C#, D#, F, G, A, B 0.03 0.84 1.00

    Mesa\(\PageIndex{2}\). Las activaciones producidas en cada unidad oculta por diferentes subconjuntos de acordes de entrada.

    De Table\(\PageIndex{2}\), se puede ver que la actividad de la Unidad Oculta 3 es más simple de describir: cuando se presenta con un acorde dominante, produce una activación de 0 y una activación débil a una tríada mayor. Cuando se presenta con un acorde mayor de 7 o 6 º, produce la máxima actividad. Este patrón de activación se explica fácilmente al considerar los pesos que alimentan a la Unidad Oculta 3 (Tabla\(\PageIndex{1}\)). Cualquier acorde mayor o se crea a partir de dos notas de un círculo de segundos mayores y dos notas del otro círculo. Las sumas de pares de pesos de diferentes círculos se cancelan entre sí, produciendo una entrada neta cercana a cero y provocando la máxima activación.

    En contraste, los acordes dominantes del utilizan tres notas de un círculo de segundos mayores y sólo una del otro círculo. En consecuencia, las señales no se cancelan por completo, dadas las ponderaciones en la Tabla\(\PageIndex{1}\). En cambio, se produce una entrada neta fuerte distinta de cero, y el resultado es actividad cero.

    Por último, cualquier tríada mayor involucra sólo tres notas: dos de un círculo de segundos mayores y una de la otra. Debido al número impar de señales de entrada, la cancelación a cero no es posible. Sin embargo, los pesos han sido seleccionados para que el aporte neto producido por una tríada mayor esté lo suficientemente cerca de m como para producir actividad débil.

    Los patrones de activación para las Unidades Ocultas 1 y 2 son más complejos. Es posible explicarlas todas en términos de equilibrar (o no equilibrar) señales asociadas a diferentes círculos de terceras partes mayores. Sin embargo, resulta más esclarecedor considerar estas dos unidades a un nivel más general, centrándose en la relación entre sus activaciones.

    En términos generales, las Unidades Ocultas 1 y 2 generan activaciones de diferentes intensidades a diferentes clases de acordes. En general, producen la actividad más alta a los acordes y la actividad más baja a los acordes mayores del 7º. Es importante destacar que no generan la misma actividad a todos los acordes del mismo tipo. Por ejemplo, para los 12 posibles acordes, la Unidad Oculta 1 genera actividad de 0.84 a 6 de ellos pero actividad de sólo 0.03 a los otros 6 acordes. Una inspección de Table\(\PageIndex{2}\) indica que para cada tipo de acorde, ambas Unidades Ocultas 1 y 2 generan un nivel de actividad con la mitad de ellas, pero producen otro nivel de actividad con la otra mitad.

    Las variadas respuestas de estas dos unidades ocultas a diferentes acordes del mismo tipo están relacionadas con el círculo de segundos mayores (Figura\(\PageIndex{4}\)). Por ejemplo, la Unidad Oculta 1 genera una respuesta de 0.84 a acordes cuya nota raíz pertenece al círculo superior de la Figura\(\PageIndex{4}\), y una respuesta de 0.03 a acordes cuya nota raíz pertenece al círculo inferior de la Figura\(\PageIndex{4}\). En efecto, para todos los tipos de acordes, ambas unidades ocultas generan una respuesta si la nota raíz pertenece a un círculo de segundos mayores y una respuesta diferente si la nota raíz pertenece al otro círculo.

    Además, las respuestas de las Unidades Ocultas 1 y 2 se complementan entre sí: para cualquier tipo de acorde, aquellos acordes que producen baja actividad en la Unidad Oculta 1 producen mayor actividad en la Unidad Oculta 2. Además, aquellos acordes que producen baja actividad en la Unidad Oculta 2 producen mayor actividad en la Unidad Oculta 1. Esta complementación vuelve a estar relacionada con los círculos de los segundos mayores: la Unidad Oculta 1 genera mayores respuestas a acordes cuya raíz pertenece a un círculo, mientras que la Unidad Oculta 2 genera respuestas mayores a acordes cuyas raíces pertenecen al otro. Qué círculo es “preferido” por una unidad oculta depende del tipo de acorde.

    Claramente cada una de las tres unidades ocultas es sensible a las propiedades musicales. Sin embargo, no está claro cómo estas propiedades soportan la capacidad de la red para clasificar acordes. Por ejemplo, ninguna de las unidades ocultas por sí mismas selecciona un conjunto de propiedades que definen de manera única un tipo particular de acorde. En cambio, las unidades ocultas generan alguna actividad a diferentes tipos de acordes, lo que sugiere la existencia de un código grueso.

    Para ver cómo las actividades de las unidades ocultas sirven como una representación distribuida que media en la clasificación de acordes, debemos examinar el espacio de unidad oculta. El espacio unitario oculto traza cada patrón de entrada como un punto en un espacio cuya dimensionalidad está determinada por el número de unidades ocultas. Las coordenadas del punto en el espacio unitario oculto son las actividades producidas por un patrón de entrada en cada unidad oculta. El espacio tridimensional oculto de la unidad para la red de clasificación de acordes se ilustra en la Figura\(\PageIndex{6}\).

    La unidad oculta space.JPG
    Figura\(\PageIndex{6}\). El espacio de unidad oculto para la red de clasificación de acordes. H1, H2 y H3 proporcionan la actividad de las unidades ocultas 1, 2 y 3 respectivamente.

    Debido a que las unidades ocultas generan respuestas idénticas a muchos de los acordes, en lugar de 48 puntos visibles diferentes en esta gráfica (uno por cada patrón de entrada), solo hay 8. Cada punto representa 6 acordes diferentes que caen exactamente en la misma ubicación en el espacio oculto de la unidad.

    El espacio de unidad oculto revela que cada tipo de acorde está representado por dos puntos diferentes. Que estos puntos capturen la misma clase se representa en la Figura\(\PageIndex{6}\) uniendo los puntos de un tipo de acorde con una línea discontinua. Dos puntos están involucrados en la definición de una clase de acordes en este espacio porque, como ya se discutió, cada unidad oculta es sensible a la organización de las notas según los dos círculos de segundos mayores. Para cada tipo de acorde, los acordes cuya raíz pertenece a uno de estos círculos se mapean a un punto, y los acordes cuya raíz pertenece al otro se mapean al otro punto. Curiosamente, no existe una relación sistemática en la gráfica que se mapea en los dos círculos. Por ejemplo, no es el caso de que los cuatro puntos hacia la parte posterior del\(\PageIndex{6}\) cubo de la Figura se mapeen todos en el mismo círculo de segundos mayores.

    Un ejemplo de salida unit.JPG

    Figura\(\PageIndex{7}\). Un ejemplo de partición de unidad de salida del espacio de unidad oculto para la red de clasificación de acordes.

    La figura\(\PageIndex{7}\) ilustra cómo las unidades de salida pueden dividir los puntos en el espacio de unidades ocultas para clasificar acordes. Cada unidad de salida en esta red es una unidad de valor, que talla dos hiperplanos paralelos a través de un espacio de patrón. Para resolver el problema de clasificación de acordes, los pesos de conexión y el sesgo de cada unidad de salida deben tomar valores que permitan a estos dos planos aislar los dos puntos asociados a un tipo de cuerda de todos los demás puntos en el espacio. La figura\(\PageIndex{7}\) muestra cómo se lograría esto por la unidad de salida que señala que se ha detectado un acorde.


    This page titled 4.11: Clasificación de acordes por un perceptrón multicapa is shared under a CC BY-NC-ND license and was authored, remixed, and/or curated by Michael R. W. Dawson (Athabasca University Press) .