7.4: Cerebelo y aprendizaje impulsado por errores
- Page ID
- 123123
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Ahora que entendemos cómo los ganglios basales pueden seleccionar una acción a realizar en base al aprendizaje de refuerzo, recurrimos al cerebelo, que toma el relevo una vez iniciada la acción, y utiliza el aprendizaje impulsado por errores para dar forma al desempeño de la acción de manera que sea precisa y bien coordinada. Como se muestra en la Figura 7.10, el cerebelo solo recibe de áreas corticales directamente involucradas en la producción motora, incluyendo la corteza parietal y las áreas motoras de la corteza frontal. A diferencia de los ganglios basales, no recibe de la corteza prefrontal ni de la corteza temporal, lo que tiene sentido de acuerdo a sus respectivas funciones. La corteza prefrontal y la corteza temporal son realmente importantes para la planificación de alto nivel y la selección de acciones, pero no para la ejecución de acciones. Sin embargo, sí sabemos por experimentos de neuroimagen que el cerebelo se dedica a muchas tareas cognitivas, esto debe reflejar su amplia conectividad con la corteza parietal, que también se activa en muchas tareas cognitivas. Una idea es que el cerebelo puede ayudar a dar forma al aprendizaje y procesamiento en la corteza parietal en virtud de sus poderosos mecanismos de aprendizaje impulsados por errores; esto puede ayudar a explicar cómo la corteza parietal puede aprender a hacer todas las cosas complejas que hace. Sin embargo, en este punto tanto la corteza parietal como el cerebelo se entienden mucho mejor desde un punto de vista motor que uno cognitivo.
El cerebelo tiene una anatomía muy bien definida (Figura 7.11, Figura 7.12), con el mismo circuito básico replicado en todo momento. Así, al igual que los ganglios basales, parece estar realizando la misma función básica replicada en una amplia gama de diferentes dominios de contenido (por ejemplo, para diferentes efectores motores, y para diferentes áreas de la corteza parietal y frontal). El circuito básico involucra señales de entrada provenientes de diversas fuentes, las cuales son transportadas al cerebelo a través de axones de fibra musgosa. ¡Estas terminan en células granulares, de las cuales hay aproximadamente 40 mil millones en el cerebro humano! Cada celda granulada recibe solo 4-5 entradas de fibra musgosa, y hay aproximadamente 200 millones de entradas de fibra musgosa, con cada fibra musgosa sinapsando en aproximadamente 500 células granulares. Por lo tanto, hay una gran expansión de la codificación de información en las células granulares en relación con la entrada; revisaremos este hecho importante en un momento. Para completar el circuito, las células granulares envían axones de fibra paralelos, esa sinapsis hacia los árboles dendríticos muy densos de las células de Purkinje, que pueden recibir hasta 200,000 entradas de las células granulares. Hay aproximadamente 15 millones de células de Purkinje en el cerebro humano, y estas células producen la señal de salida del cerebelo. Así, existe una operación de convergencia masiva desde las células granulares hacia las células de Purkinje. Las células de Purkinje son tónicamente activas, y las células granulares son excitadoras sobre ellas, lo que hace que sea un poco desconcertante averiguar cómo las células granulares transmiten una señal útil a las células de Purkinje. Los otros tipos de células en el cerebelo (estrellado, cesta y golgi) son interneuronas inhibitorias que proporcionan control inhibitorio sobre el disparo tanto de células granulares como de células de Purkinje. Es posible que las células granulares trabajen en concierto con estas células inhibidoras para alterar el equilibrio de excitación e inhibición en los Purkinje, pero esto sigue siendo algo poco claro.
La pieza final del rompecabezas cerebeloso es la entrada de fibra trepadora del núcleo olivar inferior; existe exactamente una fibra trepadora por célula de Purkinje, y tiene un efecto muy poderoso sobre la neurona, produciendo una serie de espigas complejas. Se piensa que las entradas de fibra trepadora transmiten una señal de entrenamiento o error a los Purkinje, que luego impulsa la plasticidad sináptica en sus entradas de células granulares asociadas. Una idea destacada es que esta plasticidad sináptica tiende a producir LTD (disminución de peso) para entradas sinápticas donde las células granulares están activas, lo que luego hace que estas neuronas sean menos propensas a disparar la célula de Purkinje en el futuro. Esto tendría sentido dado que las células de Purkinje son inhibidoras de las neuronas de núcleos cerebelosos profundos, por lo que para producir una salida de ellas, es necesario apagar la célula de Purkinje.
Al juntar todas estas piezas, David Marr y James Albus argumentaron que el cerebelo es un sistema para el aprendizaje impulsado por errores, con la señal de error proveniente de las fibras trepadoras. Es claro que cuenta con la maquinaria para asociar las entradas de estímulo con los comandos de salida del motor, bajo el mando de las entradas de fibra trepadora. Un principio importante de la función cerebelosa es la proyección de entradas en un espacio de muy alta dimensión sobre las células granulares; computacionalmente esto logra la forma de separación del aprendizaje, donde cada combinación de entradas activa un patrón único de neuronas de células granulares. Este patrón único puede entonces asociarse con una señal de salida diferente del cerebelo, produciendo algo que se aproxime a una tabla de búsqueda de valores de entrada/salida Figura 7.13. Una tabla de búsqueda proporciona una solución muy robusta para aprender incluso funciones arbitrarias muy complejas, siempre será capaz de codificar cualquier tipo de función. El inconveniente es que no generaliza muy bien a nuevos patrones de entrada. Sin embargo, puede ser mejor en general en el control del motor para evitar una generalización inadecuada, en lugar de obtener un poco más de eficiencia de alguna forma de generalización. Esta expansión de alta dimensión también es utilizada con éxito por la máquina vectorial de soporte (SVM), uno de los algoritmos de aprendizaje automático más exitosos.
Exploración del Cerebelo
- Cereb (cereb.proj) — Papel del cerebelo en el aprendizaje motor, aprendiendo de los errores.