por Shelly Fan
Las redes neuronales artificiales están inspiradas en sus contrapartes biológicas. Sin embargo, en comparación con los cerebros humanos, estos algoritmos están muy simplificados, incluso “caricaturizados”.
¿Pueden enseñarnos algo sobre cómo funciona el cerebro?
Para un panel en la reunión anual de la Sociedad de Neurociencias de este mes, la respuesta es sí. El aprendizaje profundo no estaba destinado a modelar el cerebro. De hecho, contiene elementos que son biológicamente improbables, si no totalmente imposibles. Pero ese no es el punto, argumenta el panel. Al estudiar cómo funcionan los algoritmos de aprendizaje profundo, podemos destilar teorías de alto nivel para los procesos del cerebro, inspiraciones para ser probadas más a fondo en el laboratorio.
“No está mal usar modelos simplificados”, dijo la Dra. Sara Solla, oradora del panel, experta en neurociencia computacional de la Facultad de Medicina Feinberg de la Universidad de Northwestern. Descubrir qué incluir, o excluir, es una forma enormemente poderosa de descubrir qué es crítico y qué basura evolutiva para nuestras redes neuronales.
La Dra. Alona Fyshe de la Universidad de Alberta está de acuerdo. “La IA [los algoritmos] ya han sido útiles para comprender el cerebro … aunque no son modelos fieles de fisiología”. El punto clave, dijo, es que pueden proporcionar representaciones, es decir, una visión matemática general de cómo las neuronas se ensamblan en circuitos para impulsar la cognición, la memoria y el comportamiento.
Pero, ¿qué faltan, si es que faltan los modelos de aprendizaje profundo? Para el panelista Dr. Cian O’Donnell de la Universidad de Ulster, la respuesta es mucha. Aunque a menudo hablamos del cerebro como una computadora biológica, funciona con información tanto eléctrica como química. La incorporación de datos moleculares en redes neuronales artificiales podría acercar la IA a un cerebro biológico, argumentó. Del mismo modo, varias estrategias computacionales que utiliza el cerebro aún no se utilizan en el aprendizaje profundo.
Una cosa está clara: cuando se trata de usar la IA para inspirar la neurociencia, “el futuro ya está aquí”, dijo Fyshe.
El papel del ‘cerebro pequeño’ en el lenguaje
Como ejemplo, Fyshe recurrió a un estudio reciente sobre la neurociencia del lenguaje.
A menudo pensamos en la corteza cerebral como la unidad central de procesamiento para descifrar el lenguaje. Pero los estudios ahora apuntan a un nuevo y sorprendente centro: el cerebelo. Apodado el “pequeño cerebro”, el cerebelo suele ser conocido por su papel en el movimiento y el equilibrio. En lo que respecta al procesamiento del lenguaje, los neurocientíficos no saben nada.
Ingrese a GPT-3 , un modelo de aprendizaje profundo con habilidades locas de escritura de idiomas. Brevemente, GPT-3 funciona prediciendo la siguiente palabra en una secuencia. Desde su lanzamiento, la IA y sus sucesores han escrito poesía, ensayos, canciones y códigos de computadora extraordinarios, parecidos a los humanos , generando trabajos que desconciertan a los jueces encargados de determinar la máquina de la humana.
En este destacado estudio , dirigido por el Dr. Alexander Huth de la Universidad de Texas, los voluntarios escucharon horas de podcasts mientras se escaneaban sus cerebros con fMRI. A continuación, el equipo utilizó estos datos para entrenar modelos de IA, basados en cinco características del lenguaje, que pueden predecir cómo se encienden sus cerebros. Por ejemplo, una característica capturó cómo se mueven nuestras bocas al hablar. Otro analizó si una palabra es un sustantivo o un verbo; otro más el contexto del idioma. De esta manera, el estudio capturó los principales niveles de procesamiento del lenguaje, desde la acústica de bajo nivel hasta la comprensión de alto nivel.
Sorprendentemente, solo el modelo contextual, uno basado en GPT-3, pudo predecir con precisión la actividad neuronal cuando se probó en un nuevo conjunto de datos. ¿Conclusión? El cerebelo prefiere el procesamiento de alto nivel, particularmente relacionado con las categorías sociales o de personas.
“Esta es una evidencia bastante sólida de que se requería el modelo de red neuronal para que pudiéramos comprender lo que está haciendo el cerebelo”, dijo Fyshe. “[Esto] no habría sido posible sin las redes neuronales profundas”.
Aprendizaje biológico profundo
A pesar de estar inspirado por el cerebro, el aprendizaje profundo se basa solo vagamente en el bio-hardware ondulante dentro de nuestras cabezas. La IA tampoco está sujeta a limitaciones biológicas, lo que permite velocidades de procesamiento que superan enormemente las de los cerebros humanos.
Entonces, ¿cómo podemos acercar una inteligencia alienígena a sus creadores?
Para O’Donnell, tenemos que volver a sumergirnos en los aspectos no binarios de las redes neuronales. “El cerebro tiene múltiples… niveles de organización”, que van desde genes y moléculas hasta células que se conectan en circuitos, que mágicamente conducen a la cognición y el comportamiento, dijo.
No es difícil ver aspectos biológicos que no están en los modelos actuales de aprendizaje profundo. Tomemos como ejemplo los astrocitos, un tipo de célula del cerebro que se reconoce cada vez más por su papel en el aprendizaje. O “miniordenadores” dentro de las ramas retorcidas de una neurona, las dendritas, lo que sugiere que una sola neurona es mucho más poderosa de lo que se pensaba. O moléculas que son guardianes del aprendizaje, que pueden agruparse en burbujas grasas para flotar de una neurona a la siguiente para cambiar la actividad del receptor.
La pregunta clave es, ¿cuál de estos detalles biológicos importa?
Como explica O’Donnell, tres aspectos podrían mover el aprendizaje profundo hacia una mayor probabilidad biológica: agregar detalles biológicos que subyacen a la computación, el aprendizaje y las limitaciones físicas.
¿Un ejemplo? Trabajadores bioquímicos dentro de una neurona, como los que remodelan activamente la estructura de una sinapsis, una protuberancia física que conecta neuronas adyacentes, calcula datos y almacena recuerdos al mismo tiempo. Dentro de una sola neurona, las moléculas pueden reaccionar a una entrada de datos, flotando alrededor de las dendritas para desencadenar cálculos bioquímicos en una escala de tiempo mucho más lenta que las señales eléctricas, una especie de ” pensamiento rápido y lento “, pero al nivel de una sola neurona.
De manera similar, el cerebro aprende de una manera dramáticamente diferente en comparación con los algoritmos de aprendizaje profundo. Si bien las redes neuronales profundas son altamente eficientes en un trabajo, el cerebro es flexible en muchos, todo el tiempo. El aprendizaje profundo también se ha basado tradicionalmente en el aprendizaje supervisado, en el sentido de que requiere muchos ejemplos con la respuesta correcta para el entrenamiento, mientras que el principal método computacional del cerebro no está supervisado y, a menudo, se basa en recompensas.
Las restricciones físicas en el cerebro también podrían contribuir a su eficacia. Las neuronas tienen escasa actividad, lo que significa que normalmente están en silencio, en modo de sueño, y solo se activan cuando es necesario, preservando así la energía. También son parlanchines y bastante ruidosos, ya que tienen un truco de redundancia incorporado para abordar nuestro desordenado mundo.
Finalmente, el cerebro minimiza el desperdicio de espacio: sus cables de entrada y salida son como un cuenco de espagueti muy triturado, pero su posición 3D en el cerebro puede influir en su cálculo; las neuronas cercanas entre sí pueden compartir un baño de moduladores químicos, incluso cuando no están conectadas directamente. Esta regulación local pero difusa es algo que falta mucho en los modelos de aprendizaje profundo.
Estos pueden parecer detalles esenciales, pero podrían impulsar las estrategias computacionales del cerebro hacia caminos diferentes al aprendizaje profundo.
¿Línea de fondo? “Creo que vale la pena explorar el vínculo entre el aprendizaje profundo y los cerebros, pero hay muchos mecanismos biológicos conocidos y desconocidos … que normalmente no se incorporan en las redes neuronales profundas”, dijo O’Donnell.
Fusión de mente-máquina
Dejando a un lado las dudas, está claro que la inteligencia artificial y la neurociencia están convergiendo. Los aspectos de la neurociencia que convencionalmente no se consideran en el aprendizaje profundo (por ejemplo, la motivación o la atención) son ahora cada vez más populares entre la multitud del aprendizaje profundo.
Para Solla, el punto crítico es mantener los modelos de aprendizaje profundo cerca, pero no demasiado, a un cerebro real. “Si tiene un modelo que es tan detallado como el sistema en sí … ya tiene algo que pinchar”, dijo, “un modelo fiel podría no ser útil”.
Los tres panelistas estuvieron de acuerdo en que el siguiente punto crucial es encontrar el punto óptimo entre la abstracción y la precisión neurobiológica para que el aprendizaje profundo pueda formar sinergias con la neurociencia.
Una pregunta aún desconocida es qué detalles inteligentes incluir. Aunque es posible probar sistemáticamente las ideas de la neurociencia, para Solla no hay una fórmula mágica. “Dependerá del problema”, dijo.
O’Donnell tiene una perspectiva diferente. “Con las redes de aprendizaje profundo, puede capacitarlos para que se desempeñen bien en tareas” que los modelos estándar inspirados en el cerebro no podían resolver anteriormente. Al comparar y unir los dos, potencialmente podríamos obtener lo mejor de ambos mundos: un algoritmo que funciona bien y también funciona bien con precisión biológica, dijo.
Crédito de la imagen: Instituto Nacional de Salud Mental, Institutos Nacionales de Salud
Fuente: https://singularityhub.com/2021/11/23/how-ai-is-deepening-our-understanding-of-the-brain/