Arquitectura del Cerebro

por Edd Gent

Si bien la IA puede llevar a cabo algunas hazañas impresionantes cuando se entrena en millones de puntos de datos, el cerebro humano a menudo puede aprender de una pequeña cantidad de ejemplos. Una nueva investigación muestra que tomar prestados principios arquitectónicos del cerebro puede ayudar a la IA a acercarse a nuestra destreza visual.

Arquitectura del Cerebro

La sabiduría predominante en la investigación de aprendizaje profundo es que cuantos más datos arroje a un algoritmo, mejor aprenderá. Y en la era de Big Data, eso es más fácil que nunca, particularmente para las grandes empresas de tecnología centradas en datos que llevan a cabo gran parte de la investigación de IA de vanguardia.

Hoy’ s más grandes de aprendizaje profundas modelos, al igual que de OpenAI GPT-3 y el BERT de Google, son entrenados en mil millones de puntos de datos, e incluso más modesto modelos requieren grandes cantidades de datos. Recopilar estos conjuntos de datos e invertir los recursos computacionales para procesarlos es un cuello de botella importante, en particular para los laboratorios académicos con menos recursos.

También significa que la IA actual es mucho menos flexible que la inteligencia natural. Si bien un humano solo necesita ver un puñado de ejemplos de un animal, una herramienta o alguna otra categoría de objeto para poder seleccionarlo nuevamente, la mayoría de la IA necesita ser entrenada en muchos ejemplos de un objeto para poder identificarlo. Reconócelo.

Existe una subdisciplina activa de la investigación de la inteligencia artificial dirigida a lo que se conoce como aprendizaje de “una sola vez” o “pocas veces”, donde los algoritmos están diseñados para poder aprender de muy pocos ejemplos. Sin embargo, estos enfoques son todavía en gran parte experimental, y no pueden venir cerca de igualar ing el alumno más rápido que sabemos, el cerebro humano.

Th se impulsó un par de neurocientíficos para ver si podían diseñar una IA que podría aprender de pocos puntos de datos mediante préstamos principios de cómo pensamos los resuelve este problema cerebrales. En un papel en Frontiers in Neurociencia Computacional , que explicaron que el enfoque significativamente aumenta de AI  capacidad de aprender nuevos conceptos visuales de algunos ejemplos.

“Nuestro modelo proporciona una forma biológicamente plausible para las redes neuronales artificiales para aprender nuevos conceptos visuales de un pequeño número de ejemplos”, Maximiliano Riesenhuber, de Georgetown University Medical Center, SA Identificación en un comunicado de prensa

“Podemos hacer que las computadoras aprendan mucho mejor a partir de unos pocos ejemplos aprovechando el aprendizaje previo de una manera que creemos que refleja lo que está haciendo el cerebro”.

Varias décadas de investigación en neurociencia sugieren que la capacidad del cerebro para aprender tan rápidamente depende de su capacidad para utilizar el conocimiento previo para comprender nuevos conceptos basados ​​en pocos datos. Cuando se trata de la comprensión visual, esto puede depender de similitudes de forma, estructura o color, pero el cerebro también puede aprovechar conceptos visuales abstractos que se cree que están codificados en una región del cerebro llamada lóbulo temporal anterior (ATL).

“Es como decir que un ornitorrinco se parece un poco a un pato, un castor y una nutria marina”, dijo el coautor del artículo de id Joshua Rule, de la Universidad de California en Berkeley.

Los investigadores decidieron probar y volver a crear esta capacidad mediante el uso de conceptos de alto nivel similares aprendidas por un n AI para ayudar a aprender rápidamente las categorías antes vistas de imágenes.

Los algoritmos de aprendizaje profundo funcionan al hacer que capas de neuronas artificiales aprendan características cada vez más complejas de una imagen u otro tipo de datos, que luego se utilizan para categorizar nuevos datos. Por ejemplo, las primeras capas buscarán características simples como bordes, mientras que las posteriores pueden buscar características más complejas como narices, caras o incluso características de más alto nivel.

Primero entrenaron la IA en 2.5 millones de imágenes en 2.000 categorías diferentes del popular conjunto de datos ImageNet. Luego extrajeron entidades de varias capas de la red, incluida la última capa antes de la capa de salida. T oye refieren a éstos como “características conceptuales” porque el y son el nivel más altas prestaciones aprendió, y lo más similar a los conceptos abstractos que pueden ser codificados en el ATL.

Luego usaron estos diferentes conjuntos de características para entrenar a la IA para aprender nuevos conceptos basados ​​en 2, 4, 8, 16, 32, 64 y 128 ejemplos. Descubrieron que la IA que usaba las características conceptuales arrojaba un rendimiento mucho mejor que las que se entrenaban con características de nivel inferior en un menor número de ejemplos, pero la brecha se reducía a medida que se alimentaban con más ejemplos de entrenamiento.

Si bien los investigadores admiten que el reto al que se fijan sus AI wa es relativamente simple y sólo cubre un aspecto del complejo proceso de razonamiento visual, que sa Identificación del que el uso de un enfoque biológicamente plausible para resolver el problema de unos pocos disparos abre nuevas y prometedoras vías en ambos neurociencia e IA.

“Nuestros hallazgos sugieren no sólo técnicas que podrían ayudar a los ordenadores aprender más rápida y eficiente, sino que también puede conducir a la mejora de la neurociencia experimentos destinados a comprender cómo las personas aprenden tan rápido, que no está todavía bien entendidos”, Riesenhuber sa ID .

Como señalan los investigadores, el sistema visual humano sigue siendo el estándar de oro cuando se trata de comprender el mundo que nos rodea. Tomar prestado de sus principios de diseño podría resultar una dirección rentable para futuras investigaciones.

Crédito de la imagen: Gerd Altmann de Pixabay

Fuente: https://singularityhub.com/2021/01/18/how-mirroring-the-architecture-of-the-human-brain-is-speeding-up-ai-learning/

Deja una respuesta