por Paul S. Rosenbloom

El progreso en inteligencia artificial ha permitido la creación de tareas que antes se pensaba que solo eran posibles para los humanos, como traducir idiomasconducir automóvilesjugar juegos de mesa al nivel de campeón mundial y extraer la estructura de las proteínas. Sin embargo, cada una de estas IA ha sido diseñada y entrenada exhaustivamente para una sola tarea y tiene la capacidad de aprender solo lo que se necesita para esa tarea específica.

Las IA recientes que producen texto fluido , incluso en conversaciones con humanos, y generan arte impresionante y único, pueden dar la falsa impresión de una mente trabajando . Pero incluso estos son sistemas especializados que llevan a cabo tareas estrechamente definidas y requieren grandes cantidades de capacitación.

Todavía sigue siendo un desafío abrumador combinar múltiples IA en una que pueda aprender y realizar muchas tareas diferentes, y mucho menos perseguir la gama completa de tareas realizadas por humanos o aprovechar la gama de experiencias disponibles para humanos que reducen la cantidad de datos que de otro modo se requieren para aprender a realizar estas tareas. Las mejores IA actuales en este sentido, como AlphaZero y Gato , pueden manejar una variedad de tareas que se ajustan a un solo molde, como jugar. La inteligencia artificial general (AGI) que es capaz de realizar una variedad de tareas sigue siendo difícil de alcanzar.

En última instancia, los AGI deben poder interactuar de manera efectiva entre sí y con las personas en diversos entornos físicos y contextos sociales, integrar la amplia variedad de habilidades y conocimientos necesarios para hacerlo y aprender de manera flexible y eficiente de estas interacciones.

Construir AGI se reduce a construir mentes artificiales, aunque muy simplificadas en comparación con las mentes humanas. Y para construir una mente artificial, debes comenzar con un modelo de cognición.

De la Inteligencia General Humana a la Artificial

Los seres humanos tienen un conjunto casi ilimitado de habilidades y conocimientos, y aprenden rápidamente nueva información sin necesidad de ser rediseñados para hacerlo. Es concebible que se pueda construir un AGI utilizando un enfoque que es fundamentalmente diferente de la inteligencia humana. Sin embargo, como tres investigadores veteranos en IA y ciencia cognitiva , nuestro enfoque es inspirarnos y obtener información de la estructura de la mente humana. Estamos trabajando hacia AGI al tratar de comprender mejor la mente humana y comprender mejor la mente humana al trabajar hacia AGI.

A partir de la investigación en neurociencia , ciencia cognitiva y psicología, sabemos que el cerebro humano no es un enorme conjunto homogéneo de neuronas ni un conjunto masivo de programas específicos de tareas que resuelven un solo problema. En cambio, es un conjunto de regiones con diferentes propiedades que respaldan las capacidades cognitivas básicas que juntas forman la mente humana.

Estas capacidades incluyen percepción y acción; memoria a corto plazo para lo que es relevante en la situación actual; recuerdos a largo plazo de habilidades, experiencia y conocimiento; razonamiento y toma de decisiones; emoción y motivación; y aprender nuevas habilidades y conocimientos de la gama completa de lo que una persona percibe y experimenta.

En lugar de centrarse en capacidades específicas de forma aislada, el pionero de la IA, Allen Newell , sugirió en 1990 desarrollar Teorías Unificadas de la Cognición que integren todos los aspectos del pensamiento humano. Los investigadores han podido construir programas de software llamados arquitecturas cognitivas que incorporan tales teorías, haciendo posible probarlas y refinarlas.

Las arquitecturas cognitivas se basan en múltiples campos científicos con distintas perspectivas. La neurociencia se centra en la organización del cerebro humano, la psicología cognitiva en el comportamiento humano en experimentos controlados y la inteligencia artificial en capacidades útiles.

El modelo común de cognición

Hemos estado involucrados en el desarrollo de tres arquitecturas cognitivas: ACT-R , Soar y Sigma . Otros investigadores también han estado ocupados en enfoques alternativos. Un artículo identificó casi 50 arquitecturas cognitivas activas . Esta proliferación de arquitecturas es en parte un reflejo directo de las múltiples perspectivas involucradas y en parte una exploración de una amplia gama de posibles soluciones. Sin embargo, cualquiera que sea la causa, plantea preguntas incómodas tanto científicamente como con respecto a encontrar un camino coherente hacia AGI.

Afortunadamente, esta proliferación ha llevado el campo a un importante punto de inflexión. Los tres hemos identificado una sorprendente convergencia entre arquitecturas, que refleja una combinación de estudios neuronales, de comportamiento y computacionales. En respuesta, iniciamos un esfuerzo de toda la comunidad para capturar esta convergencia de una manera similar al modelo estándar de física de partículas que surgió en la segunda mitad del siglo XX.

un gráfico que muestra una cabeza y un cerebro humanos a la izquierda, una cabeza de robot con circuitos a la derecha y un gráfico con cinco bloques de colores y flechas que conectan los bloques
Este modelo básico de cognición explica el pensamiento humano y proporciona un modelo para la verdadera inteligencia artificial. Andrea Stocco, CC BY-ND

Este modelo común de cognición divide el pensamiento humano en múltiples módulos, con un módulo de memoria a corto plazo en el centro del modelo. Los otros módulos (percepción, acción, habilidades y conocimiento) interactúan a través de él.

El aprendizaje, en lugar de ocurrir intencionalmente, sucede automáticamente como un efecto secundario del procesamiento. En otras palabras, no decides lo que se almacena en la memoria a largo plazo. En cambio, la arquitectura determina lo que se aprende en función de lo que piense. Esto puede producir el aprendizaje de nuevos hechos a los que está expuesto o nuevas habilidades que intenta. También puede producir refinamientos a hechos y habilidades existentes.

Los propios módulos funcionan en paralelo; por ejemplo, permitiéndole recordar algo mientras escucha y mira alrededor de su entorno. Los cálculos de cada módulo son masivamente paralelos, lo que significa que muchos pequeños pasos de cálculo ocurren al mismo tiempo. Por ejemplo, al recuperar un hecho relevante de un vasto tesoro de experiencias previas, el módulo de memoria a largo plazo puede determinar la relevancia de todos los hechos conocidos simultáneamente, en un solo paso.

Guiando el camino hacia la inteligencia general artificial

El modelo común se basa en el consenso actual en la investigación de arquitecturas cognitivas y tiene el potencial de guiar la investigación sobre inteligencia general tanto natural como artificial. Cuando se utiliza para modelar patrones de comunicación en el cerebro, el modelo común produce resultados más precisos que los principales modelos de la neurociencia. Esto amplía su capacidad para modelar humanos , el único sistema que ha demostrado ser capaz de inteligencia general, más allá de las consideraciones cognitivas para incluir la organización del cerebro mismo.

Estamos empezando a ver esfuerzos para relacionar las arquitecturas cognitivas existentes con el modelo común y usarlo como base para nuevos trabajos, por ejemplo, una IA interactiva diseñada para entrenar a las personas hacia un mejor comportamiento de salud. Uno de nosotros participó en el desarrollo de una IA basada en Soar, apodada Rosie , que aprende nuevas tareas a través de instrucciones en inglés de maestros humanos. Aprende 60 rompecabezas y juegos diferentes y puede transferir lo que aprende de un juego a otro. También aprende a controlar un robot móvil para tareas como recoger y entregar paquetes y patrullar edificios.

Rosie es solo un ejemplo de cómo construir una IA que se acerque a AGI a través de una arquitectura cognitiva que está bien caracterizada por el Modelo Común. En este caso, la IA aprende automáticamente nuevas habilidades y conocimientos durante el razonamiento general que combina la instrucción en lenguaje natural de los humanos y una cantidad mínima de experiencia; en otras palabras, una IA que funciona más como una mente humana que las IA actuales, que aprenden a través de métodos brutos. fuerza informática y cantidades masivas de datos.

Desde una perspectiva más amplia de AGI, consideramos el Modelo común como una guía para desarrollar dichas arquitecturas e IA y como un medio para integrar los conocimientos derivados de esos intentos en un consenso que, en última instancia, conduce a AGI.

bajo una licencia Creative Commons. Lee el artículo original .

Crédito de la imagen: Shutterstock.com/wowowG

Fuente: https://singularityhub.com/2022/07/28/combining-neuroscience-psychology-and-ai-shows-us-how-humans-think/

Deja una respuesta