por Shelly Fan
Los bebés son bolas de alegría burbujeantes, tiernas y risueñas. También son máquinas de aprendizaje enormemente poderosas. A los tres meses ya tienen intuición sobre cómo se comportan las cosas a su alrededor, sin que nadie les enseñe explícitamente las reglas del juego.
Esta habilidad, denominada “física intuitiva”, parece extremadamente trivial en la superficie. Si lleno un vaso con agua y lo coloco sobre la mesa, sé que el vaso es un objeto, algo que puedo envolver con mis manos sin que se derrita en mis palmas. No se hundirá a través de la mesa. Y si empezaba a levitar, lo miraba fijamente e inmediatamente salía corriendo por la puerta.
Los bebés desarrollan rápidamente esta habilidad absorbiendo datos de su entorno externo, formando una especie de “sentido común” sobre la dinámica del mundo físico. Cuando las cosas no se mueven como se esperaba, por ejemplo, en los trucos de magia donde los objetos desaparecen, mostrarán sorpresa.
Para la IA, es un asunto completamente diferente. Si bien los modelos recientes de IA ya han derrotado a los humanos desde el juego hasta la resolución de acertijos científicos de hace décadas , todavía luchan por desarrollar la intuición sobre el mundo físico.
Este mes, los investigadores de DeepMind, propiedad de Google, se inspiraron en la psicología del desarrollo y crearon una IA que extrae naturalmente reglas simples sobre el mundo a través de videos. Netflix y Chill no funcionaron solos; el modelo de IA solo aprendió las reglas de nuestro mundo físico cuando se le dio una idea básica de los objetos, como cuáles son sus límites, dónde están y cómo se mueven. Al igual que los bebés, la IA expresó “sorpresa” cuando se le mostraron situaciones mágicas que no tenían sentido, como una pelota que sube por una rampa.
Apodado PLATO (para el aprendizaje de física a través de la codificación automática y el seguimiento de objetos), la IA fue sorprendentemente flexible. Solo necesitaba un conjunto relativamente pequeño de ejemplos para desarrollar su “intuición”. Una vez que aprendió eso, el software podría generalizar sus predicciones sobre cómo las cosas se movían e interactuaban con otros objetos, así como sobre escenarios nunca antes vistos.
En cierto modo, PLATO llega al punto justo entre la naturaleza y la crianza. Los psicólogos del desarrollo han discutido durante mucho tiempo sobre si se puede lograr el aprendizaje en los bebés al encontrar patrones en los datos de las experiencias únicamente. PLATO sugiere que la respuesta es no, al menos no para esta tarea en particular. Tanto el conocimiento incorporado como la experiencia son fundamentales para completar toda la historia de aprendizaje.
Para ser claros, PLATO no es una réplica digital de un bebé de tres meses, y nunca fue diseñado para serlo. Sin embargo, proporciona una idea de cómo se desarrollan potencialmente nuestras propias mentes.
“El trabajo… está ampliando los límites de lo que la experiencia cotidiana puede y no puede explicar en términos de inteligencia”, comentó el Dr. Susan Hespos y Apoorva Shivaram, de la Universidad de Northwestern y la Universidad de Western Sydney, respectivamente, que no participaron en el estudio. Puede “decirnos cómo construir mejores modelos informáticos que simulen la mente humana”.
El enigma del sentido común
Con solo tres meses de edad, la mayoría de los bebés no se inmutarán si se les cae un juguete y cae al suelo; ya han recogido el concepto de gravedad.
Cómo sucede esto todavía es desconcertante, pero hay algunas ideas. A esa edad, los bebés todavía luchan por retorcerse, gatear o moverse de otra manera. Su entrada del mundo exterior es principalmente a través de la observación. Esa es una gran noticia para la IA: significa que en lugar de construir robots para explorar físicamente su entorno, es posible imbuir un sentido de la física en la IA a través de videos.
Es una teoría respaldada por el Dr. Yann LeCun, un destacado experto en IA y científico jefe de IA en Meta. En una charla de 2019 , postuló que los bebés probablemente aprenden a través de la observación. Sus cerebros se basan en estos datos para formar una idea conceptual de la realidad. Por el contrario, incluso los modelos de aprendizaje profundo más sofisticados todavía luchan por construir un sentido de nuestro mundo físico, lo que limita cuánto pueden interactuar con el mundo, lo que los convierte casi literalmente en mentes en las nubes.
Entonces, ¿cómo se mide la comprensión de un bebé de la física cotidiana? “Afortunadamente para nosotros, los psicólogos del desarrollo han pasado décadas estudiando lo que los bebés saben sobre el mundo físico”, escribió el científico principal, el Dr. Luis Piloto. Una prueba particularmente poderosa es el paradigma de violación de expectativas (VoE). Muéstrele a un bebé una pelota que sube una colina, desaparece al azar o de repente va en la dirección opuesta, y el bebé mirará la anomalía por más tiempo del que observaría con sus expectativas normales. Algo extraño está pasando.
Rareza espacial
En el nuevo estudio, el equipo adaptó VoE para probar la IA. Abordaron cinco conceptos físicos diferentes para construir PLATO. Entre ellos están la solidez, es decir, dos objetos no pueden atravesarse; y continuidad: la idea de que las cosas existen y no parpadean incluso cuando están ocultas por otro objeto (la prueba de “peek-a-boo”).
Para construir PLATO, el equipo primero comenzó con un método estándar en IA con un enfoque doble. Un componente, el modelo de percepción, toma datos visuales para analizar objetos discretos en una imagen. El siguiente es el predictor dinámico, que utiliza una red neuronal para considerar el historial de objetos anteriores y predecir el comportamiento del siguiente. En otras palabras, el modelo construye una especie de “motor de física” que mapea objetos o escenarios y adivina cómo se comportaría algo en la vida real. Esta configuración le dio a PLATO una idea inicial de las propiedades físicas de los objetos, como su posición y qué tan rápido se mueven.
Luego vino el entrenamiento. El equipo mostró a PLATO menos de 30 horas de videos sintéticos de un conjunto de datos de código abierto . Estos no son videos de eventos de la vida real. Más bien, imagine animaciones en bloques al estilo de Nintendo de la vieja escuela de una pelota rodando por una rampa, rebotando en otra pelota o desapareciendo repentinamente. PLATO finalmente aprendió a predecir cómo se movería un solo objeto en el siguiente cuadro de video y también actualizó su memoria para ese objeto. Con el entrenamiento, sus predicciones sobre la siguiente “escena” se volvieron más precisas.
Luego, el equipo arrojó una llave inglesa a los radios. Le presentaron a PLATO tanto una escena normal como una imposible, como una pelota que desaparece repentinamente. Al medir la diferencia entre el evento real y las predicciones de PLATO, el equipo pudo medir el nivel de “sorpresa” de la IA, que se disparó en los eventos mágicos.
El aprendizaje se generalizó a otros objetos en movimiento. Desafiado con un conjunto de datos completamente diferente desarrollado por el MIT, que incluye, entre otros elementos, conejos y bolos, PLATO discriminó de manera experta entre eventos imposibles y realistas. PLATO nunca antes había “visto” un conejo, pero sin ningún tipo de reentrenamiento, mostró sorpresa cuando un conejo desafió las leyes de la física. Al igual que los bebés, PLATO pudo capturar su intuición física con tan solo 28 horas de entrenamiento en video.
Para Hespos y Shivaram, “Estos hallazgos también son paralelos a las características que vemos en los estudios de bebés”.
Intuición digital
PLATO no pretende ser un modelo de inteligencia artificial para el razonamiento infantil. Pero muestra que aprovechar nuestros cerebros de bebés en crecimiento puede inspirar a las computadoras con una sensación de fisicalidad, incluso cuando el “cerebro” del software está literalmente atrapado dentro de una caja. No se trata solo de construir robots humanoides. Desde prótesis hasta automóviles autónomos, una comprensión intuitiva del mundo físico une el mundo digital amorfo de 0 y 1 con la realidad cotidiana y corriente.
No es la primera vez que los científicos de IA piensan en impulsar las mentes de las máquinas con una pizca de ingenio infantil. Una idea es darle a la IA un sentido de teoría de la mente: la capacidad de distinguirse de los demás y poder imaginarse en los zapatos de los demás. Es una habilidad que surge de forma natural para los niños de alrededor de cuatro años y, si se integra en los modelos de IA, podría ayudarlo de manera espectacular a comprender las interacciones sociales.
El nuevo estudio se basa en nuestros primeros meses de vida como un rico recurso para desarrollar IA con sentido común. Por ahora, el campo está apenas en su infancia. Los autores están lanzando su conjunto de datos para que otros desarrollen y exploren la capacidad de un modelo de IA para interactuar con conceptos físicos más complejos, incluidos videos del mundo real. Por ahora, “estos estudios podrían servir como una oportunidad sinérgica entre la IA y la ciencia del desarrollo”, dijeron Hespos y Shivaram.
Crédito de la imagen: thedanw de Pixabay
Fuente: https://singularityhub.com/2022/07/19/deepmind-gave-an-ai-intuition-by-training-it-like-a-baby/