MIT Technology Review

por Will Douglas Heaven

Un enfoque inspirado en los conos de luz de Einstein permite a las IA hacer mejores conjeturas sobre lo que sucederá a continuación. Podría ayudar a predecir los efectos de las drogas.

Nadie sabe qué pasará en el futuro , pero algunas conjeturas son mucho mejores que otras. Una pelota de fútbol pateada no retrocederá en el aire y volverá al pie del pateador. Una hamburguesa con queso a medio comer no volverá a estar entera. Un brazo roto no sanará de la noche a la mañana.

IA y la Causalidad
IA y la Causalidad

Basándose en una descripción fundamental de causa y efecto que se encuentra en la teoría de la relatividad especial de Einstein, los investigadores del Imperial College de Londres han encontrado una forma de ayudar a las IA a hacer mejores conjeturas también.

El mundo avanza paso a paso, emergiendo cada instante de los que le preceden. Podemos hacer buenas conjeturas sobre lo que sucede a continuación porque tenemos fuertes intuiciones sobre la causa y el efecto, perfeccionadas al observar cómo funciona el mundo desde el momento en que nacemos y procesar esas observaciones con cerebros programados por millones de años de evolución.

Las computadoras, sin embargo, encuentran difícil el razonamiento causal. Los modelos de aprendizaje automático son excelentes para detectar correlaciones, pero tienen dificultades para explicar por qué un evento debe seguir a otro. Eso es un problema, porque sin un sentido de causa y efecto, las predicciones pueden estar completamente equivocadas. ¿Por qué una pelota de fútbol no debería retroceder en vuelo? 

Esta es una preocupación particular con el diagnóstico impulsado por IA . Las enfermedades a menudo se correlacionan con múltiples síntomas. Por ejemplo, las personas con diabetes tipo 2 suelen tener sobrepeso y dificultad para respirar. Pero la dificultad para respirar no es causada por la diabetes, y tratar a un paciente con insulina no ayudará con ese síntoma. 

La comunidad de la IA se está dando cuenta de la importancia que puede tener el razonamiento causal para el aprendizaje automático y está luchando por encontrar formas de incorporarlo.

Los investigadores han probado varias formas de ayudar a las computadoras a predecir lo que podría suceder a continuación. Los enfoques existentes entrenan un modelo de aprendizaje automático fotograma a fotograma para detectar patrones en secuencias de acciones. Muestre a la IA algunos fotogramas de un tren saliendo de una estación y luego pídale que genere los siguientes fotogramas de la secuencia, por ejemplo.

Las IA pueden hacer un buen trabajo al predecir algunos fotogramas en el futuro, pero la precisión cae drásticamente después de cinco o 10 fotogramas, dice Athanasios Vlontzos del Imperial College de Londres. Debido a que la IA utiliza fotogramas anteriores para generar el siguiente en la secuencia, los pequeños errores cometidos al principio (por ejemplo, algunos píxeles con fallas) se agravan en errores mayores a medida que avanza la secuencia.

Vlontzos y sus colegas querían probar un enfoque diferente. En lugar de hacer que una IA aprenda a predecir una secuencia específica de fotogramas futuros al ver millones de videoclips, le permitieron generar una amplia gama de fotogramas que eran aproximadamente similares a los anteriores y luego elegir los que tenían más probabilidades de aparecer. siguiente. La IA puede hacer conjeturas sobre el futuro sin tener que aprender nada sobre la progresión del tiempo, dice Vlontzos.

Para hacer esto, el equipo desarrolló un algoritmo inspirado en conos de luz, una descripción matemática de los límites de causa y efecto en el espacio-tiempo, que fue propuesto por primera vez en la teoría de la relatividad especial de Einstein y luego refinado por su ex profesor Hermann Minkowski. Los conos de luz surgen en física porque la velocidad de la luz es constante. Muestran los límites en expansión de un rayo de luz, y todo lo demás, a medida que emana de un evento inicial, como una explosión.

Tome una hoja de papel y marque un evento con un punto. Ahora dibuja un círculo con ese evento en el centro. La distancia entre el punto y el borde del círculo es la distancia que la luz ha viajado en un período de tiempo, digamos, un segundo. Debido a que nada, ni siquiera la información, puede viajar más rápido que la luz, el borde de este círculo es un límite estricto sobre la influencia causal del evento original. En principio, cualquier cosa dentro del círculo podría haber sido afectada por el evento; nada de afuera no podría.

Después de dos segundos, la luz ha viajado el doble de distancia y el tamaño del círculo se ha duplicado: ahora hay muchos más futuros posibles para ese evento original. Imagine estos círculos cada vez más grandes que se elevan segundo a segundo de la hoja de papel, y tiene un cono invertido con el evento original en la punta. Este es un cono de luz. Una imagen especular del cono también puede extenderse hacia atrás, detrás de la hoja de papel; contendrá todos los pasados ​​posibles que podrían haber llevado al evento original.

Vlontzos y sus colegas utilizaron este concepto para restringir los marcos futuros que una IA podría elegir. Probaron la idea en dos conjuntos de datos: Moving MNIST , que consiste en videoclips cortos de dígitos escritos a mano que se mueven en una pantalla, y la serie de acciones humanas KTH , que contiene clips de personas caminando o agitando los brazos. En ambos casos, entrenaron a la IA para generar marcos que parecían similares a los del conjunto de datos. Pero, lo que es más importante, los fotogramas del conjunto de datos de entrenamiento no se mostraban en secuencia y el algoritmo no estaba aprendiendo a completar una serie.

Luego le pidieron a la IA que eligiera cuál de los nuevos marcos era más probable que siguiera a otro. Para hacer esto, la IA agrupó los fotogramas generados por similitud y luego utilizó el algoritmo del cono de luz para trazar un límite alrededor de aquellos que podrían estar relacionados causalmente con el fotograma dado. A pesar de no estar entrenado para continuar una secuencia, la IA aún podía hacer buenas conjeturas sobre qué fotogramas venían a continuación. Si le da a la IA un marco en el que camina una persona de pelo corto con camisa, entonces la IA rechazará los marcos que muestren a una persona con el pelo largo o sin camisa, dice Vlontzos. El trabajo se encuentra en las etapas finales de revisión en NeurIPS, una importante conferencia sobre aprendizaje automático 

Una ventaja del enfoque es que debería funcionar con diferentes tipos de aprendizaje automático, siempre que el modelo pueda generar nuevos marcos que sean similares a los del conjunto de entrenamiento. También podría usarse para mejorar la precisión de las IA existentes entrenadas en secuencias de video.

Para probar el enfoque, el equipo hizo que los conos se expandieran a un ritmo fijo. Pero en la práctica, esta tasa variará. Una pelota en un campo de fútbol tendrá más posiciones posibles en el futuro que una pelota viajando por rieles, por ejemplo. Esto significa que necesitaría un cono que se expandiera a un ritmo más rápido para el balón.

Trabajar estas velocidades implica profundizar en la termodinámica, lo cual no es práctico. Por ahora, el equipo planea establecer el diámetro de los conos a mano. Pero al ver un video de un partido de fútbol, ​​digamos, la IA podría aprender cuánto y qué tan rápido se movían los objetos, lo que le permitiría establecer el diámetro del cono. Una IA también podría aprender sobre la marcha, observando qué tan rápido cambia un sistema real y ajustando el tamaño del cono para que coincida.

Predicting the future is important for many applications. Autonomous vehicles need to be able to predict whether a child is about to run into the road or whether a wobbling cyclist presents a hazard. Robots that need to interact with physical objects need to be able to predict how those objects will behave when moved around. Predictive systems in general will be more accurate if they can reason about cause and effect rather than just correlation.

Pero Vlontzos y sus colegas están particularmente interesados ​​en la medicina. Una IA podría usarse para simular cómo un paciente podría responder a un determinado tratamiento, por ejemplo, explicando cómo ese tratamiento podría seguir su curso, paso a paso. “Al crear todos estos resultados posibles, puede ver cómo un medicamento afectará a una enfermedad”, dice Vlontzos. El enfoque también podría usarse con imágenes médicas. Dada una resonancia magnética de un cerebro, una IA podría identificar las posibles formas en que una enfermedad podría progresar.

“Es muy bueno ver que se toman prestadas ideas de la física fundamental para hacer esto”, dice Ciaran Lee, un investigador que trabaja en inferencia causal en Spotify y University College London. “La comprensión de la causalidad es realmente importante si desea tomar acciones o decisiones en el mundo real”, dice. Va al corazón de cómo las cosas llegan a ser como son: “Si alguna vez quieres preguntarte ‘¿Por qué?’ entonces necesitas entender la causa y el efecto “.

Fuente: https://www.technologyreview.com/2020/08/28/1007770/special-relativity-light-cones-ai-predict-future-causality-medicine/

Tagged:

Deja un comentario