Un nuevo modelo de IA de Google, llamado Gemini, es una nueva competencia para ChatGPT de OpenAI. Los rivales de la IA ahora están trabajando en ideas aún más radicales.

por Will Knight – Wired

Imagen cortesía de Google

LA HISTORIA DE La inteligencia artificial se ha visto marcada por períodos del llamado “invierno de la IA”, cuando la tecnología parecía encontrarse con un callejón sin salida y la financiación se agotaba. Cada uno de ellos ha ido acompañado de proclamas de que hacer que las máquinas sean realmente inteligentes es demasiado difícil de entender para los humanos.

El lanzamiento de Gemini por parte de Google, que se afirma que es un tipo fundamentalmente nuevo de modelo de IA y el más poderoso de la compañía hasta la fecha, sugiere que un nuevo invierno de IA no llegará pronto. De hecho, aunque los 12 meses transcurridos desde el lanzamiento de ChatGPT han sido un año excepcional para la IA, hay buenas razones para pensar que el auge actual de la IA no ha hecho más que empezar.

OpenAI no tenía grandes expectativas cuando lanzó la “vista previa de investigación de bajo perfil” llamada ChatGPT en noviembre de 2022. Era simplemente una prueba de una nueva interfaz para sus modelos de lenguaje grandes (LLM) de generación de texto. Pero la capacidad del chatbot para hacer una gama tan amplia de cosas, desde sintetizar ensayos y poesía hasta responder problemas de codificación, impresionó y desconcertó a muchas personas e incendió la industria tecnológica. Cuando OpenAI agregó su nuevo LLM GPT-4 a ChatGPT, algunos expertos se asustaron tanto que le rogaron a la compañía que redujera la velocidad.

La evidencia ya era escasa de que alguien atendiera esa llamada de alarma. Es inconcebible ahora que Google ha subido la apuesta, y quizás también ha cambiado las reglas del juego, al anunciar a Gemini.

Google ya se había apresurado a dar una respuesta directa a ChatGPT en forma de Bard a principios de este año, lanzando finalmente la tecnología de chatbot LLM que había desarrollado antes que OpenAI pero que decidió mantener en privado. Con Gemini, afirma haber abierto una nueva era que va más allá de los LLM anclados principalmente al texto, lo que podría sentar las bases para una nueva ronda de productos de IA significativamente diferentes de los habilitados por ChatGPT.

Google llama a Gemini un modelo “multimodal nativo”, lo que significa que puede aprender de los datos más allá del texto, y también absorber información de audio, video e imágenes. ChatGPT muestra cómo los modelos de IA pueden aprender una cantidad impresionante sobre el mundo si se les proporciona suficiente texto. Y algunos investigadores de IA han argumentado que simplemente hacer que los modelos de lenguaje sean más grandes aumentaría sus capacidades hasta el punto de rivalizar con las de los humanos.

Pero no hay mucho que se pueda aprender sobre la realidad física a través del filtro de texto que los humanos han escrito sobre ella, y las limitaciones difíciles de erradicar de los LLM como GPT-4, como la información alucinante, el razonamiento deficiente y sus extraños fallos de seguridad, parecen sugerir que la ampliación de la tecnología existente tiene sus límites.

Antes del anuncio de Gemini de ayer, WIRED habló con Demis Hassabis, el ejecutivo que dirigió el desarrollo de Gemini y cuyos logros anteriores incluyen liderar el equipo que desarrolló el robot sobrehumano AlphaGo. Como era de esperar, fue efusivo sobre Gemini, afirmando que introduce nuevas capacidades que eventualmente harán que los productos de Google se destaquen. Pero Hassabis también dijo que para ofrecer sistemas de IA que puedan entender el mundo de una manera que los chatbots de hoy en día no pueden, los LLM deberán combinarse con otras técnicas de IA.

Hassabis está en una competencia agresiva con OpenAI, pero los rivales parecen estar de acuerdo en que se necesitan nuevos enfoques radicales. Un misterioso proyecto en curso en OpenAI, llamado Q*, sugiere que la compañía también está explorando ideas que impliquen hacer algo más que escalar sistemas como GPT-4.

Eso encaja con los comentarios hechos en abril por el CEO de OpenAI, Sam Altman, en el MIT, cuando dejó en claro que, a pesar del éxito de ChatGPT, el campo de la IA necesita una gran idea nueva para lograr un progreso significativo adicional. “Creo que estamos al final de la era en la que van a ser estos modelos gigantes, gigantes”, dijo Altman. “Los mejoraremos de otras maneras”.

Es posible que Google acabe de demostrar un enfoque que puede ir más allá de ChatGPT. Pero quizás el mensaje más notable del lanzamiento de Gemini es que Google está decidido a impulsar algo más significativo que los chatbots actuales, al igual que OpenAI.

Fuente: https://www.wired.com/story/google-gemini-generative-ai-boom/

Deja una respuesta