Un robot de búsqueda con el que puedas conversar facilitaría la búsqueda de respuestas en internet, si no dice mentiras, claro. Entre otras empresas, Microsoft, Google y Baidu compiten ferozmente para lograrlo primero.
por WILL KNIGHT

Los motores de búsqueda en internet quizá cambien para siempre gracias a, ya sabes quién, ChatGPT; aunque esto quizá no ocurra tan pronto como pareciera. Como tanta gente, Jiang Chen quedó hipnotizado cuando probó por primera vez ChatGPT, el célebre chatbot de OpenAI, extraordinariamente coherente, y aparentemente bien informado, que se ha convertido en una sensación. Pero Chen es un experto en aprendizaje automático y trabajó anteriormente en Google; su pericia le permitió encontrar otras cosas.
El aura de poder del sistema se atenuó cuando Chen intentó utilizar la misma tecnología que usa ChatGPT, para crear una mejor herramienta de búsqueda para la startup que cofundó, Moveworks. La empresa utiliza inteligencia artificial para ayudar a sus empleados a buscar información, como documentos de asistencia técnica y páginas de recursos humanos. La nueva herramienta de búsqueda de Chen resultó excelente para extraer todo tipo de información útil de esos documentos, incluidas direcciones y números de teléfono, pero algunos de ellos no eran reales. “Su capacidad de invención es asombrosa”, se sorprende Chen.
Es comprensible el entusiasmo que ha despertado ChatGPT y las sugerencias generalizadas de que podría reinventar los motores de búsqueda. El chatbot puede generar respuestas complejas y sofisticadas a las preguntas que se le hacen, sintetizando la información de miles de millones de palabras extraídas de internet y otras fuentes para entrenar sus algoritmos. Jugar con el bot puede dar la sensación de estar experimentando una forma más fluida de interactuar con las máquinas.
Pero la forma en que funciona la tecnología es, en cierto modo, fundamentalmente contraria a la idea de un motor de búsqueda riguroso que recupere de forma fiable la información que se encuentra en línea. Ya hay muchos datos inexactos en la red, pero ChatGPT genera fácilmente nuevas falsedades. Sus algoritmos no están directamente ligados a una base de datos de hechos o enlaces, sino que generan cadenas de palabras destinadas a parecerse estadísticamente a las vistas en sus datos de entrenamiento, sin tener en cuenta la verdad.
A pesar de este reto, y tal vez impulsados por el vértigo que rodea a ChatGPT, los titanes de las búsquedas en internet, así como varias empresas emergentes, se lanzan a la aventura. Se dice que Microsoft, que ha invertido unos 10 mil millones de dólares en OpenAI, la startup creadora de ChatGPT, está incorporando de algún modo la tecnología subyacente a Bing, su motor de búsqueda.
Google, que lleva tiempo trabajando en un chatbot similar, llamado LaMDA, también reacciona rápidamente. Tiene previsto lanzar pronto una versión de LaMDA y es posible que demuestre este año hasta 20 productos que utilizan la tecnología. El principal motor de búsqueda de China, Baidu, también está trabajando en un bot en chino similar a ChatGPT.
Mientras las gigantes tecnológicas preparan sus respuestas a la emergencia de ChatGPT, varias empresas emergentes han lanzado motores de búsqueda con interfaces de chat similares al bot. Entre ellas están You.com, Perplexity AI y Neeva.

ChatGPT obliga a las universidades a replantearse el plagio
Estudiantes y profesores no se ponen de acuerdo sobre si el célebre chatbot de inteligencia artificial, ChatGPT, es una herramienta de investigación o un propulsor del engaño.
Más difícil que buscar en internet
Las herramientas que han construido esas compañías ilustran tanto el potencial como el reto de adaptar la tecnología del tipo de ChatGPT a las búsquedas. You.com, fundada por Richard Socher, experto en lenguaje e inteligencia artificial, puede ofrecer respuestas a través de una interfaz de chat. Estas vienen acompañadas de citas, que pueden ayudar al usuario a rastrear el origen de la información.
Pero el modelo a veces combina fuentes que no van juntas. Preguntar sobre alguien, por ejemplo, puede producir una respuesta que combine información de las biografías de varias personas con el mismo nombre. Cuando le preguntamos por mí, You Chat describió con precisión mi función en WIRED, pero también me atribuyó haber sido corredor en la Universidad de Delaware y creativo profesional. Una búsqueda normal podría devolver páginas de varios Will Knights, pero el chatbot los fusionó en una sola persona.
Otro problema de un sistema como ChatGPT es que sus respuestas surgen únicamente de los datos con los que fue entrenado. Volver a entrenar el modelo en su totalidad puede costar millones de dólares, debido a su tamaño y a la escala de los datos. YouChat sabe qué tiempo hace en Nueva York en este momento, pero se confunde cuando se le piden los últimos resultados deportivos. Socher no quiere revelar cómo se incorpora la información actualizada, ya que lo considera una ventaja competitiva.
“Creo que ahora mismo muchas de estas interfaces de chat son muy superiores a la experiencia de búsqueda en algunos aspectos, pero en otros claramente siguen siendo mucho peores”, piensa Socher. “Estamos trabajando para reducir todos estos problemas”.
Aravind Srinivas, fundador y consejero delegado de la startup de búsqueda, Perplexity AI, quien anteriormente trabajó en OpenAI, cree que para enfrentarse al reto de actualizar un sistema similar a ChatGPT con información reciente, hay que combinarle con algo más. “Por sí solos nunca podrán ser buenos motores de búsqueda“, asegura.
Buscar en internet sería más caro
Saam Motamedi, un inversor de capital de riesgo de Greylock Partners quien ha invertido en la empresa de búsqueda basada en inteligencia artificial, Neeva, destaca que tampoco está clara la compatibilidad de las interfaces de chat con el principal modelo de ingresos de los motores de búsqueda: la publicidad. Google y Bing utilizan las consultas de búsqueda para seleccionar los anuncios que aparecen en la parte superior de la lista de los enlaces que se sirven como respuesta. Motamedi sospecha que tendrán que surgir nuevas formas de publicidad para que las interfaces de búsqueda tipo chat sean viables, pero no está del todo claro cuáles serán. En el caso de Neeva, esta cobra una cuota de suscripción por búsquedas ilimitadas sin publicidad.
El costo de un modelo como ChatGPT a la escala de Google también podría resultar problemático. Luis Ceze, cofundador y consejero delegado de OctoML, una empresa que ayuda a otras compañías a reducir el costo de implantación de algoritmos de aprendizaje automático, calcula que puede ser 10 veces más caro ejecutar una búsqueda en ChatGPT que una en Google, porque cada respuesta requiere ejecutar un modelo de inteligencia artificial grande y complejo.
La magnitud de la manía ChatGPT tomó por sorpresa a algunos programadores e investigadores de inteligencia artificial familiarizados con la tecnología que hay detrás. El algoritmo en el núcleo del bot, llamado GPT, fue desarrollado por primera vez por OpenAI en 2018, y una versión más potente, GPT-2, fue revelada en 2019. Es un modelo de aprendizaje automático, diseñado para tomar texto y luego predecir lo que viene después, que OpenAI demostró que puede funcionar de manera impresionante si se entrena con grandes volúmenes de texto. La primera versión comercial de la tecnología, GPT-3, ha estado disponible desde junio de 2020 para que los desarrolladores la utilicen, y puede lograr muchas de las cosas por las que ChatGPT ha sido tan elogiado recientemente.
ChatGPT utiliza una versión mejorada del algoritmo, pero el mayor salto en sus capacidades proviene de que OpenAI hace que los humanos proporcionen retroalimentación al sistema sobre lo que constituye una respuesta satisfactoria. Pero, al igual que los sistemas anteriores de generación de texto, ChatGPT sigue siendo propenso a reproducir los sesgos de sus datos de entrenamiento, así como a inventarse resultados, plausibles, pero incorrectos.
Gary Marcus, catedrático emérito de la Universidad de Nueva York, y firme crítico de las exageraciones de la inteligencia artificial, cree que ChatGPT es inadecuado para la búsqueda porque no entiende lo que dice. Añade que herramientas como ChatGPT pueden causar otros problemas a las empresas de búsqueda al inundar internet con textos generados por inteligencia artificial y optimizados para los motores de búsqueda. “Todos los motores de búsqueda están a punto de tener un problema”, alerta.
Alex Ratner, profesor adjunto de la Universidad de Washington y cofundador de Snorkel AI, que se dedica a entrenar modelos de inteligencia artificial de forma más eficiente, califica ChatGPT como “inflexión legítima” en lo que puede hacer el software. Pero también dice que puede llevar un tiempo averiguar cómo evitar que los grandes modelos de lenguaje, como GPT, inventen cosas. En su opinión, encontrar la manera de mantenerlos actualizados con nueva información para que la búsqueda no pierda actualidad probablemente implique nuevos enfoques para entrenar los modelos de inteligencia artificial involucrados.
No está claro cuánto tiempo llevará inventar y probar estas soluciones. Puede que pase algún tiempo antes de que la tecnología sea capaz de cambiar radicalmente la forma en la que la gente busca respuestas, incluso si se dan otros casos de uso, como idear nuevas recetas, servir de compañero de estudio o de programación. “Es asombroso, y le dije a mi equipo que la gente va a dividir los años como antes y después de ChatGPT”, afirma Chen, de Moveworks. “Pero si sustituirá a la búsqueda, esa es ya otra cuestión”.