En las próximas décadas podremos hacer cosas que a nuestros abuelos les habrían parecido mágicas.
por Gennaro Cuofano y FourWeekMBA
- Escalado de IA
- Evaluación comparativa de IA
- Gasto en IA
- Centros de datos de IA
- IA multimodal
- Impulso de cadena de pensamiento
- agente de IA
- ¿Qué hizo que Agentic AI fuera un poco?
- ¿Cuáles son las características críticas de Agentic AI en comparación con Prompting?
- ¿Cuándo empezó esta ola de IA Agentic?
- Inteligencia artificial de Agentic: agentes personales, basados en personajes y de empresa
- Agentes personales
- Agentes basados en personajes
- Agentes de la empresa
- ¿Cuál será el próximo dispositivo que habilitará agentes de IA?
- Evolución de las experiencias del cliente
- IA soberana
- Robótica con IA
- Casa inteligente con IA
- Vehículos autónomos
- tengo musica
- Generación de videos con IA
- Publicidad con IA
- El factor de forma del hardware de IA
- Principales macrotendencias empresariales de la IA para 2025
- Conclusiones
En su artículo más reciente, “La era de la inteligencia”, el cofundador de OpenAI, Sam Altman, enfatizó este pasaje.
Te guste o no, creo que esto se convertirá en una verdad fundamental que no podemos ignorar, y en esta investigación te mostraré por qué.
¡De hecho, la industria de la IA ha estado agitada desde que tuvimos el famoso “momento ChatGPT” el 30 de noviembre de 2022!
Desde entonces, ha habido una inmensa cantidad de progreso y una cantidad de ruido aún más impresionante.
Por eso, cuando ChatGPT salió al mercado el 30 de noviembre de 2022, era evidente que todo el panorama empresarial había cambiado. Como alguien que había creado una pequeña pero exitosa empresa digital, sabía que todo estaba a punto de cambiar.
Así que, a partir de ese día, comencé a pensar en cómo progresaría el campo. Mientras jugaba con todas las herramientas de IA que había disponibles, lanzaba varias aplicaciones de IA, agregaba valor a mi comunidad y experimentaba tanto como podía dentro de la industria de la IA como ejecutivo y emprendedor, desarrollé mi propia brújula interna.
Esta brújula interna ha madurado hasta convertirse en lo que me gusta llamar “ Convergencia de IA ” .
O cómo se desarrollará la industria de la IA en los próximos 10 a 30 años, adoptando una visión a largo plazo del campo y analizando cómo Internet pasó de ser una Internet comercial a la Web.
Con esa brújula en mente, exploremos algunas tendencias críticas que tomarán forma en 2025.
En la industria de la IA, debemos tener un enfoque de doble filo:
- Por un lado, mirar el muy corto plazo para ver qué tendencias emergentes nos permiten dar un paso adelante.
- Por el contrario, es necesaria una perspectiva a muy largo plazo para evitar quedar atrapado en el ruido de todos los eventos de corto plazo que afectan a la industria de la IA.
Éste es mi enfoque y de esto trata la investigación que sigue.
Para conocer las tendencias a continuación, puedes consultar Business Trends AI , una de las herramientas que he lanzado para la comunidad.
Allí podrás realizar un seguimiento de todas las tendencias mencionadas a continuación.
Comencemos con algunas tendencias que le ayudarán a comprender hacia dónde nos dirigimos en 2024, los obstáculos que tenemos por delante y las inmensas posibilidades.
Escalado de IA
El escalamiento de la IA se refiere a la expansión de las capacidades y el despliegue de sistemas de Inteligencia Artificial desde pruebas de concepto iniciales o implementaciones a pequeña escala hasta aplicaciones generalizadas a nivel empresarial.
En un nivel fundamental, implica aumentar la potencia computacional, el volumen de datos y la capacidad de los modelos de IA para manejar conjuntos de datos más grandes y tareas más complejas, garantizando un funcionamiento eficiente y confiable en toda la organización.
A finales de 2024, hay un debate masivo sobre si la IA puede seguir el ritmo del nivel actual de innovación o si nos hemos quedado sin capacidades para escalar estos modelos.
Innumerables revistas han informado sobre una desaceleración masiva del progreso de estos modelos fundamentales (como los GPT de OpenAI o los modelos Claude de Anthropic), destacando y enfatizando cómo estos antiguos laboratorios de IA podrían estar en serios problemas.
Sinceramente, si bien esta preocupación vende muchas suscripciones a estas publicaciones, carece totalmente de fundamento.
Sam Altman destacó cómo “no hay muro” para señalar algo crítico en el espacio de la IA en este momento…
Para recapitular, en las últimas semanas se ha hablado mucho de la desaceleración del progreso de la IA.
Si bien esto llama la atención, no creo que estas preocupaciones estén fundadas, al menos por ahora.
¿Por qué?
Todavía tenemos muchos ángulos desde los cuales se pueden mejorar estos modelos de IA.
De hecho, fuera de la arquitectura fundamental (transformador), estos modelos ya se han mejorado enormemente en los últimos dos años con nuevas arquitecturas adicionales (por ejemplo, RAG) y técnicas posteriores al entrenamiento (como el razonamiento en cadena de pensamientos).
Estamos apenas al principio, así que veremos muchas mejoras desde el punto de vista comercial.
Este es un recordatorio de que, a partir de noviembre de 2024, según datos de SimilarWeb, ChatGPT se ha convertido en el octavo sitio web más grande del mundo, superando a sitios como Yahoo y Reddit y avanzando hacia Wikipedia.
De hecho, el director ejecutivo de OpenAI, Sam Altman, aseguró que la IA no se está topando con un “muro de rendimiento”, contrarrestando las preocupaciones sobre la disminución de los rendimientos en los avances del modelo.
Por supuesto, Sam Altman tiene dudas porque tiene una enorme cantidad de dinero en juego con OpenAI. ¿Por qué confiar en él?
A pesar de los informes que indican que los próximos modelos solo tendrán avances moderados, Altman y otros siguen siendo optimistas. Los laboratorios de IA están explorando nuevas técnicas, como los datos sintéticos, para ampliar aún más los límites de la IA.
En otras palabras, como alguien que ha estado estudiando esta industria durante años, ahora hay cuatro ángulos para mirar el problema:
Pre-entrenamiento
A nivel de pre-entrenamiento, hay tres palancas principales:
- Datos,
- Poder de cómputo,
- Y algoritmos.
Eso es prácticamente todo.
Podría profundizar mucho más en esta parte del problema aquí, pero el punto principal es que eventualmente descubriremos cuál es el muro para la arquitectura de IA actual (el Transformer).
Cuando, tras mezclar una y otra vez datos, cálculos y algoritmos, nos demos cuenta de que no hay más progreso, sabremos que será necesario un cambio estructural (arquitectónico). Hasta ese momento, es muy difícil saberlo.
Además, todavía tenemos que aprovechar muchas palancas en los tres lados.
En el caso de los datos , aún es posible avanzar tanto con datos sintéticos (generados por simulaciones), datos seleccionados (generados por humanos) como con datos híbridos (una mezcla de ambos).
En cuanto a la parte informática , apenas estamos empezando a escalar las infraestructuras de Chip para ver hasta dónde podemos llegar.
Todavía necesitamos explorar todas las formas posibles de mejorar las técnicas de preentrenamiento subyacentes para los algoritmos .
Arquitecturas de inferencia
Desde el punto de vista de la inferencia, una vez que se ha entrenado previamente un modelo, se pueden construir diferentes arquitecturas sobre él.
Tomemos el caso de la Generación Aumentada por Recuperación (RAG) :
La generación aumentada por recuperación (RAG) es una técnica que mejora la precisión y confiabilidad de los modelos de IA generativos al hacer referencia a fuentes de conocimiento externas.
Se trata de vincular grandes modelos de lenguaje (LLM) a un conjunto específico de documentos, lo que permite que los modelos aumenten sus respuestas con información actual y específica del dominio que no está incluida en sus datos de entrenamiento originales.
Este método mejora la puntualidad, el contexto y la precisión de los resultados de la IA al incorporar hechos verificables en tiempo real de recursos externos.
Este es otro ángulo que se ha desarrollado rápidamente en los últimos dos años para permitir que los LLM sean más especializados, precisos y seguros (ya que se habilitan de forma selectiva en un conjunto de documentos).
En resumen, estamos en la etapa en la que inicialmente obtuvimos IA generalistas, como ChatGPT, para luego pasar a sistemas de IA generalistas especializados, que, si bien siguen siendo generalistas, pueden ser bastante efectivos al verticalizarse (por ejemplo, abogado de IA, contador de IA, analista de IA), etc.
RAG en sí es una industria que ya vale miles de millones…
Post-entrenamiento
Se han logrado muchos avances en los últimos dos años, incluso a nivel posterior a la formación.
Este es un recordatorio de que Chain-of-Thought Prompting (CoT), el artículo que impulsó la actual ola de inteligencia artificial (IA) Agentic, recién se publicó a principios de 2022.
Al igual que el artículo Transformer (Attention Is All You Need), que se publicó en 2017 y condujo a ChatGPT, CoT también fue un esfuerzo de los equipos de investigación y cerebro de Google.
Hablaré más sobre la cadena de pensamiento más adelante en esta investigación, pero por ahora, vale la pena recordar que mucho de esto tiene que ver con técnicas posteriores al entrenamiento que permitieron el surgimiento de algo como ChatGPT 4o:
ChatGPT 4o se refiere a una versión específica del modelo GPT de OpenAI, una variante del modelo GPT-4 conocida por sus capacidades avanzadas para generar respuestas de texto similares a las humanas y manejar tareas complejas.
Evaluación del desempeño
Como ha destacado Sam Altman, todavía no hay barreras en el ámbito de la escalabilidad. La pregunta sigue siendo si nos estamos topando con una barrera al medir o evaluar el rendimiento de los modelos (en el ámbito de la evaluación) en lugar de sus capacidades.
¿Qué significa?
Este progreso podría avanzar tan rápido, gracias a un mayor escalamiento y otras técnicas de optimización posterior al entrenamiento, que no nos encontraremos con un muro desde una perspectiva de escalamiento, sino más bien con un muro desde una perspectiva de evaluación del rendimiento.
Y si ese es el caso, es un problema grave, ya que no hay un nuevo lanzamiento; si no se puede evaluar el rendimiento, resulta preocupante hacerlo.
Abordaré este punto más adelante…
Evaluación comparativa de IA
El benchmarking de IA consiste en evaluar y comparar el rendimiento de diferentes modelos o sistemas de IA utilizando métricas y pruebas estandarizadas.
Esta práctica ayuda a las organizaciones e investigadores a determinar los enfoques más efectivos y eficientes, refinar los algoritmos de IA e identificar áreas de mejora, impulsando así la innovación y el avance en inteligencia artificial.
Como expliqué anteriormente, un problema importante a resolver en este momento no está solo en el lado del escalamiento de la IA, sino en el lado de la evaluación comparativa para garantizar que tengamos puntos de referencia sólidos para evaluar las mejoras de rendimiento de estos modelos de IA.
En resumen, es posible que estemos en un punto de inflexión en el que estos modelos de IA sigan mejorando rápidamente, pero no disponemos de una evaluación comparativa adecuada para evaluar estas mejoras.
Este fenómeno podría denominarse una “brecha de evaluación” o un “problema de objetivo móvil”, ya que los puntos de referencia deben evolucionar continuamente para seguir el ritmo de las capacidades avanzadas de la IA.
Ése es el desafío de evaluar y mejorar los modelos cuando los objetivos, puntos de referencia o criterios utilizados para la evaluación evolucionan constantemente o se vuelven obsoletos debido al rápido progreso.
En esencia, a medida que los modelos de IA se vuelven más capaces, los estándares con los que medimos su desempeño también deben avanzar, creando un “objetivo móvil”.
Creo que en esa situación nos encontramos ahora. Los modelos de IA están avanzando tan rápidamente que los parámetros de evaluación a menudo quedan obsoletos antes de que puedan medir eficazmente las nuevas capacidades.
Esto crea una brecha donde los modelos sobresalen en pruebas existentes pero carecen de una evaluación integral de la generalización, la seguridad o los comportamientos emergentes, lo que desafía nuestra capacidad de rastrear y guiar el progreso de manera confiable.
¡El benchmarking de IA por sí solo podría convertirse en una industria masiva en la próxima década!
Gasto en IA
Una de las conclusiones clave para fines de 2024 es que las grandes empresas tecnológicas existentes no podrían satisfacer la demanda de inteligencia artificial.
Se trata de un tema apasionante, ya que pone de relieve una falta total de infraestructura para satisfacer la demanda acumulada en el espacio de la IA.
Por supuesto, en el corto plazo, esto se debe al enorme revuelo en torno a la IA. Sin embargo, este paradigma es completamente diferente y requiere una infraestructura completamente nueva.
Sin embargo, hay mucho más que decir al respecto; lo abordaré en los próximos párrafos. Pero por ahora, tenga en cuenta esta cifra a corto plazo:
La infraestructura de nube existente es la columna vertebral inicial para la IA, ¡pero no es suficiente!
¡Los principales actores de Big Tech están gastando 200 mil millones de dólares solo en 2024 para mejorar la infraestructura y satisfacer la creciente demanda de IA!
La guerra de las nubes está en marcha, ya que la demanda de IA supera la oferta. Las principales empresas tecnológicas gastarán 200 000 millones de dólares solo en 2024 para aumentar la infraestructura y acelerar el ritmo de la demanda de IA.
En el último trimestre, Google Cloud ganó la carrera en términos de crecimiento relativo, aumentando un 35% en el tercer trimestre, superando a AWS y Azure a medida que la demanda de IA impulsa el crecimiento.
Amazon mantiene el liderazgo en ganancias, mientras Microsoft invierte para impulsar la capacidad de IA.
A medida que los chips de IA personalizados y la alta demanda dan forma a una competencia feroz, Oracle se asocia con rivales y amplía el alcance de su base de datos en las principales plataformas de nube.
De todos modos, un recordatorio: Amazon AWS (que este año alcanzó los 100 mil millones de dólares en ingresos):
• Amazon Web Services (AWS): 31% de participación de mercado.
• Microsoft Azure: 25% de participación de mercado.
• Google Cloud: 11% de participación de mercado.
Estas cifras resaltan el liderazgo de AWS y Azure en el mercado de la nube, con Google Cloud creciendo rápidamente pero aún con una participación menor.
Mientras tanto, otros jugadores como Oracle, que son relativamente más pequeños, ¡también están entrando agresivamente!
Mientras tanto, como lo mostró claramente el tercer trimestre de 2024:
- Crecimiento de Google Cloud: Google Cloud lideró la actividad con un crecimiento interanual del 35 % en el tercer trimestre, superando a Amazon y Microsoft. Este crecimiento se considera un cambio clave para Alphabet, que diversifica sus ingresos más allá de la publicidad.
- AWS sigue siendo rentable: Amazon Web Services (AWS) mantiene su liderazgo en ingresos, con un crecimiento del 19 % hasta los 27 450 millones de dólares y un sólido margen operativo del 38 %. La empresa se beneficia de la eficiencia de costes y de la prolongación de la vida útil de los servidores.
- Microsoft y la demanda de IA: Microsoft informó un crecimiento del 33 % en Azure, impulsado por los servicios de IA y las inversiones en OpenAI. Debido a la alta demanda, la capacidad es limitada, pero la inversión en infraestructura de IA apunta a ampliar la disponibilidad a principios de 2025.
- Restricciones de suministro: tanto AWS como Microsoft están limitados por el suministro de chips de IA: Amazon depende en parte de sus chips personalizados, como Trainium 2, y Google avanza en sus TPU personalizados.
- Posición de Oracle: aunque es más pequeña, Oracle experimentó un crecimiento del 45% en la infraestructura de la nube y se ha asociado con Amazon, Microsoft y Google para expandir el alcance de sus bases de datos.
- Competencia e innovación en IA: cada gigante de la nube está desarrollando chips de IA patentados y ampliando la capacidad de IA para satisfacer la demanda, lo que subraya la intensificación de la competencia en el mercado de la nube impulsado por IA.
Permítame mostrarle por qué los centros de datos de IA serán fundamentales…
Centros de datos de IA
Un centro de datos de IA es una instalación especializada diseñada para adaptarse a las intensas demandas computacionales de las cargas de trabajo de inteligencia artificial (IA).
Estos centros de datos admiten implementaciones de alta densidad, soluciones de enfriamiento innovadoras, infraestructura de red avanzada y herramientas modernas de gestión de centros de datos para manejar de manera eficiente los importantes requisitos de energía y almacenamiento de las operaciones de IA.
Como informó Bloomberg , 2024 fue el año de la “fiebre del oro de los centros de datos”. ¡Las grandes empresas tecnológicas invirtieron colectivamente hasta 200 mil millones de dólares solo en este año fiscal para satisfacer la demanda de inteligencia artificial!
De hecho, la explosiva demanda de IA ha provocado un gasto de capital sin precedentes: Amazon, Microsoft, Meta y Alphabet invertirán más de 200 mil millones de dólares en 2024.
En su carrera por construir centros de datos y proteger chips de alta gama, estos gigantes tecnológicos ven la IA como una oportunidad “única en la vida” que transformará sus negocios y su potencial de ingresos futuros.
Y todos los actores de Big Tech con una infraestructura de nube existente tienen bastante clara esta oportunidad:
- Gasto récord en IA: Amazon, Microsoft, Meta y Alphabet superarán los 200 mil millones de dólares en inversiones en IA este año, con el objetivo de proteger chips escasos y construir grandes centros de datos.
- Oportunidad a largo plazo: el director ejecutivo de Amazon, Andy Jassy, describió la IA como una oportunidad “única en la vida”, que impulsa el gasto de capital proyectado de Amazon de 75 mil millones de dólares en 2024.
- Desafíos de capacidad: el crecimiento de la nube de Microsoft se topó con cuellos de botella en el suministro, y las limitaciones del centro de datos afectaron los ingresos de la nube a corto plazo.
- Las ambiciones de Meta en materia de inteligencia artificial: el director ejecutivo de Meta, Mark Zuckerberg, se comprometió a realizar inversiones en inteligencia artificial y realidad aumentada a pesar de las pérdidas operativas de 4.400 millones de dólares en sus Reality Labs.
- Reacción mixta en Wall Street: a pesar del optimismo sobre los retornos de la IA a largo plazo, algunas acciones tecnológicas flaquearon debido a los altos costos, mientras que Amazon y Alphabet subieron gracias a las sólidas ganancias en la nube.
- Intensificación de la competencia: las empresas están apostando a la IA para superar los ingresos tradicionales por publicidad digital y software, lo que hace que la infraestructura impulsada por IA sea una necesidad estratégica en medio de una demanda creciente.
Pero ¿por qué se necesita en primer lugar un centro de datos de IA?
Bueno, si bien la infraestructura actual del centro de datos era funcional para albergar la demanda en la web, los centros de datos de IA son instalaciones especializadas diseñadas para satisfacer las necesidades únicas de las cargas de trabajo de inteligencia artificial, lo que los distingue de los centros de datos tradicionales en varios aspectos clave:
- Requisitos de hardware : las tareas de IA, como el aprendizaje automático y el aprendizaje profundo, requieren recursos informáticos de alto rendimiento. En consecuencia, los centros de datos de IA están equipados con hardware especializado, como unidades de procesamiento gráfico (GPU) y unidades de procesamiento tensorial (TPU), para gestionar cálculos intensivos de manera eficiente.
- Densidad de potencia : el hardware avanzado de los centros de datos de IA genera un consumo de energía por rack significativamente mayor que el de los centros de datos tradicionales. Esta mayor densidad de potencia requiere sistemas de suministro de energía robustos para garantizar un funcionamiento constante y confiable.
- Sistemas de refrigeración : el elevado consumo de energía genera una cantidad considerable de calor, lo que requiere soluciones de refrigeración avanzadas. Los centros de datos de IA suelen implementar sistemas de refrigeración líquida, que son más eficaces que los métodos tradicionales de refrigeración por aire para gestionar la salida térmica de los equipos de alta densidad.
- Infraestructura de red : las cargas de trabajo de IA implican el procesamiento de grandes conjuntos de datos, lo que exige redes de gran ancho de banda y baja latencia para facilitar la transferencia rápida de datos entre los recursos de almacenamiento y de cómputo. Esto requiere una infraestructura de red más robusta y eficiente que la de los centros de datos tradicionales.
- Escalabilidad y flexibilidad : las aplicaciones de IA suelen requerir un escalamiento dinámico para adaptarse a cargas computacionales variables. Los centros de datos de IA están diseñados con arquitecturas modulares que permiten un escalamiento flexible de los recursos, lo que garantiza que puedan adaptarse a las necesidades cambiantes de las cargas de trabajo de IA.
¡Adaptar los centros de datos existentes en Amazon AWS, Microsoft Azure, Google Cloud y muchos otros proveedores podría requerir una inversión de un billón de dólares en la próxima década!
De hecho, la demanda de inteligencia artificial obliga a las grandes empresas tecnológicas a aumentar la infraestructura de sus centros de datos, lo que hace que la demanda energética sea enormemente insostenible a corto plazo. Entonces, ¿qué alternativas están considerando las empresas tecnológicas?
A corto plazo, a medida que estos grandes actores tecnológicos construyen la infraestructura a largo plazo, ya están explorando algunas alternativas energéticas potenciales para alimentar estos centros de datos de IA.
Las grandes tecnológicas están compitiendo para satisfacer las demandas energéticas de la IA de manera sostenible; se han identificado tres vías principales:
- Energía nuclear para energía estable,
- Refrigeración líquida para centros de datos eficientes,
- Y la computación cuántica para futuros avances.
¿Serán suficientes? Probablemente no, pero así es como estamos:
Inversiones en energía nuclear
• Ventajas : proporciona energía constante y a gran escala, lo cual es fundamental para los centros de datos de IA que requieren energía estable las 24 horas del día.
• Desventajas : altos costos iniciales, obstáculos regulatorios y preocupaciones ambientales a largo plazo asociadas con los desechos nucleares.
• Cronograma : ya se están concretando importantes acuerdos por parte de Microsoft, Google y Amazon, y se espera que la energía nuclear respalde las operaciones de IA pronto.
Tecnología de refrigeración líquida
• Ventajas : aumenta la eficiencia energética al reducir eficazmente las temperaturas de los servidores, lo que permite que los centros de datos gestionen mayores densidades de energía.
• Desventajas : los costos iniciales de instalación son altos y el mantenimiento de los sistemas de agua en los centros de datos requiere recursos y planificación adicionales.
• Cronograma : la reciente adquisición de Motivair Corp por parte de Schneider Electric, que ya se está implementando, para expandir las capacidades de refrigeración líquida sugiere una adopción más amplia en los próximos años.
Computación cuántica
• Ventajas : Promete una eficiencia de procesamiento enormemente mayor, permitiendo cálculos complejos de IA con menos energía y potencialmente reduciendo la huella ambiental.
• Desventajas : La tecnología cuántica aún está en sus primeras etapas, y es probable que las aplicaciones prácticas y escalables para uso comercial estén a años de distancia.
• Cronología : Según el director ejecutivo de Quantinuum, Raj Hazra, un cambio comercial que combine la computación de alto rendimiento, la IA y la cuántica podría surgir en un plazo de tres a cinco años.
Estos esfuerzos masivos para crear una infraestructura completamente nueva para la IA podrían generar un desperdicio masivo de energía en el corto plazo y una innovación impresionante en el sector energético para encontrar alternativas para satisfacer la demanda acumulada de IA.
¿Y adivinen qué? A largo plazo, esto también podría provocar una revolución energética que proporcione fuentes de energía baratas para todo lo demás.
Como destacó el cofundador de OpenAI, Sam Altman, en su último artículo titulado “La era de la inteligencia”:
Si queremos poner la IA en manos de la mayor cantidad de personas posible, tenemos que reducir el coste de la computación y hacerla abundante (lo que requiere mucha energía y chips). Si no construimos la infraestructura suficiente, la IA será un recurso muy limitado por el que se librarán guerras y que se convertirá principalmente en una herramienta para los ricos.
Antes de analizar las tendencias clave que darán forma a los próximos 2 o 3 años en IA, quiero referirme a otras dos tendencias importantes: la IA multimodal y la cadena de pensamiento.
IA multimodal
La IA multimodal es un sistema de inteligencia artificial que integra y procesa múltiples entradas de datos, incluidos texto, imágenes, audio y vídeo.
Esta capacidad permite que el sistema genere resultados más precisos y contextualizados al combinar diversas modalidades de datos, lo que lo hace más versátil y eficaz en diversas aplicaciones.
La multimodalidad comenzó como tendencia en 2023 y se consolidó en 2024. En definitiva, todos los sistemas de IA generativa deben combinar elementos multimodales para lograr un nivel de utilidad para la siguiente fase de escala.
Impulso de cadena de pensamiento
Como se explicó, la estimulación en cadena de pensamiento (CoT) es una técnica utilizada para mejorar las capacidades de razonamiento de los modelos de lenguaje grandes (LLM) al exigirles que descompongan problemas complejos en una serie de pasos intermedios lógicos.
Este enfoque imita el razonamiento humano al guiar el modelo a través de los problemas paso a paso, lo que conduce a resultados más precisos e interpretables.
La combinación de multimodalidad y cadena de pensamiento también nos ha impulsado hacia lo que se define como IA Agentic.
agente de IA
La IA agente se refiere a sistemas de inteligencia artificial capaces de actuar y tomar decisiones de forma autónoma.
Estos sistemas, a menudo llamados agentes de IA, pueden perseguir objetivos de forma independiente, tomar decisiones, gestionar situaciones complejas y adaptarse a entornos cambiantes sin intervención humana directa.
Aprovechan técnicas avanzadas como el aprendizaje de refuerzo y los algoritmos evolutivos para optimizar su comportamiento y lograr objetivos específicos establecidos por sus creadores humanos.
Tenga en cuenta que no existe una definición única de IA agente.
La IA agente en entornos académicos podría tener más que ver con la “agencia” o la capacidad de estos agentes de IA para tomar decisiones complejas de forma independiente.
En el ámbito empresarial, durante los próximos años, la IA agente se centrará principalmente en tareas y resultados empresariales específicos que estos agentes puedan lograr en un entorno muy limitado para garantizar que su precisión, fiabilidad y seguridad sean una prioridad.
¿Qué hizo que Agentic AI fuera un poco?
Desde el lanzamiento de GPT-2 en 2019, el paradigma Gen AI se ha basado en indicaciones durante los últimos cinco años.
En resumen, el LLM completaba cualquier tarea en función de una instrucción dada. La calidad del resultado dependía en gran medida de la calidad de la entrada (indicación).
Sin embargo, en las últimas semanas, finalmente hemos visto el surgimiento de Agentic AI, un nuevo tipo de inteligencia artificial que puede resolver problemas complejos de forma independiente utilizando razonamiento y planificación avanzados.
A diferencia de la IA normal, que responde a solicitudes individuales, la IA agente puede gestionar tareas de varios pasos, como mejorar las cadenas de suministro, detectar riesgos de ciberseguridad o ayudar a los médicos con el papeleo.
Funciona recopilando datos, ideando soluciones, realizando tareas y aprendiendo de los resultados para mejorar con el tiempo.
¿Cuáles son las características críticas de Agentic AI en comparación con Prompting?
• Resolución autónoma de problemas: la IA con agentes utiliza razonamiento sofisticado y planificación iterativa para resolver tareas complejas de varios pasos de forma independiente.
• Proceso de cuatro pasos: Percibir (recopilar datos), Razonar (generar soluciones), Actuar (ejecutar tareas a través de API) y Aprender (mejorar continuamente mediante retroalimentación).
• Productividad mejorada: Automatiza tareas rutinarias, lo que permite a los profesionales centrarse en desafíos más complejos, mejorando la eficiencia.
• Integración de datos: Esta técnica utiliza técnicas como la Generación aumentada por recuperación (RAG) para acceder a una amplia gama de datos para obtener resultados precisos y una mejora continua.
¿Cuándo empezó esta ola de IA Agentic?
Todo empezó hace dos años.
De hecho, Chain-of-Thought Prompting (CoT), el artículo que impulsó la actual ola de inteligencia artificial (IA) agentica, recién se publicó a principios de 2022.
Al igual que el artículo Transformer (Attention Is All You Need), que se publicó en 2017 y condujo a ChatGPT, CoT también fue un esfuerzo de los equipos de investigación y cerebro de Google.
El artículo “Chain-of-Thought Prompting” (CoT), publicado a principios de 2022 por investigadores de los equipos de investigación y cerebro de Google, ha sido fundamental para avanzar en las capacidades de los modelos de lenguaje de gran tamaño (LLM).
Esta técnica mejora las capacidades de razonamiento de los LLM guiándolos para generar pasos intermedios que reflejan los procesos humanos de resolución de problemas mediante:
- Capacidades de razonamiento mejoradas: la estimulación CoT permite a los estudiantes de LLM abordar tareas complejas dividiéndolas en pasos secuenciales, mejorando el desempeño en áreas como la aritmética, el razonamiento de sentido común y la manipulación simbólica.
- Habilidades emergentes con escala: La investigación demostró que a medida que los LLM aumentan en tamaño, su capacidad de razonamiento en cadena de pensamiento surge naturalmente, lo que les permite manejar problemas más complejos de manera efectiva.
- Influencia en el desarrollo de IA agencial: el documento de CoT ha inspirado el desarrollo de sistemas de IA agencial capaces de tomar decisiones más autónomas y sofisticadas al mostrar cómo los LLM pueden realizar razonamientos complejos a través de indicaciones estructuradas.
Esta progresión refleja el impacto del artículo de 2017 “La atención es todo lo que necesitas”, que introdujo la arquitectura del transformador y sentó las bases para modelos como ChatGPT.
Ambos artículos subrayan el importante papel que desempeñan los equipos de investigación de Google a la hora de impulsar los avances en IA, en particular en la mejora de las capacidades de razonamiento y comprensión de los modelos lingüísticos.
Y aún así, ¿adivinen qué?
La mayoría de ellos impulsaron a OpenAI desde el punto de vista de la aplicación comercial. El GPT-4o de OpenAI, lanzado en mayo de 2024, incorpora principios de CoT para mejorar sus capacidades de razonamiento.
Al estructurar pautas que estimulen el pensamiento paso a paso, GPT-4o puede manejar de manera más efectiva tareas complejas como la resolución de problemas matemáticos y el razonamiento lógico.
Este enfoque permite que el modelo divida problemas complejos en pasos manejables, lo que conduce a respuestas más precisas y coherentes.
La carrera se ha calentado tanto que, a medida que surgían rumores sobre OpenAI Orion , un modelo de IA de próxima generación desarrollado por OpenAI, ¡se convirtió en un éxito masivo!
OpenAI Orion es el rumoreado modelo de IA de próxima generación desarrollado por OpenAI, diseñado para mejorar significativamente el razonamiento, el procesamiento del lenguaje y las capacidades multimodales.
Se espera que sea 100 veces más potente que GPT-4, con la capacidad de manejar texto, imágenes y videos sin problemas.
Orion, inicialmente pensado para empresas asociadas clave y no para un lanzamiento público amplio, tiene como objetivo revolucionar diversas industrias al brindar capacidades avanzadas de resolución de problemas y comprensión del lenguaje natural.
De esta forma, avanza la visión de OpenAI hacia la inteligencia artificial general (AGI) y las colaboraciones estratégicas con Microsoft Azure.
¡Y OpenAI no está solo en esto!
Después de los rumores de hace unas semanas, parece que Google ha filtrado, aunque sea brevemente, un prototipo de inteligencia artificial, “Jarvis”, diseñado para realizar tareas informáticas como reservar vuelos o comprar.
A pesar de estar disponible temporalmente en la tienda de extensiones de Chrome, la herramienta no funcionó del todo y fue rápidamente eliminada. Google tenía previsto presentar Jarvis en diciembre, uniéndose a competidores como Anthropic y OpenAI en materia de asistencia con IA.
¿Qué pasó allí? Según informó The Information:
- Lanzamiento accidental: Google publicó brevemente un prototipo de inteligencia artificial interno, cuyo nombre en código era “Jarvis”, diseñado para completar tareas en la computadora de una persona.
- Capacidades: Jarvis, un “agente que utiliza computadoras”, tiene como objetivo ayudar con tareas como comprar productos o reservar vuelos.
- Problema de acceso: el prototipo, disponible a través de la tienda de extensiones de Chrome, no funcionó completamente debido a restricciones de permisos.
- Eliminación: Google eliminó el producto a media tarde; estaba previsto su lanzamiento en diciembre junto con un nuevo modelo de idioma.
- Competencia: Anthropic y OpenAI también están desarrollando productos similares de asistencia a tareas de IA.
¿Qué podemos esperar allí?
Inteligencia artificial de Agentic: agentes personales, basados en personajes y de empresa
La definición académica se centra en los agentes de IA como sistemas que razonan y actúan de forma autónoma, y se origina a partir del concepto de “agencia”.
Me encanta la definición de negocio que dio el CEO de Sierra, Bret Taylor, en el podcast No Priors en el episodio número 82, donde explicó que hay, según él, tres tipos principales de agentes que veremos surgir allí:
- Agentes personales : ayudan a las personas con tareas como administrar calendarios o clasificar correos electrónicos.
- Agentes basados en personas : herramientas especializadas para trabajos específicos (por ejemplo, codificación o trabajo legal).
- Agentes de la empresa : IA orientada al cliente que permite a las empresas interactuar digitalmente con sus usuarios.
Más precisamente:
A continuación se muestra el desglose de los tres tipos de agentes, junto con los posibles modelos comerciales para cada uno:
Agentes personales
- Los agentes ayudan a las personas con tareas como administrar calendarios, clasificar correos electrónicos, programar vacaciones y prepararse para reuniones.
- Estado de desarrollo : Etapa inicial; complejo debido a los amplios requisitos de razonamiento y las amplias integraciones de sistemas.
- Desafíos : Alta complejidad en diversidad de tareas e integración con herramientas personales.
- Modelos de negocio potenciales :
- Modelos freemium : ofrecen funciones básicas de forma gratuita, con actualizaciones pagas para integraciones avanzadas y automatización adicional.
- Asociaciones B2B : colabore con proveedores de herramientas de productividad (por ejemplo, Google Workspace, Microsoft 365) para integrar y vender soluciones personalizadas.
- Licencias : Licenciar la tecnología a empresas que creen herramientas o dispositivos de productividad propietarios (por ejemplo, relojes inteligentes, teléfonos).
Agentes basados en personajes
- Agentes especializados adaptados a profesiones o tareas específicas, como asistentes legales, asistentes de codificación o asesores médicos.
- Estado de desarrollo : Maduro en ciertos nichos con alcances de tareas estrechos pero profundos.
- Ejemplos : Harvey para funciones legales y agentes de codificación para el desarrollo de software.
- Ventajas : La ingeniería enfocada y los puntos de referencia agilizan el desarrollo.
- Modelos de negocio potenciales :
- SaaS vertical (software como servicio) : ofrece herramientas de inteligencia artificial específicas del dominio como servicios basados en suscripción dirigidos a profesionales (por ejemplo, abogados, desarrolladores).
- Pago por uso : monetice cobrando según el uso o la cantidad de tareas completadas.
- Licencias empresariales : proporcione agentes personalizados para grandes organizaciones en industrias específicas.
- Integración con Marketplace : integre con plataformas como GitHub (para agentes de codificación) o Clio (para agentes legales) y gane dinero a través de tarifas de plataforma o asociaciones.
Agentes de la empresa
- Los agentes que tratan con el cliente representan a las empresas y permiten tareas como consultas sobre productos, comercio y servicio al cliente.
- Estado de desarrollo : listo para implementarse con la tecnología de IA conversacional actual.
- Visión : Esencial para tener presencia digital para 2025, similar a tener un sitio web en 1995.
- Modelos de negocio potenciales :
- SaaS B2B : ofrece agentes de IA de marca como servicio a las empresas, proporcionando planes de suscripción mensuales o anuales según las características y la escala.
- Precios basados en el rendimiento : cobre a las empresas en función de métricas como la satisfacción del cliente, las tasas de retención o los costos operativos reducidos.
- Soluciones de marca blanca : proporcione plantillas de agentes de IA personalizables que las empresas puedan personalizar como propias.
- Tarifas de integración : gane dinero integrando agentes de IA en los sistemas de CRM, comercio electrónico o soporte existentes de las empresas.
- Reparto de ingresos : para las interacciones relacionadas con el comercio, tome un pequeño porcentaje de las ventas que facilita el agente de IA.
El CEO de Sierra Bret Taylor también enfatizó que veremos a estos agentes evolucionar a niveles de hardware y software.
¿Cuál será el próximo dispositivo que habilitará agentes de IA?
El teléfono inteligente será el “eje central de la IA” en la fase inicial
Si bien, con el tiempo, la IA podría permitir un paradigma de hardware y un factor de forma totalmente nuevos, vale la pena recordar que el primer paso hacia la integración de la IA está ocurriendo dentro del ecosistema de teléfonos inteligentes existente.
En resumen, el teléfono inteligente seguirá siendo el “eje central de la IA” en los próximos años hasta que evolucione un nuevo factor de forma nativo.
Sin embargo, en los próximos 3-5 años, el iPhone seguirá siendo una plataforma clave para el desarrollo inicial de la IA.
Tomemos el iPhone con inteligencia artificial (datos de tendencias a continuación):
En los últimos modelos de iPhone de Apple, específicamente el iPhone 16, Apple integró capacidades avanzadas de inteligencia artificial (IA) conocidas como ” Apple Intelligence ” (datos de tendencias a continuación):
Apple Intelligence es un conjunto de capacidades de inteligencia artificial generativa desarrolladas por Apple e integradas en sus productos, incluidos iPhone, Mac y iPad.
Aún así, este sistema mejorará características como Siri, escritura, creación de imágenes y funcionalidades de asistente personal en sus etapas iniciales.
Su objetivo es simplificar y acelerar las tareas cotidianas priorizando al mismo tiempo la privacidad del usuario a través del procesamiento en el dispositivo y la computación en la nube privada.
Mientras tanto, el teléfono inteligente será el primer dispositivo en renovarse por completo antes de que veamos el surgimiento de dispositivos nativos de IA, como la combinación de AR con ellos.
Por ahora, en el sector de los teléfonos inteligentes, la revolución de la IA en ellos se está moviendo hacia la hiperpersonalización, y cada actor le da su propio toque:
- Apple defiende la privacidad con inteligencia artificial en el dispositivo
- Samsung mejora el rendimiento a través de optimizaciones inteligentes,
- Google eleva la fotografía con mejoras sorprendentes,
- Huawei añade herramientas prácticas para facilitar el día a día.
Cada marca aporta funciones únicas impulsadas por IA, convirtiendo los teléfonos en poderosos asistentes personales.
A continuación se muestra el desglose de la estrategia de IA de cada jugador de teléfono inteligente:
- Apple iPhone: Apple se centra en combinar la privacidad con capacidades avanzadas de inteligencia artificial. Con su plataforma Apple Intelligence, el iPhone ofrece herramientas como un modelo de lenguaje para la gestión de correo electrónico y documentos y funciones creativas como Image Playground y Genmoji. El firme compromiso de Apple con el procesamiento en el dispositivo minimiza la transmisión de datos, lo que resulta atractivo para los usuarios preocupados por la privacidad.
- Samsung Galaxy: El Galaxy S24 Ultra de Samsung, con el chipset Exynos, destaca por su alto rendimiento con núcleos optimizados por IA. Su función Scene Optimizer para cámara ajusta automáticamente la configuración para varias escenas, mientras que la optimización inteligente del rendimiento mejora la capacidad de respuesta y extiende la duración de la batería, lo que lo convierte en una opción sólida para usuarios avanzados.
- Google Pixel: conocido por su fotografía, su chip Tensor potencia funciones como Magic Eraser para eliminar objetos en las fotos, zoom mejorado con IA y fotografía con poca luz. El chatbot Gemini mejora la comunicación, brindando subtítulos, transcripción y traducción en tiempo real, lo que posiciona a Pixel como la mejor opción para los aficionados a la fotografía y la comunicación.
- Serie Huawei Pura 70: la IA de Huawei se centra en mejoras prácticas. Con funciones como Ampliar imagen para rellenar el fondo, Reparación de sonido para mejorar la calidad de las llamadas y un asistente Celia mejorado para el reconocimiento de imágenes, Huawei ofrece soluciones de IA del mundo real para la comodidad diaria.
¿Reaparición de los asistentes inteligentes para reducir el tiempo frente a la pantalla?
Como les mostraré más adelante en la investigación, a medida que nos acercamos al año 2024, Apple, Google y Amazon están trabajando “en secreto” en la renovación de sus asistentes inteligentes.
La ola comenzó hace una década cuando estos grandes actores tecnológicos intentaron dominar el mercado de los “asistentes de voz” y terminaron siendo una promesa incumplida.
Estos asistentes no están cumpliendo sus promesas. Tomemos como ejemplo Siri, que resultó ser un fracaso a largo plazo debido a su falta de utilidad.
Sin embargo, ¿veremos el renacimiento de estos dispositivos a través de la IA generativa?
Por ejemplo, los altavoces inteligentes (por ejemplo, Alexa, Siri, Google Home) y los auriculares pueden volverse fundamentales en los flujos de trabajo diarios.
Las interfaces conversacionales en estos dispositivos podrían permitir una interacción fluida y sin pantallas para tareas como programar, enviar recordatorios o recuperar información.
Más allá del formato del teléfono inteligente
Sin embargo, es posible que en la próxima década descubramos nuevos formatos. De hecho, si bien el teléfono inteligente seguirá siendo el dispositivo informático principal para la mayoría de los usuarios, la forma en que interactuamos con él está evolucionando.
La IA conversacional y las interfaces multimodales se integrarán perfectamente en las experiencias cotidianas, reduciendo nuestra dependencia de las pantallas.
Evolución de las experiencias del cliente
Como también enfatizó el CEO de Sierra Bret Taylor, podríamos ver estas tendencias interesantes con los agentes de IA:
- Los agentes como puertas de entrada digitales :
así como los sitios web se convirtieron en la puerta de entrada digital de una empresa en la década de 1990, los agentes de IA conversacional se convertirán en el modo principal de interacción en 2025. Estos agentes manejarán las consultas de servicio al cliente y, eventualmente, administrarán todas las interacciones con las empresas, como la exploración de productos, las transacciones y el soporte posventa. - Interacciones hiperpersonalizadas :
los agentes de IA ofrecerán experiencias personalizadas, ajustando su tono, contenido y funcionalidad en función de las preferencias y el historial del usuario. Por ejemplo, un agente de IA para una marca de lujo podría adoptar un tono más formal y refinado, mientras que uno para un minorista informal podría utilizar un lenguaje amigable y conversacional. - Ecosistemas centrados en el cliente :
la naturaleza en tiempo real de los agentes conversacionales permite a las empresas responder con mayor agilidad a las necesidades de los clientes. Por ejemplo, si un minorista presenta un nuevo producto, un agente de IA puede adquirir instantáneamente el conocimiento necesario e incorporarlo a las interacciones, algo que llevaría semanas implementar en un centro de llamadas tradicional.
IA soberana
Como la IA requiere inversiones masivas, muchos países recurren a una estrategia soberana de IA para ponerse rápidamente al día en esta carrera frenética.
La IA soberana es la capacidad de una nación para desarrollar y utilizar tecnologías de inteligencia artificial (IA) de forma independiente, apoyándose en sus propios recursos, como infraestructura, datos, fuerza laboral y redes comerciales.
Este enfoque promueve la autosuficiencia tecnológica, la seguridad nacional y la competitividad económica al permitir a los países controlar y personalizar soluciones de IA adaptadas a sus necesidades y características regionales.
El modelo de Dinamarca
Tomemos el caso de la “IA soberana” de Dinamarca, financiada con un modelo interesante en el que el éxito de medicamentos como Ozempic se está utilizando para construir una supercomputadora de IA masiva para estimular y acelerar la investigación en el ámbito de la atención sanitaria.
La nueva supercomputadora de inteligencia artificial de Dinamarca, Gefion, financiada por el éxito del fármaco para bajar de peso de Novo Nordisk, está preparada para transformar la innovación nacional.
Gefion, impulsado por las GPU de última generación de Nvidia, acelerará los avances en atención médica, biotecnología y computación cuántica, posicionando a Dinamarca como líder en “IA soberana” para impulsar el crecimiento económico y científico.
Dinamarca utilizó el siguiente modelo:
- Modelo de financiación único: la nueva supercomputadora de inteligencia artificial de Dinamarca, Gefion, se financió con las ganancias obtenidas de los exitosos medicamentos para bajar de peso de Novo Nordisk, Ozempic y Wegovy. Por lo tanto, es la primera supercomputadora de inteligencia artificial impulsada por el éxito farmacéutico.
- Potente infraestructura de inteligencia artificial: construida con las GPU de primer nivel de Nvidia, Gefion tiene como objetivo apoyar a las empresas, investigadores y emprendedores daneses en campos como la atención médica, la biotecnología y la computación cuántica, superando las barreras típicas de los altos costos y el acceso limitado a la potencia informática.
- Asociación público-privada: La inversión de 100 millones de dólares provino de una colaboración entre la Fundación Novo Nordisk y el Fondo de Exportación e Inversión de Dinamarca, lo que señala la importancia estratégica de la IA para la innovación nacional de Dinamarca.
- Visión de IA soberana: el director ejecutivo de Nvidia, Jensen Huang, aboga por una “IA soberana” y considera a Gefion como un modelo para las naciones que utilizan la infraestructura de IA para aprovechar los datos nacionales como recurso e impulsar el crecimiento económico.
- Impacto en el descubrimiento de fármacos: Novo Nordisk anticipa ganancias significativas de Gefion en el descubrimiento de fármacos y el diseño de proteínas, aprovechando capacidades computacionales avanzadas para acelerar los avances médicos y científicos.
El modelo japonés
O tomemos el caso de NVIDIA y SoftBank, que están transformando el panorama de la IA de Japón con una nueva y poderosa supercomputadora y la primera red de telecomunicaciones 5G impulsada por IA del mundo.
Esta innovadora AI-RAN desbloquea miles de millones de dólares en ingresos al convertir las redes de telecomunicaciones en centros de IA inteligentes, respaldando aplicaciones desde vehículos autónomos hasta robótica y creando un mercado de IA nacional seguro.
Están trabajando en:
- Supercomputadora de IA: SoftBank está construyendo la supercomputadora de IA más poderosa de Japón utilizando la plataforma Blackwell de NVIDIA. El proyecto tiene como objetivo mejorar las capacidades soberanas de IA y apoyar a las industrias en todo Japón.
- Avance de AI-RAN: SoftBank y NVIDIA lanzaron la primera red de telecomunicaciones 5G e IA del mundo, AI-RAN. Esta red permite a los operadores de telecomunicaciones transformar las estaciones base en activos generadores de ingresos de IA mediante la monetización de la capacidad de red no utilizada.
- Mercado de IA: SoftBank planea un mercado de IA utilizando NVIDIA AI Enterprise, ofreciendo computación de IA localizada y segura para satisfacer la demanda nacional.
- Aplicaciones en el mundo real: AI-RAN permite aplicaciones como soporte remoto para vehículos autónomos y control robótico, demostrando un rendimiento de IA y 5G de nivel de operador.
- Potencial de ingresos: NVIDIA y SoftBank proyectan hasta un 219 % de retorno de la inversión (ROI) para servidores AI-RAN y $5 en ingresos de IA por cada $1 de gasto de capital invertido en la infraestructura AI-RAN.
El modelo de los Emiratos Árabes Unidos
O bien, tomemos el modelo de los EAU centrado en:
- “Sandbox regulatorio” para IA : según el director ejecutivo de OpenAI, Sam Altman, los Emiratos Árabes Unidos están posicionados como un banco de pruebas global para las tecnologías de IA.
- La inversión de 1.500 millones de dólares de Microsoft : la financiación de G42, una importante empresa emiratí de inteligencia artificial, demuestra una importante colaboración entre Estados Unidos y los Emiratos Árabes Unidos.
- Asociación global de inversión en infraestructura de inteligencia artificial : involucra a Microsoft, BlackRock, Mubadala y otros para impulsar el crecimiento relacionado con la IA.
- Enfoque en tecnología avanzada : la colaboración entre los Emiratos Árabes Unidos y los EE. UU. enfatiza la IA como un impulsor clave para la innovación económica.
- La IA en el reajuste económico : la IA es fundamental para el cambio de los EAU de los sectores tradicionales (petróleo y defensa) a industrias centradas en el futuro.
- Asociaciones estratégicas en el desarrollo de IA : refuerza el compromiso de los EAU de alinearse estrechamente con la experiencia estadounidense en IA y tecnologías emergentes.
El modelo del Reino Unido
Por el contrario, otros países están intentando controlar el desarrollo de la IA mediante la regulación. Por ejemplo, el Reino Unido lanzó una nueva plataforma de seguridad de la IA, con el objetivo de liderar a nivel mundial la evaluación de riesgos de la IA.
La iniciativa, que ofrece recursos para un uso responsable de la IA, apoya a las empresas en la comprobación de sesgos y las evaluaciones de impacto. Con asociaciones y una visión de crecimiento, el Reino Unido busca convertirse en un centro de garantía de la IA de confianza.
En resumen, podemos aprender de estos como modelos potenciales de IA soberana:
- Dinamarca : Única en aprovechar las ganancias del éxito farmacéutico (Ozempic y Wegovy) para financiar infraestructura de IA, lo que refleja una estrategia de reinversión directa de las ganancias de la industria.
- Japón : se centra en la monetización de la infraestructura de telecomunicaciones (AI-RAN) para transformar los activos de red en flujos de ingresos, mostrando innovación en el aprovechamiento de sectores existentes para la financiación de IA.
- EAU : atrae inversión extranjera (Microsoft, BlackRock) y enfatiza las asociaciones para integrar la experiencia global, representando un modelo de colaboración internacional.
- Reino Unido : Financiación liderada por el Gobierno que enfatiza la seguridad regulatoria y las asociaciones, mostrando un enfoque cauteloso y consciente del riesgo para el desarrollo de la IA.
Robótica con IA
La robótica con inteligencia artificial es un campo que combina la inteligencia artificial (IA) con la robótica.
Permite a los robots realizar tareas complejas de forma autónoma mediante la integración de algoritmos de IA para tareas de reconocimiento de objetos, navegación y toma de decisiones.
Esta integración mejora las capacidades de los robots, permitiéndoles imitar la inteligencia humana y adaptarse a entornos cambiantes de manera más efectiva.
La robótica con IA es crucial para aplicaciones como vehículos autónomos, fabricación de precisión y sistemas avanzados de automatización del hogar.
Pero esta vez es muy diferente por una sencilla razón: ¡también estamos entrando en una revolución de propósito general en robótica!
Introduzca la robótica de propósito general a través del modelado mundial
El modelado del mundo es un paso crucial para el siguiente paso en la evolución de la IA.
La próxima frontera de la robótica de propósito general depende de la evolución de “modelos mundiales” o mapas/representaciones ambientales basados en IA, que permitirán a los robots predecir interacciones y navegar en entornos complejos y dinámicos de manera eficaz.
Todos los grandes actores tecnológicos importantes están invirtiendo masivamente en él.
Por ejemplo, NVIDIA acaba de anunciar nuevos avances en modelado mundial que transformarán la forma en que los robots entienden e interactúan con su entorno.
Los robots ahora pueden anticipar y adaptarse mejor a escenarios del mundo real mediante la construcción de representaciones detalladas de entornos impulsadas por IA.
Este avance permite a los robots realizar tareas con mayor conciencia y precisión, lo que posibilita una automatización más inteligente y parecida a la humana en todas las industrias.
Como resultado, sectores como la logística, la atención médica y el comercio minorista se beneficiarán de robots más capaces y más adaptables a entornos diversos y complejos.
¿Por qué es importante?
- Mayor comprensión del entorno: los robots pueden construir representaciones de su entorno impulsadas por IA, lo que les permite predecir cómo responderán los objetos y los entornos a sus acciones.
- Precisión similar a la humana : al “comprender” su entorno, los robots logran movimientos más precisos y naturales, acercándolos a las interacciones humanas.
- Amplio impacto en la industria : este avance tiene potencial transformador en la logística, la atención médica, el comercio minorista y más, ya que los robots pueden manejar una gama más amplia de tareas con mayor precisión.
- Automatización escalable : el modelado del mundo favorece una automatización más inteligente y eficiente, allanando el camino para robots que realizan tareas, aprenden y se adaptan en tiempo real.
Otro aspecto es la destreza.
¿Por qué la destreza se ha convertido en el “santo grial” de la robótica de uso general?
Los humanos damos por sentada nuestra destreza, pero, en esta etapa, es uno de los desafíos más difíciles de la robótica. Si se resuelve, este problema puede crear la próxima industria de un billón de dólares, ya que abriría el espacio a la robótica de uso general.
De hecho, la destreza de los robots es un desafío porque requiere que manipulen objetos diversos y delicados en entornos impredecibles, algo que los humanos hacemos instintivamente.
Para lograrlo se necesitan sensores sofisticados, aprendizaje automático y capacidad de adaptación en tiempo real para evitar dañar objetos o fallar en las tareas. A diferencia de las tareas repetitivas y controladas, la destreza implica adaptarse a formas, texturas y pesos únicos en entornos dinámicos.
Esta complejidad ha hecho que la destreza robótica sea un “santo grial” en robótica, ya que es esencial para automatizar tareas como clasificar, empacar o incluso ayudar en la atención médica, donde la precisión y la adaptabilidad humanas son fundamentales.
Resolverlo podría desbloquear nuevos niveles de automatización en todas las industrias, transformando el trabajo y la eficiencia.
Es por eso que una empresa como Physical Intelligence obtuvo una financiación de 400 millones de dólares liderada por Jeff Bezos para intentar revolucionar la robótica permitiendo que los robots manipulen objetos con una precisión similar a la humana.
Su innovador software pi-zero permite a los robots adaptarse y realizar tareas complejas de forma autónoma, lo que promete impactos transformadores en la logística, la atención médica y más allá, pero aumenta las implicaciones laborales.
Esto demuestra un impulso impresionante en este campo ya que:
- Inversión en robótica de precisión: con el respaldo de Jeff Bezos y otros, Physical Intelligence obtuvo 400 millones de dólares para mejorar la destreza robótica, con el objetivo de darles a los robots un toque similar al humano. Este avance podría transformar la logística, el comercio minorista y otros sectores al permitir que los robots manipulen diversos objetos.
- Software Pi-zero : El nuevo software de control de la startup, pi-zero, utiliza el aprendizaje automático para permitir que los robots realicen tareas complejas, como doblar la ropa, empaquetar la compra e incluso sacar las tostadas de la tostadora. Permite que los robots se adapten en tiempo real, lo que mejora su adaptabilidad en entornos impredecibles.
- Impacto más amplio en la industria: esta innovación aborda desafíos clave de automatización a medida que las empresas buscan soluciones en medio de la escasez de mano de obra, especialmente en almacenamiento y venta minorista. La tecnología también tiene potencial para la agricultura, la atención médica y la hospitalidad, donde los robots podrían manejar tareas que requieren mucha mano de obra o de apoyo, lo que podría reducir los roles manuales.
- Impulso de la industria en robótica con inteligencia artificial: Amazon, Walmart y SoftBank están implementando robots inteligentes para manejar tareas de cumplimiento, inventario y servicio al cliente. Estos robots realizan tareas repetitivas o que requieren mucha mano de obra, lo que permite que los empleados humanos se concentren en tareas de nivel superior.
La inteligencia espacial es la próxima frontera
La inteligencia espacial, a través del modelado del mundo, está dando pasos impresionantes.
El último robot Atlas de Boston Dynamics muestra su capacidad autónoma en este vídeo. Mueve piezas de automóviles con sensores adaptativos y sin teleoperación. Atlas realiza ajustes en tiempo real, orientados al trabajo en fábricas de automóviles.
El robot Atlas de Boston Dynamics es impresionante porque demuestra verdadera autonomía en tareas complejas: seleccionar y mover piezas de automóviles sin guía humana.
Se adapta a los cambios ambientales, como cambios en la posición de los objetos o fallos de acción, utilizando sensores avanzados y ajustes en tiempo real.
Este nivel de independencia, especialmente en entornos fabriles dinámicos, establece un estándar alto para la robótica, ya que la mayoría de los competidores todavía dependen de acciones preprogramadas o controladas a distancia.
Los movimientos eficientes y potentes de Atlas ahorran tiempo y demuestran su potencial para transformar la automatización industrial con velocidad y adaptabilidad.
Pero por supuesto, ¡un recordatorio: esto es solo una demostración!
Como os he mostrado hasta ahora, la robótica de propósito general experimentará un desarrollo increíble en la próxima década.
Sin embargo, este es un recordatorio clave, ya que todavía hay muchas limitaciones y no sabemos aún en qué etapa de desarrollo de estos modelos mundiales nos encontramos.
Un estudio interesante que surgió del MIT y Harvard realmente “puso a prueba” los LLM en relación con el modelado mundial.
A partir de ahí, los investigadores del MIT y Harvard revelan que los grandes modelos de lenguaje (LLM) carecen de una comprensión coherente del mundo y funcionan bien sólo dentro de parámetros establecidos.
Utilizando nuevas métricas, descubrieron que los modelos de IA pueden realizar tareas pero fallan cuando las condiciones cambian, lo que subraya la necesidad de contar con modelos de comprensión del mundo adaptables y basados en reglas.
Según el estudio:
- Resultados de la investigación: Los investigadores del MIT y Harvard descubrieron que los grandes modelos de lenguaje (LLM) pueden realizar tareas como dar instrucciones de manejo con gran precisión, pero carecen de una verdadera comprensión de la estructura del mundo subyacente. El rendimiento del modelo disminuyó significativamente cuando se enfrentó a cambios, como el cierre de calles.
- Nuevas métricas para los modelos mundiales: el equipo desarrolló dos métricas (distinción de secuencias y compresión de secuencias) para probar si los modelos de IA tienen “modelos mundiales” coherentes. Estas métricas ayudaron a evaluar qué tan bien los modelos comprenden las diferencias y similitudes entre los estados en un entorno estructurado.
- Implicaciones : El estudio sugiere que los modelos de IA actuales pueden funcionar bien en contextos específicos, pero fallar si el entorno cambia. Para las aplicaciones de IA en el mundo real, los modelos necesitan una comprensión más sólida y basada en reglas.
- Direcciones futuras: Los investigadores pretenden probar estas métricas en problemas más diversos, incluidos conjuntos de reglas parcialmente conocidos, para construir una IA con modelos mundiales precisos y adaptables, que podrían ser valiosos para tareas científicas y del mundo real.
Así que tengamos esto en cuenta…
Y para recapitular:
- Robótica de propósito general : centrada en robots que manejan diversas tareas con adaptabilidad a diversas industrias.
- NVIDIA Advances : desarrollo de modelos mundiales impulsados por IA para mejorar la conciencia y la precisión robótica.
- Boston Dynamics Atlas : mostró el trabajo de fábrica autónomo con adaptabilidad en tiempo real en piezas móviles de automóviles.
- Destreza en robótica : un desafío clave que requiere que los robots manipulen diversos objetos en entornos impredecibles.
- Inteligencia física (pi-zero) : software financiado con 400 millones de dólares que permite una destreza robótica similar a la humana para tareas como empaquetar y brindar asistencia sanitaria.
- Investigación del MIT y Harvard : descubrieron que la IA tiene dificultades para afrontar los cambios dinámicos del mundo real, lo que pone de relieve las lagunas en su comprensión sólida del mundo.
- Inteligencia espacial : mejora las capacidades robóticas en tareas que requieren conocimiento y adaptación ambiental precisa.
- Impacto más amplio en la industria : aplicaciones en logística, atención médica, comercio minorista y agricultura, que abordan la escasez de mano de obra y mejoran la eficiencia.
Mientras tanto, a finales de 2024, asistimos a una impresionante explosión de “humanoides”.
Un robot humanoide está diseñado para parecerse al cuerpo humano en forma y función, y generalmente presenta torso, cabeza, brazos y piernas.
Estos robots están creados para imitar el movimiento y la interacción humanos, lo que les permite realizar tareas que requieren una forma y un movimiento similares a los humanos, como caminar, hablar e interactuar con entornos.
¡A partir de 2024, el sector ya cuenta con un amplio conjunto de empresas trabajando en el problema!
Aquí es donde estamos ahora mismo, con una lista de los principales actores en el campo de los robots humanoides:
- Atlas HD (Boston Dynamics)
- NEO (1X, Noruega)
- GR-1 (Fourier, Singapur)
- Figura 01 (EE.UU.)
- Phoenix (Sanctuary AI, Canadá)
- Apollo (Apptronik, Estados Unidos)
- Digit (Agilidad, Estados Unidos)
- Atlas (Boston Dynamics, Estados Unidos)
- H1 (Unitree, China)
- Optimus Gen 2 (Tesla, EE. UU.)
Más precisamente:
- Atlas de Boston Dynamics : un robot humanoide totalmente eléctrico y altamente dinámico diseñado para aplicaciones del mundo real. Atlas cuenta con un sistema de control avanzado y hardware de última generación que le permite realizar movimientos y tareas complejos con agilidad y precisión.
- Salvius : un proyecto de robot humanoide de código abierto centrado en la creación de una plataforma versátil para la investigación y el desarrollo. Salvius está diseñado con una especificación de ingeniería con versiones para garantizar que cada componente cumpla con un estándar mínimo de funcionalidad antes de la integración.
- Figura 02 de Figure AI : el robot humanoide de segunda generación desarrollado por Figure AI, diseñado para establecer nuevos estándares en inteligencia artificial y robótica. La Figura 02 combina una destreza similar a la humana con inteligencia artificial de vanguardia para brindar soporte a diversas industrias, incluidas la fabricación, la logística, el almacenamiento y el comercio minorista.
- Optimus de Tesla : un robot humanoide diseñado por Tesla para realizar tareas inseguras, repetitivas o aburridas para los humanos. Optimus pretende aprovechar la experiencia de Tesla en inteligencia artificial y robótica para crear un asistente robótico versátil y capaz.
- H1 de Unitree Robotics : el primer robot humanoide universal de Unitree, H1, es un robot bípedo de tamaño real capaz de correr. H1 representa un avance significativo en la robótica humanoide, ya que apunta a integrarse en varias aplicaciones gracias a su movilidad y adaptabilidad avanzadas.
- Roboy : Un robot humanoide avanzado desarrollado en el Laboratorio de Inteligencia Artificial de la Universidad de Zúrich. Roboy está diseñado para emular los movimientos e interacciones humanas, con aplicaciones en la investigación y el desarrollo de la robótica blanda y la interacción entre humanos y robots.
- RH5 : Un robot humanoide híbrido en serie y paralelo diseñado para un alto rendimiento dinámico. RH5 puede realizar tareas dinámicas de alta exigencia con cargas significativas, utilizando sistemas de control avanzados y técnicas de optimización de trayectoria.
- NimbRo-OP2X : un robot humanoide de código abierto, asequible, de tamaño adulto y fabricado mediante impresión 3D, desarrollado para fines de investigación. NimbRo-OP2X tiene como objetivo reducir la barrera de entrada para la investigación de robots humanoides, proporcionando una plataforma flexible para diversas aplicaciones y estudios.
Así, el desarrollo de robots humanoides avanza rápidamente, con importantes inversiones y avances tecnológicos.
¡Estos robots tienen el potencial de transformar industrias al automatizar tareas, abordar la escasez de mano de obra y aumentar la eficiencia como casos de uso iniciales!
Casa inteligente con IA
Una casa inteligente con IA (Inteligencia Artificial) se refiere a una residencia equipada con dispositivos conectados a Internet que utilizan aprendizaje automático e inteligencia artificial para automatizar y controlar varios aspectos de la casa.
Estos dispositivos pueden aprender los hábitos y preferencias de los habitantes, brindando un servicio personalizado y eficiente.
Los ejemplos incluyen sistemas controlados por voz que ajustan la iluminación, la temperatura y la configuración de seguridad según el comportamiento del usuario y dispositivos que optimizan el uso de energía y ofrecen asistencia proactiva a través del análisis de datos.
Y a medida que nos acercamos al final de 2024, Apple podría lanzar un dispositivo AI Smart Wall.
Desarrollado con Apple Intelligence, ofrece funcionalidad centrada en Siri y gestión perfecta del hogar inteligente, con sensores, incluidos sensores de proximidad que ajustan la información mostrada en función de la distancia del usuario.
¿Por qué es importante?
Cuando Apple intenta entrar en un nicho de mercado mediante el lanzamiento de un nuevo dispositivo, encuentra una “cabeza de playa” que le permitiría crear un nuevo mercado escalable.
Y lo está haciendo en un segmento dominado por Google con sus dispositivos Nest.
Vehículos autónomos
Los vehículos autónomos están equipados con tecnologías avanzadas, incluidos sensores, cámaras, radares e inteligencia artificial, que les permiten funcionar con una intervención humana mínima o nula.
Estos vehículos pueden navegar por carreteras, tráfico y entornos sin necesidad de conductor, utilizando datos de varios sensores para tomar decisiones y controlar las acciones del vehículo.
Están diseñados para reducir la congestión del tráfico, disminuir los índices de accidentes y mejorar la movilidad de diversos grupos. Sin embargo, los vehículos totalmente autónomos todavía están en fase de prueba y aún no están ampliamente disponibles.
Nos encontramos en un punto de inflexión allí.
Waymo es una de las joyas ocultas de Google, ahora Alphabet.
La empresa de conducción autónoma, nacida como parte de otras apuestas de Google sobre el futuro, acaba de recaudar 5.600 millones de dólares y alcanzar un hito crítico de 150.000 viajes autónomos pagos por semana.
Ahora, Waymo está ingresando a la IA completamente autónoma al aprovechar la infraestructura Gemini de Google a través de su Modelo Multimodal de Extremo a Extremo para Conducción Autónoma (EMMA).
Los LLM como EMMA, impulsado por Gemini de Waymo, podrían cambiar las reglas del juego para los autos autónomos al ofrecer una base holística de “conocimiento mundial” más allá de los datos de conducción estándar, permitiendo que los autos comprendan y predigan escenarios complejos.
En resumen, los LLM utilizan un razonamiento avanzado y se adaptan a entornos inesperados, lo que los hace más flexibles y efectivos en condiciones del mundo real.
Este cambio de sistemas modulares a modelos de extremo a extremo podría reducir los errores acumulados y mejorar la toma de decisiones, acercando la conducción autónoma a una implementación fluida y segura a gran escala.
Por supuesto, esto está sólo en una fase embrionaria y dentro de unos años conoceremos su verdadero potencial.
Mientras tanto, ¿cómo aborda Waymo el problema de los vehículos autónomos?
- Aprovechamiento del MLLM Gemini de Google: el modelo de Waymo se basa en el modelo de lenguaje grande multimodal (MLLM) Gemini de Google, lo que marca un paso significativo para utilizar IA avanzada en aplicaciones de conducción del mundo real, expandiendo potencialmente los usos de los MLLM más allá de los chatbots y los asistentes digitales.
- Beneficios del modelo de extremo a extremo: a diferencia de los sistemas modulares tradicionales que separan las tareas (por ejemplo, percepción, mapeo, predicción), el modelo de extremo a extremo de EMMA integra estas funciones, lo que podría reducir errores y mejorar la adaptabilidad a entornos de conducción nuevos o inesperados.
- Razonamiento superior: EMMA utiliza un “razonamiento en cadena de pensamiento”, imitando el procesamiento lógico paso a paso similar al humano, mejorando las capacidades de toma de decisiones, particularmente en situaciones viales complejas, como zonas de construcción o cruces de animales.
- Limitaciones y desafíos: EMMA actualmente enfrenta limitaciones en el procesamiento de entradas 3D (como lidar y radar) y en el manejo de muchos cuadros de imágenes. Además, los MLLM como Gemini pueden tener problemas de confiabilidad en condiciones de alto riesgo, lo que plantea riesgos para la implementación en el mundo real.
- Investigación futura y precaución: Waymo reconoce los desafíos de EMMA y enfatiza la necesidad de continuar investigando para mitigar estos problemas antes de una implementación a gran escala.
Además, los LLM están cambiando fundamentalmente la conducción autónoma al añadirle capacidades de razonamiento para ajustar mejor sus acciones en el mundo real y la capacidad de revertir/auditar errores.
El nuevo modelo básico de Waymo combina inteligencia artificial avanzada con experiencia de conducción en el mundo real, integrando grandes modelos de lenguaje y visión-lenguaje para impulsar la inteligencia de los vehículos autónomos.
Esta innovación permite al Waymo Driver interpretar escenas complejas, predecir comportamientos y adaptarse en tiempo real, estableciendo nuevos estándares de seguridad y confiabilidad en la conducción autónoma.
¿Cómo?
- IA impulsada por misiones: Waymo aspira a ser el “conductor más confiable del mundo” y resuelve desafíos complejos de IA para crear una experiencia de vehículo autónomo (VA) segura y confiable.
- Modelos de inteligencia artificial de vanguardia: el modelo básico de Waymo integra datos de conducción con modelos de lenguaje amplio y de lenguaje visual, lo que mejora la interpretación de escenas, la predicción del comportamiento y la planificación de rutas.
- Simulación e iteración rápida: la infraestructura de alta potencia de Waymo y la simulación de circuito cerrado permiten una iteración rápida, probando escenarios de conducción realistas para refinar las capacidades del modelo.
- Seguridad a escala: Al servicio de cientos de miles de pasajeros, la inteligencia artificial impulsada por la seguridad de Waymo mejora constantemente con cada milla recorrida, respaldada por rigurosos métodos de evaluación.
- Compromiso con la innovación futura: Waymo ve un inmenso potencial en el futuro y alienta a los talentos en IA a abordar desafíos innovadores en conducción autónoma, robótica e IA incorporada.
¿Realmente hemos llegado a la etapa en la que esto puede ampliarse? Tal vez…
tengo musica
La música con IA se refiere a composiciones musicales, producciones o interpretaciones creadas o asistidas por algoritmos de inteligencia artificial.
Estos algoritmos analizan vastos conjuntos de datos musicales, aprenden patrones y generan piezas originales o emulan estilos específicos, transformando diversos aspectos de la producción musical, desde la composición hasta la interpretación.
Las herramientas musicales de inteligencia artificial ayudan en tareas como la mezcla, la masterización y el diseño de sonido, al tiempo que mejoran la accesibilidad y la personalización de la música para los oyentes.
Recientemente se supo que YouTube comenzó a experimentar con una función de música con inteligencia artificial implementada dentro de sus cortos:
- Expansión musical con IA : el experimento “Dream Track” ahora incluye una opción de remezcla con IA para pistas seleccionadas, lo que permite bandas sonoras personalizadas de 30 segundos.
- Recordatorios de transmisiones en vivo en Shorts : los recordatorios automáticos para transmisiones en vivo programadas ahora aparecen en los feeds de Shorts 24 horas antes de que comience la transmisión.
- Actualizaciones de conversión de Shorts : los videos de menos de 3 minutos, subidos después del 15 de octubre, se clasificarán como Shorts . La conversión en toda la plataforma se completará el próximo mes .
¿Qué potencial tiene y qué implicaciones para la industria musical?
- Mayor descubrimiento de música : las remezclas de canciones populares realizadas con inteligencia artificial permiten a los creadores reimaginar las pistas en diferentes géneros y estados de ánimo, lo que aumenta la exposición del artista original. Las pistas se vuelven interactivas, lo que alienta a los oyentes a participar de manera creativa y potencialmente impulsa las métricas de streaming y compra.
- Nuevas fuentes de ingresos para los artistas : la atribución garantiza que los artistas conserven el reconocimiento y las regalías por las variaciones de su trabajo generadas por IA. También abre oportunidades para licenciar remixes generados por IA para anuncios, contenido y videos generados por usuarios.
- Democratización creativa : las herramientas de inteligencia artificial permiten a los creadores independientes acceder a capacidades de remezcla profesional, lo que iguala las condiciones con las grandes discográficas. Esto podría dar lugar a una explosión de microgéneros y remezclas experimentales, lo que ampliaría los límites creativos.
- Posibles desafíos : complejidades en materia de derechos de autor : determinar la propiedad y las regalías de los contenidos generados por IA podría requerir nuevos marcos legales. También existe el riesgo de sobresaturación, ya que las remezclas infinitas diluyen la singularidad de las pistas originales.
¿Qué entra en el bolsillo de YouTube?
- Mayor compromiso :
- Las remezclas de música con inteligencia artificial hacen que los cortos sean más dinámicos y atractivos, lo que genera una mayor retención de espectadores y un aumento de las impresiones de anuncios.
- Los recordatorios de transmisión en vivo dentro de Shorts conectan sin problemas las ofertas de contenido más amplias de los creadores, lo que mejora la participación entre plataformas.
- Nuevas oportunidades publicitarias :
- Bandas sonoras personalizadas para anuncios : las marcas podrían encargar remixes generados por IA adaptados a sus campañas, alineando los anuncios más de cerca con el público objetivo.
- Anuncios interactivos : las marcas pueden integrar funciones de remezcla de IA en sus campañas, lo que permite a los usuarios personalizar las pistas de música asociadas con el anuncio.
- Monetización de creadores mejorada :
- Los creadores que aprovechan las herramientas de inteligencia artificial para la música pueden atraer audiencias más grandes, aumentando la eficacia de los anuncios mid-roll y pre-roll.
- La integración de cortos con transmisiones en vivo ofrece a los anunciantes un enfoque doble: dirigirse tanto a las audiencias de formatos cortos como a las de contenido en vivo.
- Ecosistema de licencias de música más amplio :
- Los remixes de IA podrían agilizar los procesos de licencia para los anunciantes, ya que YouTube garantiza la atribución adecuada y el manejo de regalías dentro de su ecosistema.
Generación de videos con IA
La generación de videos con inteligencia artificial se ha convertido en un elemento básico del paradigma actual de la inteligencia artificial. De hecho, la capacidad de convertir todo en tokens también ha hecho posible un avance impresionante en el ámbito de la generación de imágenes y videos.
La tokenización en el contexto de la generación de videos de IA implica dividir los datos de video en componentes estructurados más pequeños (tokens) que un modelo puede procesar.
Esto es similar a cómo los modelos de lenguaje grandes (LLM) procesan el texto, pero los tokens en la generación de video representan elementos visuales, temporales y, a veces, de audio.
Por lo tanto, es fundamental comprender cómo la generación de video en IA es inherentemente un problema multimodal, que requiere la integración y sincronización de texto, audio y video para crear resultados coherentes y de alta calidad.
Generación de videos con IA: el caso de uso comercial de Hollywood
Por ejemplo, recientemente Meta lanzó un generador de video Gen AI que es capaz de crear películas reales, incluida la música:
El mensaje era: “Un oso koala peludo surfea. Tiene un pelaje gris y blanco y una nariz redonda. La tabla de surf es amarilla. El oso koala sostiene la tabla de surf con sus patas. La expresión facial del oso koala es concentrada. El sol brilla”. Crédito del GIF: Meta
Este es el ejemplo perfecto de cómo Meta logró, a través de su modelo ahora de IA, combinar múltiples tipos de datos en un todo.
Se muestra cómo Meta logró:
- Cree videos realistas a partir de indicaciones de texto breves, convirtiendo escenas imaginativas en contenido visual (por ejemplo, un koala surfeando o pingüinos con trajes victorianos)
- Edite videos existentes , agregue fondos y modifique atuendos conservando el contenido original.
- Genere vídeos basados en imágenes e integre fotos de personas en películas creadas por IA.
Además, en el lado del audio:
- Se presentó un generador de audio de parámetros 13B que agrega efectos de sonido y bandas sonoras basadas en entradas de texto simples (por ejemplo, “susurro de hojas”).
- Actualmente limitado a 45 segundos de generación de audio , pero capaz de sincronizar sonidos con imágenes.
Lo interesante es que Meta está dirigido a Hollywood y a los creadores , combinando casos de uso profesionales y casuales.
Es por eso que Meta colaboró con cineastas y productores de video durante el desarrollo.
Sin embargo, si bien la generación de videos con IA está progresando rápidamente en esta etapa, vale la pena recordar que aún no está disponible para uso público debido a los altos costos y los largos tiempos de generación .
Además, un problema crítico de todos estos generadores de imágenes y vídeos de IA es la comprensión limitada de las fuentes de datos de entrenamiento, lo que genera controversias.
En el caso de Meta, es posible que el modelo haya sido entrenado con contenido generado por el usuario y fotografías de las plataformas Meta (por ejemplo, Facebook y las gafas inteligentes Ray-Ban de Meta).
Meta no es la única que avanza rápidamente en la parte de generación de videos con IA para creadores.
De hecho, compite con otras herramientas de video de IA como Gen 3 de RunwayML y Sora de OpenAI, pero ofrece capacidades adicionales como edición de video y audio integrado.
Todos estos actores tienen como objetivo a los creativos como usuarios principales de estas próximas plataformas.
Generación de video con IA: el caso de uso comercial de productividad
Otro ángulo crítico de la generación de videos con IA acaba de surgir de Google: Google Vids está disponible para los usuarios de Workspace Labs y Gemini Alpha y se espera que esté disponible de manera general para fines de año.
Las características principales incluyen:
- Guión gráfico asistido por IA: utiliza la tecnología Gemini de Google para generar esquemas editables con escenas sugeridas, contenido multimedia y música de fondo según las indicaciones y los archivos del usuario.
- Estudio de grabación en el producto: permite a los usuarios grabarse a sí mismos, sus pantallas o audio con un teleprompter incorporado para ayudarlos a transmitir mensajes con confianza.
- Amplia biblioteca de contenido: proporciona acceso a millones de recursos multimedia de alta calidad y libres de regalías, incluidas imágenes y música, para enriquecer el contenido de video.
- Opciones de personalización: ofrece una variedad de plantillas adaptables, animaciones, transiciones y efectos fotográficos para personalizar y mejorar los videos.
- Colaboración perfecta: permite compartir y editar de forma colaborativa fácilmente dentro del entorno de Google Workspace, de forma similar a Documentos, Hojas de cálculo y Presentaciones.
¡El caso de uso de productividad también tiene un potencial enorme!
Aspectos destacados de la generación de vídeo con IA
Base tecnológica
- Tokenización : el proceso de dividir el video en componentes más pequeños (tokens), como elementos visuales, temporales y de audio, lo que permite que la IA procese datos multimodales.
- Integración multimodal : la sincronización de tokens de texto, audio y video es esencial para crear resultados coherentes y de alta calidad.
Casos de uso comercial
Hollywood y la industria creativa
- Generador de videos Gen AI de Meta :
- Genera vídeos realistas a partir de indicaciones de texto (por ejemplo, un koala surfeando).
- Permite la edición de video , agregar fondos y modificar elementos manteniendo el contenido original.
- Integra generación de audio (modelo de parámetros 13B), sincronizando sonidos y bandas sonoras con elementos visuales.
- Colabora con cineastas y productores de video, dirigiéndose a creadores profesionales y ocasionales.
- Limitaciones:
- Costos elevados y tiempos de generación largos.
- Posibles controversias sobre el uso de datos de entrenamiento provenientes de contenidos generados por el usuario.
Competidores :
- Gen 3 de RunwayML y Sora de OpenAI también están avanzando en este espacio, apuntando a los creadores pero con diferentes características y áreas de enfoque.
Google Vids (caso de uso de productividad) :
- Guión gráfico asistido por IA : genera esquemas, escenas y música editables según las indicaciones del usuario.
- Estudio de grabación en el producto : cuenta con grabación asistida por teleprompter para una presentación segura.
- Amplia biblioteca de contenidos : acceso a millones de recursos multimedia libres de regalías.
- Personalización : Plantillas adaptables, animaciones y efectos para personalización.
- Colaboración : uso compartido y edición fluidos dentro de Google Workspace.
Limitaciones y desafíos
- Restricciones de acceso : Muchas herramientas, como el generador de video de Meta, aún no están disponibles públicamente debido a limitaciones de costo y procesamiento.
- Preocupaciones éticas : Transparencia limitada con respecto a las fuentes de datos de capacitación, lo que plantea posibles problemas legales y éticos.
Implicaciones para la industria
- Público objetivo : principalmente creadores, cineastas y empresas que buscan contenido personalizado de alta calidad.
- Potencial futuro : Las herramientas que avanzan rápidamente pueden democratizar la creación de videos, impactando en industrias como el entretenimiento, el marketing y la educación.
Publicidad con IA
A medida que nos acercamos al final de 2024, otra conclusión clave surgió de las finanzas de los principales actores tecnológicos en el espacio publicitario, como Google, Meta y TikTok: la IA asociada a sus plataformas publicitarias puede crear un aumento masivo de ingresos en el corto plazo, ¡como una fruta al alcance de la mano para estas empresas!
El potencial de los anuncios de inteligencia artificial de Alphabet
Según sus últimos informes financieros del tercer trimestre de 2024, para 2025, Alphabet intensificará aún más la integración de anuncios en sus funciones de búsqueda impulsadas por inteligencia artificial.
De hecho, según los últimos informes de ganancias, los avances de inteligencia artificial de Alphabet están transformando la búsqueda, integrando anuncios dentro de nuevos resúmenes impulsados por inteligencia artificial para una mejor monetización.
El aumento del gasto de capital en 2025 resalta el compromiso de Alphabet con la IA a medida que se diversifica más allá de los ingresos publicitarios tradicionales.
¿Cómo está integrando Alphabet (Google) la IA en sus plataformas publicitarias?
- Las inversiones en inteligencia artificial impulsan el crecimiento: las inversiones en inteligencia artificial de Alphabet han impulsado sus negocios de búsqueda y nube, y los ingresos de la nube aumentaron un 35 %, el ritmo más rápido en ocho trimestres. Aumento de los ingresos por publicidad: las ventas de publicidad en YouTube fueron sólidas, en parte debido al gasto en las elecciones estadounidenses, y los ingresos por publicidad generales de Alphabet alcanzaron los 65.850 millones de dólares.
- Se planean mayores gastos de capital: el director financiero Anat Ashkenazi anunció que el gasto de capital aumentará en 2025, lo que refleja el compromiso de Alphabet con la inteligencia artificial y la expansión de la nube.
- La nube como diversificador de ingresos: la nube está compensando cada vez más la desaceleración del crecimiento en el negocio publicitario de Alphabet, lo que ayuda a diversificar las fuentes de ingresos en medio de la creciente competencia de Amazon y TikTok.
- Nuevas funciones de anuncios impulsadas por IA: Google está integrando anuncios en resúmenes de búsqueda impulsados por IA, mejorando la experiencia del usuario y la monetización al resumir el contenido con IA generativa.
Además, Google también está integrando IA en su plataforma de análisis.
Por ejemplo, los nuevos agentes de Google Looker impulsados por GenAI transforman el análisis de datos con información proactiva, análisis automatizado y resultados confiables.
Al aprovechar LookML para lograr una consistencia de datos confiable en toda la organización y el modelo Gemini de Google, la inteligencia artificial agente de Looker tiene como objetivo empoderar a todos los usuarios, más allá de los especialistas, para que puedan acceder y actuar sobre información valiosa sin problemas, redefiniendo la inteligencia empresarial.
¿Cómo está integrando Google la IA en la arquitectura de su Looker?
- Inteligencia artificial agente para análisis proactivo: los agentes de Looker impulsados por GenAI pueden realizar tareas complejas de forma independiente, como sugerir preguntas de seguimiento, identificar anomalías de datos y recomendar métricas.
- Capa semántica para datos confiables: los agentes de Looker aprovechan LookML, una capa semántica, para garantizar que los resultados de IA sean consistentes y confiables en toda la organización, lo que la distingue de la competencia.
- Análisis conversacional: la característica principal de Looker permite a los usuarios hacer preguntas sobre sus datos con confianza, gracias a respuestas de IA basadas en una base de datos confiable.
- Integración con Google Gemini: la funcionalidad GenAI de Looker se basa en el modelo Gemini de Google, lo que mejora capacidades como grandes ventanas de contexto, lo que permite obtener información más profunda y una integración perfecta.
- Visión futura para BI: Looker tiene como objetivo hacer que las herramientas de BI sean más accesibles y reveladoras para todos los empleados, no solo para los especialistas, mejorando el análisis impulsado por IA y centrándose en la confiabilidad y el razonamiento sofisticado.
¿Qué pasa con Meta?
Estrategia de anuncios Meta AI
¿Cómo ha afectado la integración de IA en la plataforma Meta Ads a su balance y al ecosistema de publicidad digital?
En el tercer trimestre de 2024, los ingresos por publicidad de Meta aumentaron un 19% hasta los 39.890 millones de dólares, impulsados por un aumento del 7% en las impresiones de anuncios y un aumento del 11% en los precios de los anuncios.
El director ejecutivo, Mark Zuckerberg, atribuye este crecimiento a los avances en inteligencia artificial, que mejoraron la orientación y la relevancia de los anuncios, impulsando a los anunciantes a gastar más debido al aumento de la rentabilidad.
En resumen, surgió una tendencia clave que debemos observar con atención para el próximo año:
- Tendencia clave: aumento de los ingresos por publicidad impulsados por mejoras impulsadas por IA en la segmentación y los precios.
- Crecimiento de los ingresos por publicidad: los ingresos por publicidad crecieron un 19 % año tras año, alcanzando los $39,89 mil millones en el tercer trimestre de 2024.
- Aumento de impresiones de anuncios: la cantidad de impresiones de anuncios aumentó un 7 %, lo que demuestra una mayor participación en las plataformas de Meta.
- El aumento del precio de los anuncios se debe a una mejor segmentación: el precio promedio por anuncio aumentó un 11 %, lo que refleja una mejor monetización y segmentación.
- El papel de la IA: el director ejecutivo Mark Zuckerberg destacó que los avances de la IA han mejorado la relevancia y la entrega de anuncios, lo que contribuyó al aumento de los ingresos por publicidad.
En resumen, tanto Google como Meta pueden agregar unos cientos de miles de millones a su capitalización de mercado en los próximos 2-3 años simplemente integrando IA como una capa adicional dentro de sus plataformas publicitarias.
Esto está claro ya que estas empresas están apostando por la IA dentro de sus plataformas publicitarias.
Y no están solos…
Estrategia de anuncios de IA de TikTok
TikTok también ha lanzado un conjunto de herramientas para habilitar la IA dentro de su ecosistema publicitario.
Estas soluciones impulsadas por IA incluyen herramientas como TikTok Symphony Creative Studio, que puede generar videos listos para TikTok con una mínima participación del usuario, y Creative Assistant, que ofrece sugerencias basadas en datos para mejorar el rendimiento de la campaña.
Las herramientas de inteligencia artificial ayudan a los anunciantes a optimizar sus procesos de creación y segmentación de anuncios, mejorando la eficacia y la eficiencia de sus campañas de marketing en TikTok.
Symphony Creative Studio de TikTok ahora está disponible para todos los usuarios de TikTok for Business.
Las características incluyen:
- Vídeos generados por IA : los usuarios pueden ingresar información, recursos o URL para crear vídeos utilizando medios con licencia.
- Avatares de IA :
- Utilice avatares de stock o personalizados con un script para generar videos.
- Las marcas pueden cargar videos de personas reales para crear avatares personalizados que representen la propiedad intelectual de la marca, sus portavoces o sus creadores.
- Traducción y doblaje de vídeo : admite la adaptación de contenido a varios idiomas.
- Vídeos generados automáticamente : basados en la actividad anterior de los anunciantes en TikTok.
Aspectos clave de la IA en la publicidad
Estrategia de anuncios con inteligencia artificial de Alphabet (Google)
- Anuncios de búsqueda mejorados con IA : integración de anuncios en resúmenes de búsqueda impulsados por IA para una mejor monetización.
- Ingresos publicitarios récord : los ingresos publicitarios del tercer trimestre de 2024 alcanzaron los 65.850 millones de dólares, impulsados por YouTube y el gasto electoral.
- Crecimiento de los ingresos de la nube : los ingresos de la nube crecieron un 35%, diversificando las fuentes de ingresos.
- Actualización de Looker Analytics : información impulsada por IA con LookML y Google Gemini para una inteligencia empresarial confiable.
Estrategia de anuncios Meta AI
- Aumento de los ingresos por publicidad : los ingresos por publicidad del tercer trimestre de 2024 crecieron un 19% hasta los 39.890 millones de dólares.
- Impresiones de anuncios mejoradas : aumento del 7 % en las impresiones de anuncios gracias a la interacción mejorada mediante IA.
- Precios de anuncios más altos : aumento del 11 % en los precios de los anuncios gracias a una mejor segmentación.
- Aumento del ROI impulsado por IA : la relevancia y la entrega mejoradas de los anuncios aumentaron el gasto de los anunciantes.
Estrategia de anuncios de IA de TikTok
- Symphony Creative Studio : vídeos de TikTok generados por IA con una participación mínima de los anunciantes.
- Asistente creativo : sugerencias basadas en datos para optimizar el rendimiento de las campañas.
- Localización de videos : herramientas de traducción y doblaje en varios idiomas para un alcance global.
- Campañas generadas automáticamente : recomendaciones basadas en IA adaptadas a la actividad de los anunciantes.
El factor de forma del hardware de IA
Como destaqué en la investigación anterior, los teléfonos inteligentes, principalmente el iPhone, realmente servirán como el primer “centro de inteligencia artificial” para la primera ola de adopción masiva.
Sin embargo, con el tiempo, encontraremos nuevos factores de forma nativos de la IA.
Algunas de estas implicarán convertirla en una pantalla que siempre tengas contigo (gafas AR) o una pantalla que desaparezca, permitiendo que sucedan cosas en segundo plano (interfaces cerebro-computadora) o, mejor aún, la Inteligencia Ambiental podría convertirse en una buena alternativa.
Sin embargo, un hecho es que ésta parece ser la década en la que las gafas AR finalmente se volverán viables.
Sin embargo, aunque esta podría ser la década de las gafas de realidad aumentada, como les mostraré, es posible que sean solo un factor de transición, antes de llegar a algo mucho más radical (como las interfaces cerebro-computadora). O tal vez algo más, como la IA ambiental, donde no es necesario usar una interfaz en absoluto.
Voy a hablar de ambos…
Gafas de realidad aumentada
Las gafas de realidad aumentada son dispositivos portátiles que incorporan tecnología de realidad aumentada para superponer contenido digital a la visión del mundo real del usuario. Por lo general, cuentan con pantallas, sensores y cámaras integrados para mejorar la realidad con información digital.
Las gafas de realidad aumentada no son nuevas. ¡Google lanzó las primeras gafas de realidad aumentada en 2012!
Al final esto fue un fracaso rotundo.
Se han escrito innumerables artículos sobre el tema, discutiendo cómo el mal momento, el costo, la interfaz extraña y otros factores podrían haber contribuido a su fracaso.
Sin embargo, el ecosistema AR/VR ha explotado.
Con los principales actores del espacio, como Snapchat, lanzando sus nuevas gafas.
Meta está lanzando un concepto impresionante llamado Meta Orion.
¿Qué pasa con Apple?
Como el Vision Pro de Apple no logró escalar, la compañía está cambiando rápidamente su dirección para lograr que su esfuerzo en AR funcione.
De hecho, Apple está explorando el potencial de las gafas inteligentes con un nuevo estudio interno, cuyo nombre código es “Atlas”, cuyo objetivo es recopilar comentarios de los empleados sobre los productos existentes.
La iniciativa, liderada por el equipo de Calidad de Sistemas de Productos de Apple, sugiere que Apple podría ingresar a la categoría de gafas inteligentes, actualmente dominada por Meta.
Con grupos de discusión adicionales planificados, Apple está evaluando cómo podría mejorar y diferenciar sus ofertas en este espacio emergente de tecnología portátil.
En breve:
- Entrada en el mercado de wearables AR/VR: el proyecto “Atlas” de Apple muestra su interés en el mercado de wearables AR/VR, específicamente en las gafas inteligentes, donde Meta actualmente lidera.
- Estudio interno: La iniciativa implica recopilar comentarios de los empleados de Apple sobre las gafas inteligentes existentes, lo que ayuda a Apple a comprender las necesidades y preferencias de los usuarios.
- Enfoque en la calidad del producto: dirigido por el equipo de Calidad de sistemas de productos, el estudio destaca la prioridad de Apple en los altos estándares de hardware y la funcionalidad perfecta.
- Potencial de integración con el ecosistema: Apple probablemente apunta a fabricar gafas inteligentes que se integren sin problemas con su ecosistema, creando una experiencia de usuario única vinculada a otros productos de Apple.
- Estrategia para entrar en mercados establecidos: De manera similar a sus incursiones anteriores en reproductores de MP3, teléfonos inteligentes y relojes inteligentes, Apple podría estar tomándose tiempo para refinar su enfoque y evitar los problemas observados en los anteojos inteligentes actuales.
- Ventaja competitiva: la posible entrada de Apple podría desafiar el dominio de Meta en la categoría, generando nueva competencia y posiblemente mayores expectativas de rendimiento y diseño.
Aspectos más destacados de las gafas AR
- Mediante pantallas, sensores y cámaras integrados, las gafas AR superponen contenido digital a la vista del mundo real.
- Google Glass Legacy : lanzado en 2012, fracasó debido a sus altos costos, funcionalidad limitada y mal momento.
- Meta Orion : gafas conceptuales con capacidades de AR avanzadas, cuyo objetivo es redefinir la experiencia de AR.
- Proyecto “Atlas” de Apple :
- Recopilación de comentarios internos para perfeccionar las futuras gafas inteligentes AR.
- Prioriza los altos estándares de hardware y la integración perfecta del ecosistema.
- Su objetivo es desafiar el dominio de Meta en los wearables AR.
- Crecimiento explosivo del mercado : la adopción de AR/VR se expande rápidamente en todas las industrias y aplicaciones de consumo.
- Desafíos : Los altos costos, los casos de uso limitados y la fuerte competencia obstaculizan la adopción masiva.
- Potencial futuro : Las gafas de RA podrían convertirse en una tecnología portátil transformadora, que combine las realidades físicas y digitales.
Interfaz cerebro-computadora
Una interfaz cerebro-computadora (BCI) es un sistema que detecta y analiza las señales neuronales del cerebro, traduciéndolas en comandos para controlar dispositivos externos como computadoras, miembros robóticos o dispositivos protésicos.
Esta tecnología permite a los usuarios comunicarse e interactuar con máquinas únicamente a través del pensamiento, a menudo utilizando sensores para capturar señales electrofisiológicas de las neuronas del cerebro.
Aunque por ahora esto parece ciencia ficción, hay un progreso impresionante.
Si bien el caso de uso inicial se centra en brindar apoyo a personas con enfermedades específicas, esto podría escalar hasta convertirse en una interfaz clave en los próximos 10 a 20 años.
La pregunta principal es si este factor de forma puede llegar a ser escalable.
Sin embargo, existe una alternativa que podría resultar mucho más atractiva durante los próximos 10 a 20 años…
Inteligencia ambiental
La inteligencia ambiental (AmI) se refiere a entornos electrónicos que son sensibles y responden a la presencia de personas.
Integra tecnologías como IoT, IA y redes de sensores para crear espacios conscientes del contexto del usuario y pueden adaptarse para satisfacer sus necesidades sin comandos explícitos, mejorando la vida cotidiana con interacciones fluidas y personalizadas.
En este caso específico, no sería necesario utilizar ninguna interfaz; la IA se integraría perfectamente en el entorno.
Aspectos destacados: el formato del hardware de IA
Observaciones generales
- El teléfono inteligente como primer centro de inteligencia artificial : el iPhone lidera la primera ola de adopción masiva de IA, pero están surgiendo nuevos formatos.
- Factores de forma futuros : incluyen gafas de realidad aumentada, interfaces cerebro-computadora y entornos de inteligencia ambiental.
Gafas de realidad aumentada
- Definición : Dispositivos portátiles que superponen contenido digital a la vista del mundo real con pantallas, sensores y cámaras integrados.
- Google Glass Legacy : se lanzó en 2012, pero fracasó debido a sus altos costos y poca usabilidad.
- Meta Orion : Gafas AR conceptuales que apuntan a una integración digital avanzada.
- Proyecto “Atlas” de Apple :
- Los grupos de discusión internos recopilan comentarios para perfeccionar las gafas inteligentes.
- Prioriza la integración perfecta en el ecosistema de Apple.
- Busca desafiar el dominio del mercado de Meta.
- Tendencias actuales :
- Crecimiento explosivo del ecosistema AR/VR.
- Los desafíos incluyen el costo, los casos de uso limitados y la competencia.
- Fase de transición hacia tecnologías más avanzadas como BCIs o inteligencia ambiental.
Interfaces cerebro-computadora (BCI)
- Definición : Sistemas que detectan y analizan señales cerebrales, traduciéndolas en comandos para controlar dispositivos externos.
- Aplicaciones :
- Permite la interacción con máquinas únicamente a través del pensamiento.
- Apoya a usuarios con prótesis o extremidades robóticas.
- Desafíos :
- La escalabilidad sigue siendo incierta.
- El progreso tecnológico es significativo pero aún no generalizado.
Inteligencia ambiental (AmI)
- Definición : Entornos que se adaptan a los usuarios a través de IoT, IA y redes de sensores, ofreciendo interacciones fluidas y personalizadas.
- Características principales :
- No hay necesidad de interfaces portátiles.
- Integra la IA directamente en el entorno para lograr experiencias naturales y conscientes del contexto.
- Potencial :
- Puede superar a la tecnología portátil en conveniencia y adopción.
- Se centra en la creación de ecosistemas “invisibles” impulsados por IA.
Perspectivas de futuro
- Las gafas AR pueden dominar esta década como un factor de forma de transición.
- Las innovaciones a largo plazo como las BCI y la inteligencia ambiental tienen potencial transformador para redefinir la interacción entre humanos e IA.
Principales macrotendencias empresariales de la IA para 2025
1. Escalado de IA
- Los modelos están expandiendo su capacidad, aprovechando innovaciones en datos (sintéticos, seleccionados), poder de cómputo y algoritmos.
- Técnicas como la generación aumentada por recuperación (RAG) mejoran las aplicaciones de IA especializadas.
- Desarrollo continuo en arquitecturas de inferencia y métodos de post-entrenamiento, como la estimulación en cadena de pensamiento (CoT).
2. IA multimodal
- Integración de texto, imágenes, vídeo y audio para crear sistemas de IA más versátiles.
- Permitiendo aplicaciones avanzadas como generación de video, toma de decisiones autónoma y comprensión contextual.
3. Agente IA
- Surgimiento de sistemas autónomos capaces de razonar, planificar y aprender en múltiples pasos.
- Las aplicaciones incluyen agentes personales, agentes basados en personajes (por ejemplo, asistentes legales o de codificación) y agentes de la empresa para servicio al cliente.
4. Centros de datos de IA
- Inversiones masivas (200 mil millones de dólares en 2024) en centros de datos de IA especializados con chips de alto rendimiento, sistemas de refrigeración e infraestructura escalable.
- Exploración de soluciones energéticas sostenibles como la energía nuclear y la refrigeración líquida.
5. IA soberana
- Naciones que desarrollan infraestructuras de IA independientes para impulsar la soberanía económica y tecnológica.
- Ejemplos: la supercomputadora de inteligencia artificial centrada en la atención médica de Dinamarca, las redes de telecomunicaciones 5G impulsadas por IA de Japón y el banco de pruebas global de IA de los Emiratos Árabes Unidos.
6. Robótica de propósito general
- Avances en el modelado del mundo y la destreza que permiten a los robots adaptarse a entornos complejos.
- Actores clave: Boston Dynamics, Tesla (Optimus) y Physical Intelligence (pi-zero).
7. Publicidad con IA
- La segmentación y optimización de anuncios mejorada mediante inteligencia artificial impulsa un importante crecimiento de los ingresos para plataformas como Google, Meta y TikTok.
- Integración de IA en búsquedas, herramientas creativas y análisis.
8. Generación de música y videos con IA
- Herramientas impulsadas por IA para guiones gráficos de video, edición y creación de contenido multimodal.
- Aplicaciones en Hollywood (Gen AI de Meta) y productividad (Google Vids).
- Música con inteligencia artificial que mejora las oportunidades de personalización, descubrimiento y monetización.
9. Vehículos autónomos
- Centrarse en modelos de extremo a extremo para una toma de decisiones fluida.
10. Gafas de realidad aumentada y hardware de inteligencia artificial
- Gafas de realidad aumentada como Meta Orion y el proyecto “Atlas” de Apple como factores de forma de transición para la interacción con IA.
- Exploración de interfaces cerebro-computadora (BCI) e inteligencia ambiental para experiencias de usuario de próxima generación.
11. Innovación energética
La creciente demanda de energía de la IA estimula la innovación en soluciones energéticas sostenibles, lo que podría conducir a una revolución energética.
Conclusiones
La revolución de la IA se está acelerando y generando cambios profundos en todas las industrias. En 2025, tendencias como la IA multimodal, los sistemas de agentes, la robótica avanzada y la IA soberana transformarán los panoramas empresariales, impulsando la productividad y creando nuevas oportunidades. La escalabilidad de la IA, los centros de datos especializados y las innovaciones en infraestructura energética respaldarán este rápido crecimiento. Los vehículos autónomos, las gafas de realidad aumentada y la IA generativa en video y música están transformando las experiencias de los clientes y las industrias creativas. Empresas como Google, Meta y Waymo están liderando con soluciones impulsadas por la IA, mientras que las iniciativas de IA soberana garantizan la competitividad nacional. Esta década marca un cambio fundamental hacia ecosistemas de IA más inteligentes, autónomos e integrados sin problemas.