Los líderes empresariales no necesitan convertirse en programadores para prosperar en la era de la IA.

por Myles Suer

David De Cremer, autor de ” El líder experto en IA “, argumenta que la clave para los líderes no es la fluidez en Python ni el dominio de las redes neuronales, sino una comprensión fundamental de la inteligencia artificial. De Cremer cree que los líderes deben centrarse en comprender los principios de la IA, la mecánica del aprendizaje automático y las implicaciones éticas que conlleva. Se trata de ver el panorama general.

Dicho esto, los líderes expertos en IA deben poseer un dominio básico de la estadística y el modelado. No se trata de ejecutar regresiones ni perfeccionar algoritmos, sino de comprender el lenguaje de los datos y cómo los modelos predicen resultados. Los líderes con este conocimiento fundamental están capacitados para formular las preguntas correctas, interpretar la información con precisión, reconocer si se están utilizando los datos correctos y tomar decisiones estratégicas fundamentadas tras la información obtenida.

También están posicionados para ayudar en la implementación de la IA. Normalmente, aquí es donde las organizaciones tropiezan, y es por eso que un liderazgo experto en IA puede marcar la diferencia. Los líderes que comprenden lo que implica implementar la IA —desde la preparación de los datos hasta el entrenamiento de modelos y las garantías éticas— tienen muchas más probabilidades de abordar las complejidades de los proyectos de IA. El mensaje de De Cremer es claro: la función de un líder es saber cómo utilizar la IA eficazmente.

¿Qué es la IA? Guía para líderes

La inteligencia artificial (IA) ha sido un tema central en los debates tecnológicos desde 1959, con pioneros como Marvin Minsky, del MIT, que imaginaron máquinas capaces de imitar la cognición humana. Mi propia trayectoria con la IA comenzó a principios de los 80, trabajando en sistemas que fueron revolucionarios en aquel momento. Pero ¿qué es exactamente un sistema de IA hoy en día? Y, más importante aún, ¿qué no lo es?

La IA abarca tecnologías diseñadas para automatizar procesos empresariales y crear sistemas inteligentes. La IA abarca un espectro de innovaciones, como la ciencia de datos, el aprendizaje automático (ML) , la IA generativa (GenAI) y la nueva frontera: la IA agencial. En esencia, la IA aprovecha la estadística, el modelado, el aprendizaje automático, el aprendizaje profundo, las redes neuronales y la minería de datos para analizar información y realizar predicciones sobre eventos futuros o desconocidos. Veamos ahora el significado de estos términos para que pueda comprender las capacidades de la IA.

Aprendizaje automático: El aprendizaje automático (ML) busca patrones en los datos para mejorar el rendimiento en tareas específicas, basándose en la observación previa de dichos patrones. El ML destaca al trabajar con datos estructurados: información perfectamente organizada en formatos predefinidos, como filas y columnas. Tomemos como ejemplo una hoja de cálculo de Excel. Su principal fortaleza reside en el modelado predictivo: permite realizar pronósticos precisos basados ​​en patrones históricos de datos.

Aprendizaje profundo: El aprendizaje profundo es una forma más compleja de aprendizaje automático que procesa grandes volúmenes de datos mediante el procesamiento de redes neuronales multicapa. Los datos se organizan de la misma manera que creemos o entendemos que el cerebro humano organiza los recuerdos. Es “profundo” porque los datos fluyen a través de numerosas capas antes de alcanzar un resultado. Esto le permite reconocer patrones complejos y realizar predicciones sofisticadas.

IA generativa: A diferencia de los modelos de IA tradicionales que predicen resultados, la IA generativa puede crear nuevo contenido: texto, imágenes, vídeos e incluso audio. Aprende de los conjuntos de datos existentes y produce resultados sintetizados basados ​​en lo que ha visto en los conjuntos de datos de aprendizaje. Además, es especialmente potente con los datos no estructurados adecuados, como voz, vídeo y texto libre.

IA Agentic: Los sistemas de IA Agentic pueden tomar decisiones, actuar y resolver problemas de forma autónoma con mínima intervención humana. Los agentes van más allá de la simple generación de respuestas, imitando los procesos de toma de decisiones de los empleados humanos basándose en datos y procesos históricos. Comprenden el contexto, establecen objetivos, ejecutan tareas y se adaptan dinámicamente a los cambios.

Diferentes escenarios requieren distintos tipos de IA. El análisis predictivo y el aprendizaje automático son ideales para optimizar las cadenas de suministro, gestionar el riesgo y mejorar el conocimiento del cliente. El aprendizaje profundo es revolucionario en campos que requieren reconocimiento de patrones, como el diagnóstico sanitario y la detección de fraudes. La IA generativa está transformando las industrias creativas, permitiendo la generación rápida de contenido, mientras que la IA agente está ampliando los límites de las operaciones autónomas y la automatización y el aumento de la fuerza laboral digital.

Para ser justos, estas tecnologías se basan en una sólida base arquitectónica de datos: la nube y la pila de datos moderna. Esto incluye plataformas de datos en la nube, mecanismos de ingesta de datos, almacenes de datos o lakehouses, una capa semántica de metadatos y gobernanza. Estos elementos son cruciales para implementaciones de IA escalables y seguras, un tema que analizaremos con más detalle en el próximo artículo.

Fundamentos del aprendizaje automático

La base del aprendizaje automático es el desarrollo de modelos que identifican patrones de datos y realizan predicciones. Este proceso se basa en métodos estadísticos como el análisis de regresión y la minimización de errores. En resumen, un modelo es una representación simplificada de la realidad, diseñada para destacar aspectos críticos de sistemas complejos. Un modelo bien construido, como aprendí en una clase de modelado en la escuela de posgrado, no se limita a imitar procesos del mundo real; revela información interesante y, a menudo, inesperada. Un modelado eficaz se adapta a conjuntos de problemas específicos, lo que le permite abordar desafíos específicos con precisión y claridad.

Las tareas clave para el desarrollo de modelos de ML incluyen:

  • Identificación y análisis de características: descubrimiento y análisis de patrones potenciales y características clave dentro de los datos.
  • Análisis de características y relaciones: comprender cómo las características interactúan e influyen en los resultados.
  • Prototipado y entrenamiento de modelos: desarrollo de modelos preliminares y perfeccionamiento de los mismos mediante entrenamiento con conjuntos de datos.
  • Evaluación y prueba de modelos: evaluación de la precisión y confiabilidad de los modelos en diversas condiciones.
  • Modelado, predicción y posprocesamiento: generación de predicciones y refinamiento de resultados para satisfacer las necesidades del negocio.
  • Mantenimiento de modelos y validación del rendimiento: actualización de los modelos para reflejar los datos cambiantes y validar su rendimiento.

Garantizar la precisión y relevancia de los modelos de aprendizaje automático a lo largo del tiempo es una función de MLOps (Operaciones de Aprendizaje Automático). MLOps utiliza los principios de DevOps (una combinación de desarrollo de software (dev) y operaciones de TI (ops), cuyo objetivo es optimizar el ciclo de vida del desarrollo de software mediante la colaboración y la automatización) para garantizar que los modelos de predicción sean estables, estén bien calibrados y se adapten a entornos de datos en constante evolución.

Para que el aprendizaje automático aporte valor real, las organizaciones deben integrar sus resultados en sus procesos y flujos de trabajo. Esta integración permite que los sistemas se ajusten dinámicamente a medida que cambian los datos subyacentes, manteniendo la alineación con los objetivos empresariales y las realidades operativas. Si se implementa correctamente, el aprendizaje automático no solo facilita la toma de decisiones, sino que la transforma, permitiendo operaciones empresariales más ágiles e inteligentes.

Fundamentos de la IA generativa

GenAI permite la creación y manipulación de texto, imágenes y otros contenidos con un diseño similar al humano. Para comprender su funcionamiento, es necesario comprender cómo funcionan e integran sus componentes clave, incluyendo grandes modelos de lenguaje (LLM) , bases de datos vectoriales (Vector DB) y modelos especializados como ChatGPT. Estos elementos trabajan en conjunto para ofrecer respuestas inteligentes y contextuales, casi precisas y contextualmente relevantes la mayor parte del tiempo.

Infraestructura de LLM

En el corazón de una plataforma GenAI se encuentra el modelo lingüístico general. Los LLM, como GPT (Transformador Generativo Preentrenado), están diseñados para producir contenido detallado y coherente mediante la comprensión y predicción de secuencias de palabras.

  • Generativo: Capaz de crear texto generando nuevas secuencias de palabras, no sólo clasificando o etiquetando entradas.
  • Preentrenados: entrenados en grandes conjuntos de datos, recopilados de repositorios en línea y fuera de línea, lo que les permite aprender profundamente la estructura y el contexto del lenguaje.
  • Arquitectura del transformador: se destaca por comprender las relaciones entre las palabras de una secuencia, lo que le permite predecir la siguiente palabra con gran precisión a través de un proceso llamado aprendizaje autosupervisado.
  • Ajuste fino: entrenamiento adicional en conjuntos de datos específicos para realizar tareas de lenguaje especializadas, mejorando su precisión y relevancia en aplicaciones particulares.

Bases de datos vectoriales e incrustaciones

La estructura subyacente de los LLM se basa en bases de datos vectoriales e incrustaciones. En el procesamiento del lenguaje natural (PLN), las palabras y frases se representan como vectores: matrices de números que codifican el significado semántico.

  • Incrustaciones: Son vectores de alta dimensión (lo explicaré más adelante) que asignan palabras al espacio semántico. Las palabras con significados similares tienen vectores cercanos entre sí. Esto permite al modelo comprender el contexto y las relaciones.
  • Tokens: Las entradas se dividen en unidades más pequeñas llamadas tokens, cada una asignada a un vector que transporta información semántica.
  • Operación vectorial: Los vectores se pueden manipular matemáticamente; en particular, una función de similitud de coseno mide el ángulo entre dos vectores e indica su grado de relación. Una puntuación de 1 significa una alineación perfecta, mientras que 0 indica que no hay relación.

Para visualizar cómo funciona esto, imagine comparar diferentes tipos y marcas de carne según su jugosidad y exquisitez: solo tres dimensiones. Si cada tipo de carne se grafica por puntuación, se puede crear un vector en un espacio 3D; la proximidad a otro vector refleja la similitud de características. Este es un ejemplo de baja dimensión: la IA generativa es de alta dimensión porque puede comparar hasta 4032 dimensiones. Esto permite a los LLM comprender un lenguaje con matices y generar respuestas contextualmente ricas.

ChatGPT y aplicaciones en plataformas GenAI

ChatGPT es una plataforma GenAI que aprovecha la infraestructura de transformadores preentrenados y bases de datos vectoriales para generar texto interactivo y conversacional. Al comprender las indicaciones del usuario y responder con un texto coherente y contextualizado, ejemplifica el poder de GenAI para transformar la comunicación, la atención al cliente y las interacciones digitales.

Cuando estos componentes se integran a la perfección, una plataforma GenAI es capaz no solo de comprender el lenguaje humano, sino también de interactuar con él de forma significativa, transformando los datos sin procesar en información inteligente y práctica. Ocasionalmente,  pueden producirse alucinaciones,  lo que resulta en respuestas erróneas o engañosas, ya que el modelo intenta siempre proporcionar una respuesta. 

Fundamentos de la IA de Agentic

La IA Agentic representa la siguiente evolución de la inteligencia artificial, donde la IA generativa converge con las plataformas de automatización de la fuerza laboral para impulsar acciones en el mundo real. Mientras que la IA GenAI destaca por comprender y generar respuestas similares a las humanas, la IA Agentic convierte estos conocimientos en flujos de trabajo ejecutables, acortando la distancia entre la conversación inteligente y la finalización automatizada de tareas. Esta transformación es posible gracias a una plataforma de orquestación de fuerza laboral/agentes, que coordina a la perfección a los agentes digitales para realizar tareas, tomar decisiones y responder dinámicamente a los cambios en los datos y los entornos empresariales.

La base de Agentic AI son  los marcos de agentes y los flujos de trabajo empresariales de Agentic. Estos marcos permiten la creación e implementación de agentes especializados que ejecutan tareas específicas de forma autónoma, mientras que los flujos de trabajo empresariales garantizan que estos agentes operen de forma cohesiva dentro de los procesos de negocio. El resultado es un sistema inteligente y autodirigido capaz no solo de comprender las intenciones, sino también de actuar: optimiza las operaciones, aumenta la productividad y escala la toma de decisiones en toda la empresa. Agentic AI redefine la automatización al dotar a GenAI de la capacidad de actuar, no solo de responder.

La pila de IA simplificada  

Diagrama que describe las tecnologías de IA

Ahora visualicemos todo lo que hemos discutido en un solo diagrama. En la parte superior izquierda se encuentra el aprendizaje automático de IA . Los datos se almacenan en un lago o almacén de datos en la nube. Estos datos se conectan a Spark o a un modelo de datos/ML, que los procesa para generar una predicción como resultado.

A continuación se encuentra la pila GenAI . En esta capa, el LLM genera incrustaciones, que se almacenan en una base de datos vectorial. A diferencia de las bases de datos tradicionales que organizan la información en filas y columnas, esta base de datos almacena la información en fragmentos. El resultado de este proceso es una solicitud del chatbot.

Finalmente, en la parte inferior izquierda, se encuentra Agentic AI , que integra GenAI con datos y flujos de trabajo o scripts para crear acciones. Tradicionalmente, los scripts se diseñaban para acciones humanas, pero aquí están automatizados, lo que permite generar acciones basadas en los datos y la lógica del flujo de trabajo.

Liderazgo estratégico en IA: comprender la codificación excesiva

La revolución de la IA no se trata de dominar el código, sino de dominar la comprensión. En primer lugar, los líderes deben comprender los fundamentos de la IA: los principios del aprendizaje automático, el aprendizaje profundo y la IA generativa. En segundo lugar, el éxito de la integración de la IA depende de la fluidez de los datos y de una sólida comprensión de cómo los modelos impulsan las decisiones, no solo de los detalles técnicos. Por último, la puesta en práctica de la IA exige una visión estratégica, conciencia ética y la capacidad de gestionar la complejidad, no solo conocimientos técnicos.

En la era de la IA, el liderazgo consiste en utilizar la inteligencia de manera eficaz, no en crearla desde cero.

Acerca del autor

Myles Suer

Myles Suer es analista de la industria, periodista tecnológico y destacado CIO influencer (Leadtail). Es líder emérito de #CIOChat y director de investigación en Dresner Advisory Services.

Fuente: https://www.vktr.com/ai-technology/the-ai-revolution-part-4-essential-ai-concepts-every-leader-must-know/

Deja una respuesta