Casi 18 meses después de que ChatGPT cautivara inicialmente a consumidores y organizaciones por igual, la IA generativa (GenAI) sigue fomentando expectativas (y pronósticos) tan elevadas como las de cualquier tecnología… si no más. En medio de todo el revuelo, las empresas están buscando formas de utilizar la tecnología para soluciones de KM del mundo real.
por Jelani Harper
Los proveedores están promocionando los modelos generativos de aprendizaje automático para crear capas semánticas completas para transformar datos, rectificar diferencias en esquemas y armonizar datos para consultas singulares entre fuentes. Muchos están trabajando febrilmente, además de comercializar incesantemente, asistentes de copiloto para automatizar procesos centrales de cargas de trabajo de dominios específicos, como el procesamiento inteligente de documentos (IDP). Otros están pregonando una renovación total de la experiencia del cliente, en la que las interacciones de los clientes con las marcas estén guiadas casi por completo por las capacidades generativas de entidades de IA que conocen su historia, abordan sus inquietudes y, simultáneamente, realizan ventas adicionales y cruzadas.
Específicamente para KM, hay una serie de casos de uso para implementar modelos básicos que amplían la cantidad de conocimiento del dominio al que pueden acceder los usuarios, reducen el tiempo requerido para hacerlo y automatizan los pasos de curación necesarios para aplicar esta información en todas las funciones comerciales.
Estas aplicaciones no están “en la hoja de ruta” ni forman parte de una estrategia de desarrollo de productos. En cambio, se encuentran en varias etapas de implementación en áreas de gestión de casos, cumplimiento normativo y litigios, gobierno federal y estatal y sectores verticales de la industria. Las implementaciones más frecuentes abordan constantemente la búsqueda vectorial, la respuesta a preguntas, el resumen, las consultas en lenguaje natural (NLQ), el IDP, los agentes digitales y más.
La utilidad general derivada de las capacidades de GenAI depende de la competencia de las organizaciones para reducir la redundancia y minimizar las imprecisiones, monitorear los resultados y rastrear las respuestas hasta las fuentes de datos subyacentes a partir de las cuales se producen sus respuestas.
Protegerse contra las alucinaciones
La aplicación de KM por excelencia de los modelos de aprendizaje automático generativo (ML) implica la búsqueda de vectores para respuestas a preguntas, generación de lenguaje natural, resúmenes y recomendaciones. Las soluciones inteligentes encapsulan todas estas capacidades para los usuarios dentro de los límites de un tejido de datos seguro y que cumple con las regulaciones que está repleto de una base de datos vectorial y una miríada de modelos para incorporar cualquier conjunto de contenido. Medhat Galal, vicepresidente senior de ingeniería de Appian, hizo referencia a una solución de gestión de registros “llave en mano” para la recuperación de información en tiempo real en todos los repositorios de contenido empresarial en la que “no se requiere codificación ni diseño, excepto pensar qué registro se desea utilizar”. entonces estará disponible en la interfaz inmediatamente. No estás haciendo ingeniería rápida ni nada que normalmente intentarías hacer con GPT-4 o GPT personalizados “.
El sistema proporciona respuestas a preguntas en lenguaje natural a partir de registros específicos o de registros múltiples, incluidos resúmenes y recomendaciones. Sin embargo, las organizaciones deben darse cuenta de que la tendencia de los modelos generativos a producir respuestas no objetivas que suenan plausibles, que muchos denominan “alucinaciones”, es una advertencia al utilizar esta tecnología. “Ésta es un área de exploración en la que nadie ha acertado”, explicó Galal. “No se puede evitar, al 100%, que los LLM [grandes modelos de lenguaje] tengan alucinaciones. Pero contamos con medidas de seguridad y barreras de seguridad, como una adición al mensaje que dice que si no puede responder la pregunta, no invente la respuesta”. La generación aumentada de recuperación se emplea porque los modelos buscan registros de organizaciones en sus fuentes de tejido de datos, incluidos documentos, casos, notas, comentarios y más. La enorme escala a la que opera el sistema (una agencia federal lo está empleando actualmente para encontrar todas las leyes aplicables a puestos de trabajo específicos) es transformadora.
Resultados del seguimiento
El principio establecido del ser humano en el circuito es indispensable para las implementaciones de modelos de aprendizaje automático generativo, independientemente del caso de uso. Según Bharti Patel, vicepresidente senior y jefe de ingeniería de Hitachi Vantara, la unidad de ingeniería de la compañía actualmente emplea GitHub Copilots para generar código. Ella ve un equilibrio entre la mayor eficacia que brindan estos asistentes GenAI para lograr los objetivos comerciales y la supervisión necesaria para beneficiarse de ella. “Realmente estamos viendo una mejora en la productividad; genera el código”, admitió Patel. “Pero realmente hay que observarlo para determinar si es correcto o no”. Esta mejor práctica se extiende al uso de cualquier modelo GenAI, incluso para respuestas de búsqueda vectorial. Esta verificación es posible en el sistema de gestión de registros que describe Appian’s Galal porque los usuarios están “chateando directamente en la fuente de los datos para que el registro sea visible”.
El caso de uso de Copliot de un asistente GenAI, articulado por Patel, es particularmente apropiado para KM. Según Steve Gu, director ejecutivo de bitHuman, que ofrece asistentes GenAI interactivos que pueden imitar la imagen, los modales, la voz y la imagen de una persona real, “la capacitación de los empleados es en realidad un área importante donde se puede destilar el conocimiento corporativo y los agentes pueden incorporar y capacitar a los empleados”. .” Implícito en estas y otras aplicaciones de asistentes virtuales está el ajuste de sus modelos generativos. “GenAI tiene la capacidad de probar inferencias a partir del conocimiento contextual, la comprensión del dominio y generar gráficos de conocimiento”, agregó Kavitha Chennupati, directora senior de gestión de productos de SS&C Blue Prism.
Trazabilidad de las salidas
Implícita en el seguimiento de los resultados de los modelos generativos para minimizar las alucinaciones y las inexactitudes está la necesidad de rastrear sus resultados hasta sus fuentes. Para aplicaciones textuales de búsqueda vectorial, respuesta a preguntas, resúmenes y acciones siguientes, las ofertas creíbles pueden mostrar fragmentos reales de las fuentes de datos textuales de las que se derivaron las respuestas. Galal mencionó que para este caso de uso generalizado, “hacemos una cita. Encontramos esto, en este documento específico, desde aquí en la página X, y este número de párrafo específico”. Estas citas detalladas facilitan rastrear las respuestas del modelo, validarlas y minimizar las alucinaciones y los resultados erróneos.
Independientemente de los mecanismos que tenga implementada una solución GenAI en particular, corresponde a las organizaciones observar continuamente los resultados, dijo Patel. “Si hacemos una pregunta, ¿cómo responde?” El beneficio para los profesionales de KM es que los usuarios pueden hacer más preguntas directamente a las fuentes de datos para acelerar la recuperación de información y acelerar los procesos de trabajo.
Curación del conocimiento
Otra aplicación particularmente convincente de los modelos generativos de aprendizaje automático para la KM es el proceso de curación del conocimiento del dominio. Gu comentó que perfeccionar los modelos básicos con ese conocimiento de dominio específico es fundamental para obtener respuestas relevantes y correctas. Se trata de “una fase de adquisición de datos en la que los clientes nos dan [preguntas frecuentes] y documentos corporativos. Ponemos este conocimiento como parte de nuestro sistema para que el agente pueda responder preguntas en tiempo real”.
Los modelos generativos se utilizan habitualmente para completar gráficos de conocimiento, redactar reglas de negocio e idear o ampliar taxonomías y ontologías completas. El defensor de los desarrolladores de Dremio, Alex Merced, señaló que otra aplicación de esta tecnología para KM implica “un wiki incorporado para que cuando las personas seleccionen sus datos, puedan crear toda la documentación sobre los datos para poder ponerlos a disposición en el contexto adecuado”.
Para esta aplicación, Dremio aplica modelos generativos a su consulta federada, virtualización de datos y plataforma de data lakehouse para simplemente señalar diferentes fuentes y recopilar descripciones de ellas, similares a las contenidas en los catálogos de datos. “Escaneará los datos y el esquema, luego intentará inferir el contexto a partir de ellos para crear una entrada wiki que capture la esencia de eso”, explicó Merced. Lo que es digno de mención acerca de este enfoque es que la recolección típica de metadatos que involucra aprendizaje automático y elaboración de perfiles de datos produce información estadística sobre los datos. Los modelos generativos pueden ampliar esta utilidad para incluir descripciones verbales de esquemas y fuentes, lo que acelera el proceso de curación. La aplicabilidad de estas capacidades a un dominio específico también es significativa. “Le di un conjunto de datos impositivos simulados y pudo sentarse allí, tener una conversación y decir: ‘Estos son los registros impositivos individuales; estos son los registros de impuestos comerciales’ y darle más sabor en función de lo que contiene”.
Procesamiento inteligente de documentos
La capacidad conversacional de aplicar modelos generativos de ML a casos de uso de KM se manifiesta de manera más aguda en NLQ. Merced también hizo referencia a un caso de uso en el que consultó la wiki creada por Dremio en lenguaje natural sobre datos de taxis, preguntando por la distancia promedio del viaje en kilómetros para una cuenta de pasajero específica. Aunque los datos se representaron en millas, la respuesta se devolvió en kilómetros, como había especificado Merced. “No mencioné que los datos originales estaban en millas”, comentó Merced. “A través de la forma en que se proporcionó el esquema y los nombres de las columnas, capturó el contexto. Puede hacer preguntas directas y las consultas captarán la esencia de la pregunta formulada”.
Las aplicaciones GenAI para desplazados internos que implican la automatización de procesos robóticos no son menos instructivas. Chennupati codificó el valor de esta tecnología para los desplazados internos en dos partes. El primero implica “comprender la estructura y el diseño del documento y luego comprender el contenido de una sección en particular para obtener la información correcta de él”.
Este caso de uso da fe de la aplicabilidad multimodal de los modelos básicos, que reemplazan las capacidades del lenguaje natural para incluir también capacidades para “inferir o comprender un diagrama, una imagen y una imagen del modelo de lenguaje grande y decir: ¿qué significa esto?” Comentó Chennupati.
Con este enfoque, los sistemas IDP mejorados con modelos básicos pueden encontrar la información necesaria para procesar un reclamo o una factura independientemente de dónde se encuentre en el documento. Un desarrollo particularmente interesante relacionado con GenAI para IDP es una biblioteca de indicaciones que puede agilizar el proceso de indicaciones para que los modelos completen tareas. Blue Prism proporciona una biblioteca de este tipo en la que las solicitudes de modelos se organizan en función de dominios y capacidades comerciales, como la clasificación. Según Chennupati, “Estas indicaciones se publican en nuestro mercado para que en otras situaciones similares también podamos utilizarlas. Si las indicaciones no están disponibles en la biblioteca de indicaciones de una organización o en nuestro mercado, entonces, en ese momento, un desarrollador ciudadano puede usar nuestra pantalla de diseño de indicaciones para crear esas indicaciones”.
Agentes digitales
El ajuste del modelo, mediante el cual los sistemas GenAI se familiarizan con el conocimiento específico del dominio para una aplicación particular, es esencial para el uso de agentes digitales. “Para brindar atención al cliente, incluso para responder preguntas simples , los modelos deben recibir capacitación sobre toda la documentación”, estipuló Patel. “Por lo tanto, estamos preparando documentos y alimentándolos para que se puedan crear las incrustaciones para nuestra documentación”. Las incrustaciones que mencionó Patel son respectivos vectores de contenido para almacenar y buscar a través de un almacén de datos vectoriales. Gu comparó este paso vital con la capacitación de un nuevo empleado recién
graduado. “Cada vertical tiene su propio conocimiento de dominio específico (ventas, marketing y marca, por ejemplo) y todos tienen sus especialidades. Esas son cosas que los modelos deben adquirir a través de un proceso de formación especializado. Piense en un graduado universitario o un estudiante de secundaria; ¿Cuánto esperas que sepan?”
Los proveedores pueden ayudar con esta faceta de ajustar los modelos para que las organizaciones puedan obtener los resultados que esperan de los agentes digitales para
implementaciones interactivas de GenAI . “Algunos de los documentos básicos, los PDF y otros materiales, pueden compartirlos con nosotros y nosotros haremos este trabajo pesado por ellos”, dijo Gu. “También tenemos una interfaz donde pueden cargar fácilmente esos documentos y poder personalizar y capacitar al agente muy rápidamente”.
Una vez que los modelos de computación cognitiva estadística se afinan en el conocimiento de dominio específico que proporcionan las organizaciones, no sólo pueden responder preguntas al respecto y recuperar información a pedido, sino que también pueden proporcionar recomendaciones oportunas a los usuarios basadas en temas específicos. situaciones. Galal detalló una aplicación en la que una institución educativa utilizaba la solución de gestión de registros para brindar a los asesores académicos sugerencias para responder a las preguntas de los estudiantes sobre horarios, cursos y sus cargas de trabajo.
Ahora mismo
Estos ejemplos muestran la capacidad de los modelos generativos para ampliar la escala y la velocidad a la que los profesionales de KM pueden acceder a la información que necesitan para alcanzar sus objetivos de negocio. Dado que aún se están realizando muchas inversiones en esta tecnología, su valor general es inestimable.