Vertesia, una plataforma unificada de bajo código para desarrollar, implementar y operar aplicaciones de IA generativa personalizadas, presenta su servicio Semantic Doc Prep, un servicio de API basado en la nube diseñado para eliminar las alucinaciones y acelerar el desarrollo de aplicaciones de IA generativa (GenAI).
por Stephanie Simone
“Las dos preocupaciones que más escuchamos de los líderes empresariales son consistentes: una precisión del 95 % no es suficiente, y la preparación de datos es un desafío costoso y lento”, afirmó Chris McLaughlin, director de ingresos de Vertesia. “Nuestro servicio Semantic DocPrep se creó para resolver ambas, ofreciendo a los desarrolladores un conjunto de API para automatizar la preparación de documentos y mejorar significativamente la precisión y la relevancia de los resultados de LLM. Elimina dos obstáculos importantes para el desarrollo de aplicaciones GenAI confiables y de nivel empresarial”.
Con cinco patentes pendientes, el nuevo servicio Semantic DocPrep de Vertesia funciona convirtiendo incluso los documentos más complejos, como facturas, informes anuales y presentaciones reglamentarias, en XML ricamente estructurado y etiquetado semánticamente, sin reescribir ni alterar la fuente, afirmó la compañía.
Al preservar la estructura, las relaciones y el contexto originales, Vertesia garantiza que los modelos de lenguaje grandes (LLM) puedan interpretar documentos con precisión sin fabricar ni tergiversar la información.
A diferencia de las herramientas convencionales que aplanan o reescriben las entradas, el enfoque de Vertesia deconstruye los documentos a nivel de página y determina automáticamente el modelo de IA más apropiado en función del contenido de esa página, ya sea texto denso, datos tabulares, imágenes o una combinación, según la empresa.
Algunas páginas se procesan mejor con LLM, mientras que otras se procesan con OCR o modelos de visión. Este método híbrido también impide la reescritura de modelos, conservando el texto original sin correcciones.
Diseñado para desarrolladores que crean aplicaciones GenAI personalizadas y sistemas de recuperación y generación aumentada (RAG), Semantic DocPrep se adapta perfectamente a los canales de IA modernos, afirmó Vertesia.
Los desarrolladores envían documentos (PDF generados desde Word, PowerPoint u otros formatos) a través de una API y reciben una salida XML estructurada lista para fragmentar, indexar e incorporar en modelos. No se requiere configuración ni entrenamiento de modelos.
Semantic DocPrep es parte de la plataforma más amplia de Vertesia, que proporciona la infraestructura de extremo a extremo que las organizaciones necesitan para construir, implementar y administrar aplicaciones y agentes GenAI personalizados a escala.
Desde el preprocesamiento de contenido inteligente hasta RAG agente, búsqueda híbrida y observabilidad, Vertesia ofrece una base unificada para acelerar el desarrollo de GenAI manteniendo el control, la precisión y el rendimiento, afirmó el proveedor.
Para más información sobre esta noticia, visita https://vertesiahq.com.