Análisis de Texto

por Judith Lamont, Ph.D.


El mercado global de análisis de texto superó los $ 5 mil millones en 2019 y se prevé que alcance casi $ 15 mil millones en 2025, lo que representa una tasa de crecimiento de más del 17%, según Mordor Intelligence. Además de las predicciones de un fuerte crecimiento, Technavio prevé que el mercado de análisis de texto crecerá en más de $ 8 mil millones entre 2020 y 2024, expandiéndose a una tasa de más del 20% durante el período de tiempo.

Análisis de Texto
Análisis de Texto

El creciente número y diversidad de canales que producen información no estructurada incluidos blogs, chats, reseñas de productos, correos electrónicos y múltiples canales de redes sociales, proporcionan una amplia gama de fuentes para dicha analítica. Las principales marcas están haciendo un uso efectivo de estos canales para la personalización y el compromiso del cliente. Aunque las predicciones del mercado no tienen en cuenta el impacto económico de COVID-19, se entiende que algunos sectores como el de la salud y el farmacéutico están recurriendo al análisis de texto para obtener información relacionada con la investigación de vacunas.

El sector minorista ha sido un usuario líder de análisis de texto, pero la tecnología también se está utilizando más ampliamente en muchas industrias. Las instituciones educativas, las empresas de servicios financieros y las organizaciones gubernamentales se encuentran entre los grupos que están extrayendo información clave de fuentes que antes estaban inactivas en términos del valor que ofrecían.

Fomento del compromiso y el apoyo

La Universidad Estatal de Michigan quería establecer relaciones con sus exalumnos para fomentar el compromiso y el apoyo continuos. La universidad tenía datos cuantitativos sobre quién había hecho las donaciones, pero para que todos los exalumnos se involucraran en la universidad y sus actividades, la oficina de desarrollo empresarial necesitaba conocer mejor los intereses y sentimientos de los exalumnos. Con más de medio millón de egresados, una mayor participación de los que tenían más probabilidades de participar activamente en proyectos universitarios y estar motivados para donar.

La mayor parte de la información sobre los alumnos no estaba estructurada. La universidad vio el análisis de texto como la mejor manera de obtener estos conocimientos más matizados. Las fuentes de datos incluyeron redes sociales y registros como correos electrónicos y documentos que mostraban la participación de los egresados ​​en eventos que reflejaban sus intereses y preocupaciones. La universidad identificó IBM SPSS Modeler como la mejor opción para recopilar esta información y convertirla en conocimientos prácticos.

Gran parte de la información estaba dispersa por toda la universidad y no se reconoció como un recurso valioso. “La información estaba disponible a través de correos electrónicos y notas de llamadas telefónicas, registros de reuniones de comités y juntas y muchas otras fuentes”, dijo Priya Krishnan, directora de gestión de ofertas de IBM SPSS Modeler. “Dirigir las solicitudes de donación para que coincidan con los intereses y la participación de los ex alumnos es mucho más eficaz que simplemente mirar el historial de donaciones”. Al construir relaciones más personalizadas, aumenta el compromiso.

Como resultado de utilizar IBM SPSS Modeler para evaluar el sentimiento y el comportamiento de los exalumnos, la universidad pudo crear una puntuación de afinidad que midió las actitudes y sentimientos del individuo. Descubrió que era probable que hasta el 85% de los ex alumnos donaran si las puntuaciones de afinidad desarrollaran suficientemente nuevos enfoques para alentar a los ex alumnos a contribuir a los muchos proyectos que la universidad quería mantener.

IBM adquirió SPSS Modeler en 2009, junto con el paquete estadístico SPSS. Ahora es parte de Watson Studio. La herramienta de análisis de texto SPSS está integrada en IBM SPSS Modeler. Utiliza procesamiento de lenguaje natural, por lo que puede dividir el texto para el análisis semántico y de sentimientos. El hecho de que el análisis de texto esté integrado en SPSS Modeler y este último en Watson Studio es fundamental porque esta configuración permite un fácil análisis de datos estructurados y no estructurados juntos. Esta capacidad es particularmente útil para el análisis predictivo. “Cuantos más datos pueda incluir, mejores serán las predicciones”, dijo Krishnan. (Más información sobre cómo comprender el sentimiento en la página siguiente).

Watson Studio se puede utilizar en el escritorio, en la nube pública o en una nube privada. Permite a los usuarios organizar datos (eliminando valores atípicos, por ejemplo) y visualizarlos para ver patrones. En lugar de ser una función sencilla, el análisis de texto puede integrarse completamente en análisis que se enriquecen con los datos adicionales, pero también pueden utilizar datos cuantitativos y estructurados para obtener una imagen completa del problema que se explora.

La analítica de texto no es necesaria para todos los análisis de contenido no estructurado, señaló Krishnan. “Si solo desea ordenar documentos y clasificarlos, el análisis de texto puede ser excesivo”, comentó. “Para ese tipo de actividad, un clasificador de lenguaje natural sería más apropiado. Sin embargo, si está interesado en comprender el significado del texto para fines como la extracción de conceptos, el análisis de texto es el mejor enfoque “.

Gran parte de los datos no estructurados quedan sin explotar. “Una de las cosas que las organizaciones a menudo no reconocen es que hay una gran cantidad de datos no estructurados que están ahí, listos para ser analizados”, enfatizó Krishnan. “No es tan difícil empezar. Nuestras soluciones están codificadas para industrias específicas, por lo que pueden obtener un valor inmediato y luego refinarse con el tiempo para ser más personalizadas “.

Centrándose en los comentarios únicos

Cuando los gobiernos federales, estatales o locales proponen cambios en las reglas y regulaciones, con frecuencia se requiere una oportunidad para el comentario público. En el Servicio de Pesca y Vida Silvestre de EE. UU. (USFWS), agregar o eliminar animales de la lista de especies en peligro de extinción es un ejemplo. Los defensores de un lado u otro a menudo inundan la agencia con correos electrónicos y cartas modelo. En el caso de proponer eliminar algunas poblaciones de lobos de la lista, la agencia recibió cientos de miles —pero posiblemente más de un millón— comentarios sobre diversas propuestas. Procesar el contenido sería imposible sin el análisis de texto.

Durante la última década, USFWS ha estado utilizando el software de análisis de texto DiscoverText para clasificar los muchos de estos grandes lotes de comentarios públicos. “El paso más importante es la deduplicación”, dijo Seth Willey, subdirector regional adjunto de servicios ecológicos para la región suroeste de USFWS. “En un caso, recibimos alrededor de 30.000 comentarios de la misma organización, pero solo tres fueron únicos. La mayoría eran letras modelo “. DiscoverText identifica los duplicados exactos y también los comentarios únicos de casi duplicados. “Después de que hicimos el análisis, solo tuvimos que leer tres de esta organización en particular”, continuó Willey. “Este es un gran ahorro de tiempo y dinero de los contribuyentes”.

El número de comentarios recibidos no influye en la toma de decisiones. “Nuestro mandato legal es tomar decisiones basadas en los mejores datos científicos y comerciales disponibles”, señaló Willey. “Estamos buscando información válida sobre las razones por las que una especie debería o no permanecer en la lista”. Con la ayuda del software, el número final de comentarios que se revisarán puede ser lo suficientemente pequeño como para que se pueda utilizar la codificación humana para categorizar los datos. DiscoverText ha permitido a la agencia cumplir con su mandato de revisión dentro de los plazos asignados con solo un pequeño personal.

En la Universidad de California, Los Ángeles, Karen Umemoto, directora del Centro de Estudios Asiáticos Americanos y presidenta de Helen Morgan Chu, está utilizando DiscoverText para analizar el discurso de odio en Twittersphere. “Tomamos una muestra de tweets de 2 semanas relacionados con los estadounidenses de origen asiático y el papel percibido de los asiáticos en el virus COVID-19”, dijo Umemoto. “Analizamos las experiencias personales con el acoso, las respuestas de las personas a los comentarios negativos, los tweets informativos sobre la fuente del virus y otro contenido relacionado”.

Después de la deduplicación de los tweets redundantes, los investigadores los codificaron en varias categorías y los analizaron. “Pudimos obtener una comprensión más profunda de la dinámica en torno a este tema”, comentó Umemoto. “Como resultado, pudimos producir rápidamente un resumen de política preliminar que ayudará a determinar cómo abordar este problema en curso”.

DiscoverText fue la única herramienta adecuada para la investigación, según Umemoto. “Es fácil de usar, muy potente y listo para usar. No es necesario ser un especialista en ‘macrodatos’ o un experto en informática para usarlo “. El centro aún no ha utilizado toda la potencia del software, “como la confiabilidad del intercodificador, el muestreo y el uso de inteligencia artificial para el análisis, pero ya ha satisfecho nuestras necesidades para esta etapa de nuestro trabajo”, dijo Umemoto.

Mejorar las interacciones con los clientes

El Royal Bank of Scotland (RBS) se fundó en Edimburgo en 1727 y se ha convertido en uno de los bancos más grandes del Reino Unido. Ahora tiene más de 70.000 empleados y alrededor de 700 sucursales. RBS es consciente de que la lealtad de por vida a un banco es cosa del pasado, por lo que estableció el objetivo de convertirse en el banco número uno en el Reino Unido en servicio al cliente, confianza y defensa. Un aspecto fundamental de esta iniciativa fue un mejor uso de la analítica para impulsar su toma de decisiones. Además, RBS quería que los datos de la empresa estuvieran disponibles para la mayor cantidad posible de empleados para que pudieran comprender mejor el impacto de sus acciones y decisiones e impulsar mejores conversaciones con los clientes. SAS Visual Analytics fue seleccionada como la solución que tenía la funcionalidad adecuada para el análisis y la mayor usabilidad para los trabajadores.

RBS tiene una gran cantidad de datos cuantitativos que fluyen de las transacciones de los clientes y, utilizando SAS Visual Analytics, los empleados pueden crear y compartir fácilmente gráficos y tablas para una fácil visualización de datos que son relevantes para sus actividades. RBS aprovechó SAS Visual Analytics para impulsar una aplicación interna a la que se refieren como “Genie” para hacer esto. Cualquiera de la organización puede acceder a los datos y hacer preguntas. Genie mide el desempeño del banco en relación con sus métricas de desempeño. Ahora implementado para los gerentes de relaciones de primera línea, Genie ha ayudado a RBS a mejorar el rendimiento al facilitar el acceso a datos empresariales cuantitativos.

Sin embargo, el banco también tiene una gran cantidad de datos en formatos de texto no estructurados, que incluyen encuestas a los clientes, y se concentra en dónde ocurrieron los problemas. Durante un estudio piloto, un equipo pudo reducir la cantidad de quejas que recibió de 20 por mes a solo una por mes. Esta implementación fue ayudada en gran medida por el diseño del software de visualización y análisis de texto SAS, que hizo que conjuntos de datos muy grandes fueran accesibles para miles de usuarios a través de una interfaz intuitiva que respalda las decisiones basadas en datos.

Análisis más accesibles

SAS Visual Text Analytics en SAS Viya, la última oferta de análisis de texto de SAS, combina una interfaz visual con potentes capacidades de análisis de texto. Está diseñado para usuarios con experiencia de codificación limitada o nula. “Esto permite que más personas conviertan texto no estructurado en información utilizable de alto valor sin tener que ser un científico de datos”, dijo Katie Tedrow, gerente senior de marketing de productos globales para IA en SAS. Ser capaz de analizar datos de texto junto con datos cuantitativos maximiza el valor que se puede obtener. “SAS Visual Text Analytics integra un elemento visual de una manera fácil de consumir”, continuó Tedrow.

El uso de la analítica de texto se ha generalizado mucho más y las predicciones del mercado respaldan la expectativa de que seguirá expandiéndose. “Estamos viendo industrias de muchas verticales que extraen cada vez más sus datos no estructurados, como encuestas a clientes y chats en línea”, dijo Tedrow. “En el clima actual, por ejemplo, estamos viendo un repunte en las industrias de la salud, el gobierno y el sector público”. A menudo, estos datos son voluminosos. En el caso de RBS, las 250.000 conversaciones de chat por mes proporcionaron una valiosa fuente de datos para revelar la voz del cliente. Más organizaciones se están dando cuenta de que estas fuentes pueden proporcionar una perspectiva que los números por sí solos no pueden.

Fuente: https://www.kmworld.com/Articles/Editorial/Features/Text-analytics-reaches-new-territory-142502.aspx

Deja un comentario