No será una sorpresa ver que los datos no estructurados continúan siendo un foco de los esfuerzos de gestión de datos de las empresas.

por Krishna Subramanian

Los datos no estructurados continúan rehaciendo el panorama de la gestión de datos en un momento en el que no solo se genera una cantidad sin precedentes de datos, sino que también se recopilan, almacenan, procesan y analizan en varios lugares (en las instalaciones, en la nube y en el borde). ) y se movió entre esos entornos. Las empresas están utilizando videos, imágenes, datos de sensores de IoT, redes sociales e información similar como base para gran parte de las tareas de análisis, aprendizaje automático e inteligencia empresarial que realizan. No será una sorpresa ver que los datos no estructurados continúan siendo un foco de los esfuerzos de gestión de datos de las empresas a medida que avanzamos hacia 2022.

Entonces, ¿qué otras tendencias de gestión de datos podemos esperar en 2022? A continuación se muestran algunos:

Los líderes de TI se concentrarán en el uso de la nube para obtener valor de los datos no estructurados.

Los líderes de TI saben que la nube es mucho más que un reemplazo de la infraestructura local. Es una plataforma informática elástica que las organizaciones pueden aprovechar para ofrecer una ventaja competitiva y agilidad. Todavía no sabemos lo suficiente sobre cómo aprovechar la nube para analizar datos no estructurados. Con el creciente interés en el aprendizaje automático y la inteligencia artificial (IA), veremos más inversiones en análisis de datos no estructurados y soluciones de gestión de datos que lo permitan. Dado que los datos no estructurados son muy grandes y difíciles de manejar y gran parte de ellos están creciendo fuera de la nube en el borde, la gestión de datos que se extiende de borde a nube y simplifica la ingesta de datos no estructurados para el análisis de la nube se convertirá en una tendencia notable.

Surgirán soluciones de flujo de trabajo de análisis de datos no estructurados

Procesar e indexar petabytes de datos no estructurados es hoy en día en gran medida un esfuerzo manual. Las grandes organizaciones emplean legiones de profesionales de datos para buscar, catalogar y mover estos datos para que puedan ser ingeridos por herramientas de análisis y manipulados. Existe una necesidad imperiosa de simplificar y automatizar estos procesos. Las soluciones que indexan archivos fácilmente en múltiples silos de archivos y en la nube y automatizan el movimiento sistemático de datos irán en aumento. Además, las soluciones de análisis de datos para datos no estructurados se pueden verticalizar, por lo que son específicas del sector o de la aplicación. Por ejemplo, las imágenes médicas y cómo se interpretan es un evento contextual que requiere un conocimiento específico de conjuntos de datos clínicos. Las organizaciones están creando flujos de trabajo personalizados que consisten en herramientas de análisis basadas en la nube como Amazon Comprehend para detectar información de identificación personal (PII) junto con el movimiento manual de datos y lagos de datos. Ha llegado el momento de las soluciones de gestión de datos comerciales que pueden permitir la búsqueda fácil de conjuntos de datos específicos en una empresa global y transmitir estos datos continuamente para automatizar sistemáticamente el flujo de trabajo de análisis de datos no estructurados.

DEI será más importante para los líderes de TI a medida que amplíen sus equipos de gestión de datos

Contratar una fuerza laboral diversa tiene sentido comercial dado que más de la mitad de la población que se gradúa ahora es femenina. En 2022, los líderes de TI buscarán crear una cultura que sea más propicia para la igualdad a nivel de base, por ejemplo, proporcionando una mayor flexibilidad en el trabajo remoto, reconociendo el talento diverso y fomentando diversos modelos a seguir tanto como gerentes como líderes de equipo.

Lamonetización de datos’ y las estrategias relacionadas serán populares en 2022

El concepto tradicional de monetización de datos ha girado en torno a la extracción de CRM, ERP y otros sistemas comerciales centrales para obtener inteligencia sobre el comportamiento del cliente, la demanda de productos y las tendencias de inventario. Sin embargo, el aprendizaje automático es una herramienta revolucionaria que se basa en datos no estructurados. Enseñar a un automóvil a conducir por sí solo necesita datos relacionados con la conducción en carreteras con superficies dispares y patrones de semáforos. Si desea mejorar las tasas de satisfacción de las llamadas telefónicas de atención al cliente, debe poder analizar las conversaciones. Es por eso que vemos que compañías como Snowflake anuncian soporte para datos no estructurados. Proporcionan almacenamiento de datos en la nube y facilitan la respuesta a esas preguntas arbitrarias y abiertas.

Es hora de que TI adopte los silos de datos

Los silos de datos no van a desaparecer y nadie quiere comprometerse con el bloqueo del proveedor para evitar los silos. La respuesta es no preocuparse por los silos, sino buscar soluciones que puedan analizar los datos (buscar, clasificar, proteger, visualizar en su lugar) sin obligarlo a colocar todos sus datos en una sola ubicación o tecnología. Otra área que ganará visibilidad es la gestión de etiquetas portátil multiplataforma. Esto permitiría a los administradores de datos y a los científicos de datos mover archivos a nuevas nubes o aplicaciones y, al mismo tiempo, conservar las etiquetas que son críticas para buscar y segmentar rápidamente los datos para alimentar las canalizaciones de análisis de datos. El rol de la TI de almacenamiento también está evolucionando para incluir la administración de datos y permitir resultados comerciales en lugar de simplemente administrar la infraestructura.

La gestión de datos seguirá siendo un mercado caliente para los capitalistas de riesgo

La gestión de datos está impulsada por vientos de cola muy fuertes que deberían seguir impulsando el crecimiento de su mercado. La explosión de datos no estructurados, el aumento de los datos en el borde y la nube, y el cambio de la analítica de datos para monetizar los datos no estructurados son fuerzas masivas detrás de la relevancia de la gestión de datos en el mercado. Los capitalistas de riesgo ven el éxito de empresas como Snowflake y no quieren perderse la próxima oportunidad de gestión de big data. Los inversores siempre están buscando la próxima gran novedad. ¿Cómo puede aprovechar las tendencias del mercado para crear una ventaja desproporcionada? Una buena forma de abordar esto es buscar un problema de gestión de datos que comprenda bien, que todavía no haya sido abordado por otros, que esté presente en algunos segmentos del mercado y tenga solución. Las áreas calientes en la gestión de datos incluyen la gestión de datos en la nube,

Los datos no estructurados serán un enfoque clave para las empresas en 2022, pero en un sector tan dinámico de la industria, no serán el único. Las empresas querrán capitalizar el dinero del capital de riesgo que está llegando al espacio para expandir sus capacidades, monetizar las capacidades recién descubiertas que vienen con el aprendizaje automático y los datos no estructurados y asegurarse de que sus fuerzas laborales sean lo suficientemente diversas como para no solo reflejar la sociedad en su conjunto, sino también tomar ventaja del talento floreciente en sectores de la sociedad que en el pasado habían estado relativamente desaprovechados.

Krishna Subramanian es el presidente, director de operaciones y cofundador de Komprise

Fuente: https://www.datacenterknowledge.com/industry-perspectives/unstructured-data-will-continue-shape-data-management-2022

Deja una respuesta