Escasez Científicos de Datos

Los equipos de ciencia de datos generalmente incluyen varios profesionales de análisis y datos y se pueden configurar de diferentes maneras, como se explica aquí junto con consejos para administrarlos.

por Mary K. Pratt

Científicos de Datos
Científicos de Datos

Las organizaciones ven cada vez más los datos como un activo valioso que les ayudará a tener éxito ahora y en el futuro. En una encuesta de 2019 a profesionales de BI y análisis, un 94% combinado de los 500 encuestados citó los datos y el análisis como contribuyentes muy importantes o algo importantes para el crecimiento empresarial y las estrategias de transformación digital en sus organizaciones.

La encuesta, realizada para el proveedor de software de BI MicroStrategy y detallada en un informe titulado “2020 Global State of Enterprise Analytics “, también encontró que el 59% de esas organizaciones estaban avanzando en aplicaciones de análisis avanzadas y predictivas , el ámbito de la ciencia de datos. Eso fue siete puntos porcentuales más que una encuesta similar realizada un año antes.

Sin embargo, la encuesta también confirmó que existen muchos desafíos cuando se trata de convertir datos en información procesable. Los encuestados mencionaron las preocupaciones de seguridad y privacidad como la barrera número uno para un uso más efectivo de los datos y el análisis, pero otros importantes incluyeron el acceso limitado a los datos en silos, la falta de talento calificado , la capacitación insuficiente de los empleados y la ausencia de una estrategia de análisis.

Los ejecutivos han respondido a tales desafíos, en parte, creando equipos de ciencia de datos para liderar sus esfuerzos en áreas como minería de datos , modelado predictivo, aprendizaje automático e inteligencia artificial. Eso ha coincidido con un número creciente de puestos relacionados con los datos en muchas empresas, así como con el desarrollo de las mejores prácticas para estructurar y gestionar un equipo de ciencia de datos. Veamos más de cerca cómo hacerlo.

Diferentes modelos para estructurar un equipo de ciencia de datos

“Hasta cierto punto, construir y mantener un sólido equipo de ciencia de datos es un arte”, dijo John Bottega, presidente del EDM Council, una asociación global que se enfoca en las mejores prácticas, estándares y capacitación de administración de datos.

Las responsabilidades de la recopilación, gestión y análisis de datos solían recaer en el CIO, cuyo equipo de TI trabajaba con los usuarios comerciales para implementar almacenes de datos y sistemas de BI para almacenar y organizar datos y realizar análisis e informes básicos. Sin embargo, durante las últimas dos décadas, más organizaciones separaron la función de datos en su propio departamento a medida que crecía la cantidad de almacenes de datos internos, las tecnologías de soporte evolucionaban y las tareas relacionadas con los datos se volvían más diferenciadas y especializadas.

La creciente importancia de la analítica avanzada para el éxito empresarial también impulsó la necesidad de un equipo de ciencia de datos con científicos de datos capacitados y otros trabajadores. Hoy en día, muchas organizaciones tienen un equipo o un departamento completo de ciencia de datos; los más grandes pueden tener varios equipos que operan de manera independiente o coordinada.

La forma en que las empresas estructuran sus equipos varía según la madurez de su programa de ciencia de datos, así como sus objetivos de análisis de datos, la estructura organizativa general y la cultura empresarial. Sin embargo, han surgido algunos modelos comunes sobre la estructura del equipo de ciencia de datos, y cada uno tiene pros y contras. Las estructuras de equipo pueden ser:

  • Descentralizado. Los miembros del equipo de ciencia de datos trabajan dentro de las unidades de negocio individuales a las que dan soporte. Esto permite que los miembros del equipo colaboren estrechamente con los ejecutivos comerciales y los trabajadores en proyectos de ciencia de datos , pero puede obstaculizar el uso estratégico de los datos en una organización y requerir más recursos de los que las empresas más pequeñas pueden tener disponibles.
  • Centralizado. La función de ciencia de datos está consolidada a nivel empresarial bajo un solo gerente, que asigna miembros del equipo a proyectos individuales y supervisa su trabajo. Este modelo permite más fácilmente una visión estratégica de toda la empresa y la implementación uniforme de las mejores prácticas de análisis, pero puede limitar la capacidad de los miembros del equipo para convertirse en expertos en un área particular del negocio. Algunas organizaciones establecen un centro de excelencia de ciencia de datos formal para albergar un equipo centralizado.
  • Híbrido. El equipo de ciencia de datos se administra de manera centralizada, pero los miembros están asignados para trabajar con operaciones comerciales específicas y son responsables de ayudar a esas unidades a alcanzar sus objetivos para tomar decisiones basadas en datos. En las estructuras híbridas, un centro de excelencia también puede centrarse en promover las mejores prácticas y estándares de ciencia de datos . Al igual que con el modelo descentralizado, las limitaciones de recursos pueden ser un problema.

Funciones y responsabilidades del equipo de ciencia de datos

Hay algunos elementos comunes que un equipo de ciencia de datos debe tener para tener éxito.

“Independientemente de la industria, los equipos de ciencia de datos deben ser fuertes en tres áreas centrales: matemáticas, tecnología y perspicacia comercial”, dijo Bottega. “Encontrar una sola persona que sobresalga en los tres es bastante raro. Muchas empresas tendrán a alguien que domine dos de tres y luego el resto del equipo se puede construir alrededor de eso, llenando los vacíos para asegurar que el equipo en su conjunto es fuerte en los tres “.

Las organizaciones pequeñas o aquellas con necesidades analíticas limitadas o iniciativas de ciencia de datos en etapa temprana pueden tener un generalista que se encargue de todas las tareas requeridas. Las entidades más grandes, así como aquellas con programas más maduros, generalmente incluyen alguna combinación de los siguientes roles en sus equipos de ciencia de datos.

Científico de datos. Como indica el título, los científicos de datos son los miembros principales de un equipo. Utilizan métodos estadísticos, algoritmos de aprendizaje automático y otras herramientas para analizar datos y crear modelos predictivos; algunos también crean productos de datos, motores de recomendación, chatbots y otras tecnologías para varios casos de uso. Los científicos de datos suelen tener una variedad de habilidades en áreas como matemáticas, estadísticas, gestión de datos, minería de datos, codificación y modelado, así como conocimientos comerciales y habilidades de comunicación y colaboración. Cada vez más, también tienen títulos avanzados en ciencia de datos.

Analista de datos. Un analista de datos no tiene el conjunto completo de habilidades de un científico de datos, pero puede apoyar los esfuerzos de la ciencia de datos. Las principales responsabilidades de los analistas de datos son recopilar y mantener datos de sistemas operativos y bases de datos, utilizar métodos estadísticos y herramientas de análisis para interpretar los datos y preparar paneles e informes para los usuarios comerciales.

Ingeniero de datos. Los ingenieros de datos son responsables de construir, probar y mantener las canalizaciones de datos; generalmente tienen una formación en ingeniería de software o ciencias de la computación que se adapta a su enfoque en la infraestructura tecnológica y la recopilación, gestión y almacenamiento de datos. También suelen trabajar en estrecha colaboración con los científicos de datos en la calidad de los datos, la preparación de los datos y las tareas de implementación y mantenimiento de modelos.

Arquitecto de datos. Un arquitecto de datos diseña y supervisa la implementación de los sistemas subyacentes y la infraestructura de datos que utiliza el equipo. En algunos casos, un ingeniero de datos también puede encargarse de esta función.

Ingeniero de aprendizaje automático. También llamado a veces ingeniero de IA, este puesto trabaja en conjunto con científicos de datos para crear, implementar y mantener los algoritmos y modelos necesarios para el aprendizaje automático y las iniciativas de IA .

En algunas organizaciones, los equipos de ciencia de datos también pueden incluir estos puestos.

Científico de datos ciudadanos. Un rol informal, esto puede involucrar a analistas de negocios, usuarios avanzados de unidades de negocios y otros empleados que son capaces de hacer su propio trabajo de análisis de datos. Los científicos de datos ciudadanos a menudo tienen interés, perspicacia o algo de capacitación en análisis avanzado, aunque las tecnologías que utilizan, por ejemplo, herramientas de aprendizaje automático automatizadas , generalmente requieren poca o ninguna codificación. A menudo trabajan fuera de un equipo de ciencia de datos, pero pueden incorporarse a equipos integrados en unidades de negocio.

Analista de negocios. En algunos casos, los analistas comerciales pueden ser miembros de un equipo de ciencia de datos en su función habitual, que incluye evaluar los procesos comerciales y traducir los requisitos comerciales en planes de análisis, áreas en las que pueden ayudar a respaldar el trabajo de los científicos de datos.

Traductor de datos. Una nueva incorporación a la lista, estos profesionales, también conocidos como traductores analíticos, actúan como enlace entre los equipos de ciencia de datos y las operaciones comerciales, y ayudan a planificar proyectos y traducir la información obtenida del análisis de datos en acciones comerciales recomendadas.

Desarrollador o ingeniero de visualización de datos. Tienen la tarea de crear visualizaciones de datos para hacer que la información sea más accesible y comprensible para los profesionales de negocios. Sin embargo, los científicos de datos y los analistas de datos pueden manejar este rol ellos mismos en algunos equipos.

¿Quién administra y supervisa los equipos de ciencia de datos?

Un equipo puede estar dirigido por un director de ciencia de datos, gerente de ciencia de datos, científico de datos líder o puesto gerencial similar. La estructura de informes de los equipos varía de manera similar. Sin embargo, generalmente las organizaciones asignan un ejecutivo de nivel C o un gerente funcional de alto rango para supervisar el equipo de ciencia de datos.

El líder en ciencia de datos más visible es el director de datos . El puesto de CDO se remonta a 2002, con la firma de servicios financieros Capital One ampliamente reconocida como la primera empresa en implementar el puesto. Desde entonces, muchos otros han seguido su ejemplo: la consultora de datos y análisis NewVantage Partners informó que el 65% de las 85 grandes empresas encuestadas en 2020 tenían CDO, en comparación con el 12% cuando realizó la primera encuesta anual en 2012. Inicialmente se centró principalmente en la gobernanza de datos, la gestión y funciones de seguridad, muchos CDO ahora también han asumido la responsabilidad de la ciencia de datos, el análisis y la inteligencia artificial.

Otras organizaciones han creado un rol de director de análisis (CAO) para supervisar sus equipos de análisis y ciencia de datos , mientras que algunas han combinado los puestos de CDO y CAO en un solo director de análisis y datos. Además, el jefe de un equipo de ciencia de datos puede depender de un ejecutivo diferente, por ejemplo, el COO, CFO o CIO, o un puesto como vicepresidente de análisis, vicepresidente de datos comerciales o director de datos y estrategia.

Este organigrama es un ejemplo de cómo se puede estructurar una ciencia de datos.

Cómo trabajan los científicos de datos con los usuarios empresariales

Las organizaciones de todo tipo se esfuerzan por estar basadas en datos , y con una buena razón: muchas lo ven como una clave para seguir siendo competitivos en la era digital. Con ese fin, los equipos de ciencia de datos deben trabajar en colaboración con los gerentes comerciales para:

  1. Comprenda claramente las preguntas comerciales que quieren que el equipo responda.
  2. Exprese los objetivos que tienen para utilizar la información que proporciona.
  3. Planifique cómo aplicar la información para tomar decisiones y emprender acciones.

“Los científicos de datos deben trabajar en estrecha colaboración con la unidad de negocios para comprender cómo los datos que proporcionan ayudan a impulsar el negocio y comprender exactamente lo que [los usuarios comerciales] necesitan de los datos”, dijo Josh Drew, vicepresidente regional de Robert Half en el área de Boston. Technology y The Creative Group, dos unidades de la firma de personal Robert Half International Inc.

Una vez que tienen ese conocimiento, los equipos de ciencia de datos no pueden simplemente presentar sus hallazgos. Deben ayudar a sus colegas comerciales a comprender los conocimientos adquiridos a partir de los datos y cómo esa información puede dar forma a las ofertas de productos y servicios, las campañas de marketing, la gestión de la cadena de suministro y otras partes clave de las operaciones comerciales para respaldar los objetivos empresariales, como mayores ingresos, mayor eficiencia y mejor servicio al cliente.

Herramientas que necesita un equipo de ciencia de datos

Docenas de herramientas, que van desde software de visualización y generación de informes de datos hasta análisis avanzado, aprendizaje automático y tecnologías de inteligencia artificial, permiten el trabajo que realizan los equipos de ciencia de datos. El número y la combinación de tecnologías necesarias es exclusivo de cada equipo, según sus objetivos y niveles de habilidad.

La siguiente es una lista de herramientas de ciencia de datos de uso común que incluye tecnologías comerciales y de código abierto:

  • herramientas de análisis estadístico , como SAS e IBM SPSS;
  • bibliotecas y marcos de aprendizaje automático, incluidos TensorFlow, Weka, Scikit-learn, Keras y PyTorch;
  • plataformas de ciencia de datos de varios proveedores que brindan diversos conjuntos de capacidades para análisis, aprendizaje automático automatizado y administración y colaboración del flujo de trabajo;
  • lenguajes de programación, en particular Python, R, Julia, SQL, Scala y Java;
  • Jupyter Notebook y otras aplicaciones de notebook interactivas para compartir documentos que contienen código, ecuaciones, comentarios e información relacionada;
  • bibliotecas y herramientas de visualización de datos, como Tableau, D3.js y Matplotlib;
  • Spark, Hadoop y otras plataformas de big data y motores de análisis, así como servicios de almacenamiento de objetos en la nube y bases de datos NoSQL; y
  • el servicio de orquestación de contenedores de Kubernetes para implementar cargas de trabajo de análisis y aprendizaje automático en la nube.

Mejores prácticas para administrar un equipo de ciencia de datos

Los ejecutivos y líderes de equipo que buscan construir y madurar sus programas de ciencia de datos deben considerar las siguientes mejores prácticas para administrar sus equipos.

  • Busque trabajadores con una variedad de habilidades comerciales e interpersonales además de las técnicas para ayudar a garantizar que el equipo pueda cumplir con los objetivos de la organización.
  • Cree una cultura de aprendizaje e innovación que desafíe a los miembros del equipo y los aliente a aportar nuevas ideas a los problemas y asuntos comerciales.
  • Promocione proyectos de análisis que fomenten una estrecha colaboración entre el equipo de ciencia de datos y las unidades de negocio que apoyan.
  • Evalúe a los miembros del equipo, al menos en parte, sobre los éxitos comerciales que impulsa su trabajo.
  • Desarrolle un programa de tutoría para ayudar a mejorar las habilidades de los miembros más jóvenes del equipo y realice capacitación continua para garantizar que todos los trabajadores se mantengan actualizados sobre las técnicas y tecnologías clave de ciencia de datos .
  • Debido a que los científicos de datos tienen una gran demanda y los experimentados tienen muchas oportunidades de trabajo, diseñe un programa de gestión del talento para ayudar a evitar que ellos y otros miembros del equipo se vayan.

Fuente: https://searchbusinessanalytics.techtarget.com/feature/How-to-structure-and-manage-a-data-science-team

Escasez Científicos de Datos
Escasez de Científicos de Datos

5 formas en que las empresas se adaptan a la escasez de científicos de datos

¿Dónde están todos los científicos de datos? Hacer frente a la escasez de científicos de datos es una lucha para muchas empresas. A continuación, presentamos cinco formas de gestionar eficazmente la escasez.

por Ericka Chickowski

A medida que las empresas establecen culturas centradas en los datos para la toma de decisiones y la planificación, los científicos de datos continúan ganando importancia para las empresas de todo el mundo. Pero las organizaciones no pueden contratar científicos de datos lo suficientemente rápido, ya que el campo de candidatos calificados sigue siendo muy limitado.

Para hacer frente a esta escasez de científicos de datos, las empresas están adoptando una variedad de enfoques para obtener todo lo que puedan de los pocos profesionales de datos que pueden encontrar y retener.

Automatización

Gran parte del trabajo que suelen realizar los científicos de datos se centra en la gestión de datos y las tareas operativas como identificar fuentes de datos, fusionar conjuntos de datos y validar la calidad de los datos. Estas tareas no son el trabajo de alto valor para el que generalmente se contrata a los científicos de datos. Eso está cambiando a medida que llegan más esfuerzos de automatización a la empresa.

“El desarrollo del modelo, así como la operacionalización del modelo, se puede simplificar significativamente mediante la automatización”, dijo Ryohei Fujimaki, director ejecutivo y fundador de DotData, una empresa de software de aprendizaje automático (ML) con sede en San Mateo, California. “Nuevas plataformas de automatización de ciencia de datos permitirá a las empresas implementar, operar y mantener procesos de ciencia de datos en producción con un esfuerzo mínimo, ayudando a las empresas a maximizar sus inversiones en IA y ML y su equipo de datos actual “.

Según Matthew Baird, fundador y CTO de AtScale , una empresa de software de ingeniería de datos automatizada, algunos de los desarrollos más prometedores en la automatización de la ciencia de datos se encuentran en el área de la ingeniería de datos autónoma, que automatiza la gestión de datos y las tareas de manejo.

“Dichos avances vienen en forma de ingeniería de datos ‘justo a tiempo’: automatización que esencialmente actúa como el equipo de ingeniería de datos perfecto si tuvieran todo ese conocimiento y aportes completos al manejo de datos”, dijo Baird, “incluida la comprensión de cómo para aprovechar al máximo las estructuras de datos subyacentes de varias bases de datos, sus características de red únicas, ubicación de datos, configuración de seguridad nativa y políticas “.

Cronología de los avances de la analítica empresarial
La automatización es el siguiente paso para los avances en la analítica empresarial.

Enfatizando el análisis de autoservicio

Toda esta automatización de modelado y gestión de datos adicional está destinada no solo a sacar el máximo provecho de los científicos de datos de alto nivel, sino también a democratizar los recursos de datos para los científicos de datos ciudadanos. Ampliar la exploración de datos con análisis de autoservicio es otro método popular para lidiar con la escasez de científicos de datos.

“La combinación de los avances en la ingeniería de datos autónomos y la creciente habilitación de los analistas ciudadanos a través del análisis de autoservicio están liberando valiosos recursos de ciencia de datos e ingeniería de datos para enfocarse en actividades de mayor valor, como construir el próximo en aprendizaje automático o modelos de inteligencia artificial”. Dijo Baird.

Creando equipos multifuncionales

Al mismo tiempo, las empresas se topan con los límites de la automatización y las herramientas de análisis de autoservicio.Muchas empresas responden a la escasez de científicos de datos creando equipos de ciencia de datos multifuncionales que trabajan con muchas unidades de negocio en una organización o contratando consultores externos.Chris NicholsonFundador y CEO, Pathmind

“Cada herramienta que simplifica la ciencia de datos también limita la flexibilidad y las opciones de los usuarios, lo que significa que ciertas tareas complejas que requieren personalización son imposibles”, dijo Chris Nicholson, fundador y CEO de Pathmind, una compañía de software de aprendizaje profundo. Nicholson cree que esta realidad ha llevado a muchas empresas a explorar nuevas estrategias de equipo para sacar más provecho de sus limitados expertos en datos.

“Muchas empresas responden a la escasez de científicos de datos creando equipos de ciencia de datos multifuncionales que trabajan con muchas unidades de negocio en una organización o contratando consultores externos”, dijo Nicholson. “A menudo, lo que limita el valor de la ciencia de datos en una organización no es la escasez de científicos de datos en sí, sino los datos que la organización recopila y cómo permite que las personas accedan y procesen esos datos”.

Los equipos multifuncionales pueden ayudar a las empresas a sortear los silos de datos fragmentados que se han creado debido a obstáculos técnicos y políticos internos que pueden superarse cuando las partes interesadas adecuadas trabajan juntas en los mismos equipos, dijo Nicholson.

Esto también puede aliviar un problema común que parece una escasez de científicos de datos, pero es aún más fundamental, es decir, que demasiados proyectos de ciencia de datos parecen inmanejables porque no tienen un camino claro hacia el valor comercial.

“Demasiados proyectos son una búsqueda inútil en la que arrojas un montón de datos a los científicos de datos y dices: ‘Mira qué puedes hacer con esto'”, dijo Sten Vesterli, consultor principal de More Than Code, una firma de consultoría de TI con sede en Dinamarca. “Hemos visto que más del 80% de todos los proyectos de ciencia de datos no logran pasar del laboratorio al código de producción, y las empresas deben asignar su científico de datos al objetivo comercial de mayor valor “.

Definir mejor los roles de la ciencia de datos

Uno de los grandes problemas que impiden el reclutamiento efectivo de científicos de datos es que las empresas están ampliando demasiado el título y el rol de la ciencia de datos , dijo Amy Hodler, directora de análisis de gráficos y programas de IA en la empresa de bases de datos de gráficos Neo4j.

“Esto hace que sea difícil encontrar la solución adecuada para cualquier organización y significa que los nuevos empleados tienen más dificultades para comprender y alinearse con los objetivos comerciales”, dijo Hodler.

Ella cree que en el próximo año, muchas organizaciones comenzarán a diversificar sus títulos relacionados con la ciencia de datos, creando enfoques de trabajo de subcategorías y requisitos de trabajo más enfocados.

Entrenamiento interno

Hodler también cree que el mercado comenzará a responder a la escasez de científicos de datos este año con más capacitación interna de los empleados existentes que exhiban cualquier potencial o deseo de pivotar hacia la ciencia de datos . Esta será una táctica de acertar o fallar, ya que las organizaciones tendrán que ser estratégicas sobre las habilidades específicas que cultivan en sus científicos de datos en ciernes, dijo.

“Se requiere una mentalidad a largo plazo para evaluar y definir claramente los conjuntos de habilidades requeridos de una manera que equilibre no solo las herramientas / enfoques que están de moda hoy en día, sino también la inversión en conceptos básicos que se puedan desarrollar en los años venideros”, dijo Hodler. “Emparejar a científicos de datos junior y senior será crucial para la evolución y la retención de estos empleados durante los próximos años”.

Profundice en el equipo de inteligencia empresarial

Fuente: https://searchbusinessanalytics.techtarget.com/feature/5-ways-enterprises-adapt-to-the-data-scientist-shortage

Deja una respuesta