por Isaac Sacolick

MLOps vs ModelOps en Machine Learning - Isaac Sacolick

En el informe sobre el estado de la IA en 2020 , el 50 % de los encuestados afirma que sus empresas han adoptado la inteligencia artificial en al menos una función empresarial. Excluyendo lo que este informe etiqueta como “empresas de IA de alto rendimiento”, solo el 17% de todos los demás encuestados tienen una visión y una estrategia de IA claramente definidas.

¿Quiénes son los de alto rendimiento? Los de alto rendimiento afirman que el 20 % o más de las ganancias empresariales de sus organizaciones en 2019 se atribuyeron al uso de IA. No es sorprendente que solo el 8 % de los encuestados autoevaluó a sus empresas como de alto rendimiento.

Lo siento amigos, esta es una historia del vaso medio lleno. Si solo las empresas de alto rendimiento pueden aprovechar el talento, los procesos y la tecnología necesarios para aprovechar el aprendizaje automático, se puede crear otro foso disruptivo para la transformación digital que implementan las PYMES. Las PYMES también deben experimentar con el aprendizaje automático y apuntar para tener éxito con la IA .

Comprender el ciclo de vida del aprendizaje automático

Si bien hay mucho que comprender, crear estrategias, priorizar, planificar, implementar, monitorear y administrar en el ciclo de vida del aprendizaje automático, no es insuperable. En mi episodio 22 de 5 minutos con @NYIke , comparto de qué se tratan MLOps y ModelOps.

  • MLOps es similar a DevOps y se  centra en la colaboración, la automatización, las implementaciones y la infraestructura.
  • ModelOps es similar al ciclo de vida de desarrollo de software (SDLC) y se centra en el desarrollo, las pruebas, la publicación y la supervisión de modelos. 

Mire el video de 5 minutos y luego lea a continuación algunas diferencias muy importantes en el aprendizaje automático y el desarrollo de software.

En qué se diferencia el aprendizaje automático del SDLC y DevOps

Ahora aquí es donde hay algunas diferencias marcadas entre el aprendizaje automático y el desarrollo de software.

  1. MLOps debe abordar múltiples modelos de escalabilidad:  la automatización de la infraestructura como código (IaC) tiene más variabilidad para los casos de uso de aprendizaje automático que el desarrollo de software. Las necesidades de infraestructura del equipo de ciencia de datos son muy episódicas según la frecuencia con la que entrenan los modelos, los tamaños de los conjuntos de datos, la topología del modelo, la cantidad de experimentos paralelos, los costos, entre otros factores. Probar modelos y ejecutarlos en producción tienen diferentes consideraciones de rendimiento según los volúmenes de datos, los tiempos de respuesta del modelo, los factores de uso del modelo, el costo y los requisitos de rendimiento. 
  2. ModelOps debe traer POC exitosos -> Producción: si bien el aprendizaje automático es una ciencia que requiere experimentación , el objetivo debe ser llevar modelos exitosos a producción. Podemos confiar en los usuarios finales y los propietarios de productos ágiles para dirigir las necesidades comerciales y las propuestas de valor de regreso a los objetivos y prioridades de implementación en el desarrollo de software. Con el aprendizaje automático, la experimentación es el viaje y la habilitación del modelo para la producción es un paso importante. Pero el valor comercial solo se logra cuando ese modelo se utiliza en otra aplicación, servicio, visualización de datos o proceso comercial.   
  3. MLOps y ModelOps deben abordar la desviación del modelo: nos preocupan los incidentes, el rendimiento, la confiabilidad, la seguridad y los defectos con las aplicaciones y los servicios de software de producción. Con los modelos de aprendizaje automático, también debemos preocuparnos por la deriva del modelo y cuándo es necesario volver a entrenar los modelos.

Consideración estratégica para implementaciones de aprendizaje automático 

Oh, sí, hay muchas más consideraciones y opciones en el aprendizaje automático. Algunos, como marcos y plataformas, tienen puntos en común en el desarrollo de software, otros son específicos del aprendizaje automático.  

  • Sesgo en los datos y si los datos de entrenamiento tienen suficiente muestra en los segmentos objetivo
  • La reutilización de características tiene todas las complejidades de crear catálogos de datos y microservicios reutilizables
  • Explicabilidad del modelo  para que los expertos en la materia, los usuarios finales y los auditores entiendan cómo los modelos llegan a sus predicciones. 
  • Marcos en evolución : Keras, Pytorch, Tensorflow, Scikit-learn,  
  • Algoritmos en evolución : SVM, Bayes, KNN, K-Means, bosques aleatorios, aprendizaje por refuerzo
  • Plataformas en evolución : Alteryx, Azure ML Studio, Databricks, Dataiku, Google Cloud ML, RapidMiner, SAS, SageMaker, Watson,

¿Qué significa esto para el 92 % de las empresas que no tienen un alto rendimiento en IA? La IA y el aprendizaje automático no son fáciles, pero mantenerse al margen es demasiado arriesgado. Por eso es fundamental obtener más información sobre el desarrollo de una estrategia de inteligencia artificial y aprendizaje automático . 

Deja una respuesta