Google Cloud AI

por Martin Heller

A Google Cloud AI and Machine Learning Platform le faltan algunas piezas, y muchas aún están en versión beta, pero su alcance y calidad son insuperables.

Google Cloud AI
Google Cloud AI

Google tiene una de las pilas de aprendizaje automático más grandes de la industria, y actualmente se centra en su plataforma de aprendizaje automático e inteligencia artificial de Google Cloud. Google lanzó TensorFlow como código abierto hace años, pero TensorFlow sigue siendo el marco de aprendizaje profundo más maduro y citado . De manera similar, Google lanzó Kubernetes como código abierto hace años, pero sigue siendo el sistema de gestión de contenedores dominante.

Google es una de las principales fuentes de herramientas e infraestructura para desarrolladores, científicos de datos y expertos en aprendizaje automático, pero históricamente la IA de Google no ha sido tan atractiva para los analistas de negocios que carecen de conocimientos serios en ciencia de datos o programación. Eso está empezando a cambiar.

Google Cloud AI and Machine Learning Platform incluye componentes básicos de AI, la plataforma y aceleradores de AI, y soluciones de AI. Las soluciones de IA son bastante nuevas y están dirigidas a gerentes comerciales en lugar de científicos de datos. Pueden incluir consultas de Google o sus socios.

Los bloques de construcción de IA, que están entrenados previamente pero son personalizables, se pueden usar sin un conocimiento profundo de programación o ciencia de datos. Sin embargo, los científicos de datos expertos los utilizan a menudo por razones pragmáticas, esencialmente para hacer las cosas sin un entrenamiento extenso del modelo.

La plataforma de inteligencia artificial y los aceleradores son generalmente para científicos de datos serios y requieren habilidades de codificación, conocimiento de técnicas de preparación de datos y mucho tiempo de capacitación. Recomiendo ir allí solo después de probar los bloques de construcción relevantes.

Todavía faltan algunos enlaces en las ofertas de inteligencia artificial de Google Cloud, especialmente en la preparación de datos. Lo más parecido que tiene Google Cloud a un servicio de acondicionamiento e importación de datos es Cloud Dataprep de Trifacta; Lo probé hace un año y me decepcionó. Sin embargo, la ingeniería de funciones integrada en Cloud AutoML Tables es prometedora y sería útil tener ese tipo de servicio disponible para otros escenarios.

La parte inferior sórdida de la IA tiene que ver con la ética y la responsabilidad (o la falta de ellas), junto con los sesgos persistentes del modelo (a menudo debido a los datos sesgados utilizados para el entrenamiento). Google publicó sus Principios de IA en 2018. Es un trabajo en progreso, pero es una base para la orientación, como se discutió en una publicación reciente del blog sobre IA responsable.

Hay mucha competencia en el mercado de la IA (más de una docena de proveedores) y mucha competencia en el mercado de la nube pública (más de media docena de proveedores creíbles). Para hacer justicia a las comparaciones, tendría que escribir un artículo al menos cinco veces más largo que este, así que por mucho que odie dejarlos fuera, tendré que omitir la mayoría de las comparaciones de productos. Para la comparación más obvia, puedo resumir: AWS hace la mayor parte de lo que hace Google, y también es muy bueno, pero generalmente cobra precios más altos.

plataforma google cloud ai 01

Los componentes básicos de la IA de Google Cloud no requieren mucha experiencia en aprendizaje automático, sino que se basan en modelos previamente entrenados y entrenamiento automático. AI Platform te permite entrenar e implementar tus propios modelos de aprendizaje automático y aprendizaje profundo.

Bloques de creación de IA de Google Cloud

Los Building Blocks de Google Cloud AI son componentes fáciles de usar que puedes incorporar en tus propias aplicaciones para agregar datos visuales, de lenguaje, de conversación y estructurados. Muchos de los componentes básicos de la IA son redes neuronales previamente entrenadas, pero se pueden personalizar con el aprendizaje por transferencia y la búsqueda de redes neuronales si no satisfacen sus necesidades de inmediato. AutoML Tables es un poco diferente, ya que automatiza el proceso que usaría un científico de datos para encontrar el mejor modelo de aprendizaje automático para un conjunto de datos tabulares.

AutoML

Los servicios de Google Cloud AutoML proporcionan redes neuronales profundas personalizadas para la traducción de pares de idiomas, clasificación de texto, detección de objetos, clasificación de imágenes y clasificación y seguimiento de objetos de video. Requieren datos etiquetados para la capacitación, pero no requieren un conocimiento significativo de aprendizaje profundo, aprendizaje por transferencia o programación.

Google Cloud AutoML personaliza las redes neuronales profundas de alta precisión probadas en batalla de Google para sus datos etiquetados. En lugar de comenzar desde cero al entrenar modelos a partir de sus datos, AutoML implementa el aprendizaje de transferencia profunda automática (lo que significa que comienza a partir de una red neuronal profunda existente entrenada en otros datos) y la búsqueda de arquitectura neuronal (lo que significa que encuentra la combinación correcta de capas de red adicionales ) para la traducción de pares de idiomas y los demás servicios enumerados anteriormente.

En cada área, Google ya tiene uno o más servicios previamente capacitados basados ​​en redes neuronales profundas y enormes conjuntos de datos etiquetados. Estos pueden funcionar para sus datos sin modificar, y debe probarlos para ahorrar tiempo y dinero. Si no hacen lo que necesitas, Google Cloud AutoML te ayuda a crear un modelo que sí lo hace, sin requerir que sepas cómo realizar el aprendizaje por transferencia o cómo diseñar redes neuronales.

El aprendizaje por transferencia ofrece dos grandes ventajas sobre el entrenamiento de una red neuronal desde cero. Primero, requiere muchos menos datos para el entrenamiento, ya que la mayoría de las capas de la red ya están bien entrenadas. En segundo lugar, entrena mucho más rápido, ya que solo optimiza las capas finales.

Si bien los servicios de Google Cloud AutoML solían presentarse juntos como un paquete, ahora se enumeran con sus servicios básicos previamente capacitados. Lo que la mayoría de las otras empresas llaman AutoML lo realiza Google Cloud AutoML Tables.

plataforma google cloud ai 02
Probé un clasificador de flores personalizado de AutoML Vision, que entrené en una hora a partir de imágenes de muestra de Google, con una foto de tulipanes que tomé en un museo de arte cercano.

Tablas de AutoML

El proceso habitual de ciencia de datos para muchos problemas de regresión y clasificación es crear una tabla de datos para entrenamiento, limpiar y acondicionar los datos, realizar ingeniería de características e intentar entrenar todos los modelos apropiados en la tabla transformada, incluido un paso para optimizar hiperparámetros de los mejores modelos. Google Cloud AutoML Tables puede realizar todo este proceso automáticamente una vez que identifica manualmente el campo de destino.

AutoML Tables busca automáticamente en el zoológico de modelos de Google datos estructurados para encontrar el mejor modelo para sus necesidades, que van desde modelos de regresión lineal / logística para conjuntos de datos más simples hasta métodos avanzados de búsqueda profunda, de conjuntos y de arquitectura para los más grandes y complejos. Automatiza la ingeniería de características en una amplia gama de primitivas de datos tabulares, como números, clases, cadenas, marcas de tiempo y listas, y lo ayuda a detectar y ocuparse de valores perdidos, valores atípicos y otros problemas comunes de datos.

Su interfaz sin código lo guía a través de todo el ciclo de vida del aprendizaje automático de punta a punta, lo que facilita que cualquier miembro de su equipo cree modelos e incorpore de manera confiable en aplicaciones más amplias. AutoML Tables proporciona una gran cantidad de datos de entrada y funciones de explicabilidad del comportamiento del modelo, junto con medidas de seguridad para evitar errores comunes. AutoML Tables también está disponible en entornos de API y portátiles.

AutoML Tables compite con Driverless AI y varias otras implementaciones y marcos de AutoML.

plataforma google cloud ai 03
Google Cloud AutoML Tables automatiza toda la canalización para crear modelos predictivos para datos tabulares, desde la ingeniería de funciones hasta la implementación.
plataforma google cloud ai 04
En la fase Analizar de AutoML Tables, puede ver las estadísticas descriptivas de todas sus funciones originales.
plataforma google cloud ai 05 sm
La interfaz gratuita “Prueba la API” de Google Cloud Vision me permitió arrastrar un archivo JPEG a una página web y ver los resultados. El niño estaba sonriendo, por lo que la etiqueta “Joy” es correcta. El algoritmo no reconoció del todo el sombrero de peregrino de papel.

API Vision

La API de Google Cloud Vision es un servicio de aprendizaje automático previamente capacitado para categorizar imágenes y extraer varias funciones. Puede clasificar imágenes en miles de categorías previamente entrenadas, que van desde objetos genéricos y animales que se encuentran en la imagen (como un gato), a condiciones generales (por ejemplo, anochecer), a puntos de referencia específicos (Torre Eiffel, Gran Cañón), e identificar propiedades generales de la imagen, como sus colores dominantes. Puede aislar áreas que son caras, luego aplicar análisis geométricos (orientación facial y puntos de referencia) y emocionales a las caras, aunque no reconoce las caras como pertenecientes a personas específicas, excepto celebridades (que requiere una licencia de uso especial). Vision API utiliza OCR para detectar texto dentro de imágenes en más de 50 idiomas y varios tipos de archivos. También puede identificar logotipos de productos y detectar adultos,

API de inteligencia de video

La API de Google Cloud Video Intelligence reconoce automáticamente más de 20.000 objetos, lugares y acciones en videos almacenados y en streaming. También distingue los cambios de escena y extrae metadatos enriquecidos a nivel de video, toma o fotograma. Además, realiza la detección y extracción de texto mediante OCR, detecta contenido explícito, automatiza subtítulos y subtítulos, reconoce logotipos y detecta rostros, personas y poses.

Google recomienda la API de inteligencia de video para extraer metadatos para indexar, organizar y buscar su contenido de video. Puede transcribir videos y generar subtítulos, así como marcar y filtrar contenido inapropiado, todo de manera más rentable que los transcriptores humanos. Los casos de uso incluyen moderación de contenido, recomendaciones de contenido, archivos multimedia y anuncios contextuales.

plataforma google cloud ai 06 sm
La API de Google Cloud Natural Language busca entidades, opiniones, sintaxis y categorías. Aquí vemos diagramas de sintaxis para dos oraciones de un comunicado de prensa de Google.

API de lenguaje natural

El procesamiento del lenguaje natural (PNL) es una gran parte de la “salsa secreta” que hace que la entrada a la Búsqueda de Google y al Asistente de Google funcionen bien. La API de Google Cloud Natural Language expone esa misma tecnología a sus programas. Puede realizar análisis de sintaxis (ver la imagen a continuación), extracción de entidades, análisis de opiniones y clasificación de contenido, en 10 idiomas. Puede especificar el idioma si lo conoce; de lo contrario, la API intentará detectar automáticamente el idioma. Una API separada, actualmente disponible para acceso anticipado a pedido, se especializa en contenido relacionado con la atención médica.

Lea la revisión completa de las API de aprendizaje automático de Google Cloud

Traducción

La API de Google Cloud Translation puede traducir más de cien pares de idiomas, puede detectar automáticamente el idioma de origen si no lo especifica y viene en tres versiones: traducción básica, avanzada y multimedia. La API de traducción avanzada admite un glosario, traducción por lotes y el uso de modelos personalizados. La API de traducción básica es esencialmente lo que utiliza la interfaz de Google Translate para el consumidor. AutoML Translation te permite entrenar modelos personalizados mediante el aprendizaje por transferencia.

La API de traducción de medios traduce el contenido directamente del audio (voz), ya sea archivos de audio o transmisiones, en 12 idiomas, y genera puntuación automáticamente. Hay modelos separados para video y audio de llamadas telefónicas.

Texto a voz

La API de Google Cloud Text-to-Speech convierte el texto sin formato y el marcado SSML en sonido, con una selección de más de 200 voces y 40 idiomas y variantes. Las variantes incluyen diferentes acentos nacionales, como inglés estadounidense, británico, sudafricano, indio, irlandés y australiano.

Las voces básicas a menudo suenan bastante mecánicas; Las voces WaveNet suelen sonar más naturales, pero su uso cuesta un poco más. También puede crear voces personalizadas a partir de sus propias grabaciones de audio con calidad de estudio.

Puede ajustar la velocidad de las voces sintetizadas hasta 4 veces más rápido o más lento, y el tono hasta 20 semitonos hacia arriba o hacia abajo. Las etiquetas SSML le permiten agregar pausas, números, formato de fecha y hora y otras instrucciones de pronunciación. También puede aumentar la ganancia de volumen hasta 16 dB o disminuir el volumen hasta -96 dB.

Dictado a texto

La API de Google Cloud Speech-to-Text convierte la voz en texto utilizando los algoritmos de red neuronal de aprendizaje profundo más avanzados de Google para el reconocimiento automático de voz (ASR). Admite más de 125 idiomas y variantes, y se puede implementar en las instalaciones (con una licencia) y en Google Cloud. La conversión de voz a texto se puede ejecutar de forma sincrónica para muestras de audio cortas (un minuto o menos), de forma asincrónica para audio más largo (hasta 480 minutos) y transmisión para reconocimiento en tiempo real.

Puede personalizar el reconocimiento de voz para transcribir términos específicos del dominio y palabras raras proporcionando sugerencias . Hay modelos ASR especializados para video, llamadas telefónicas y comando y búsqueda, así como “predeterminado” (cualquier otra cosa). Si bien puede incrustar audio codificado en su solicitud de API, más a menudo proporcionará un URI a un archivo de audio binario almacenado en un depósito de almacenamiento de Google Cloud.

Dialogflow

Dialogflow Essentials de Google Cloud se basa en Speech-to-Text y Text-to-Speech, y puede aprovechar más de 40 agentes prediseñados como plantillas, para pequeños bots con conversaciones de un solo tema. Dialogflow CX es un paquete de desarrollo avanzado para crear aplicaciones de IA conversacionales, incluidos chatbots, bots de voz y bots IVR (respuesta de voz interactiva). Incluye una plataforma de creación de bots visuales (ver captura de pantalla a continuación), herramientas de colaboración y control de versiones, y compatibilidad con funciones avanzadas de IVR, y está optimizado para la escala y la complejidad de la empresa.

plataforma google cloud ai 07
Dialogflow CX es un diseñador para agentes virtuales complejos de interacción de voz. Aquí el diseñador ha enumerado diez frases para la intención “store.location”. También se reconocerán frases similares.

API de inferencia en la nube

Los datos de series de tiempo a menudo requieren un manejo especial, especialmente si desea realizarlos en tiempo real en datos de transmisión, además de manejar un gran conjunto de datos históricos. La API de inferencia de Google Cloud sin servidor totalmente administrada, actualmente en prueba alfa limitada, detecta tendencias y anomalías con marcadores de tiempo de eventos, maneja conjuntos de datos que consisten en hasta decenas de miles de millones de eventos, ejecuta miles de consultas por segundo y responde con baja latencia.

API de recomendaciones

La creación de sistemas de recomendación eficaces con aprendizaje automático tiene fama de ser complicada y requiere mucho tiempo. Google ha automatizado el proceso con la API de Recomendaciones, actualmente en prueba beta. Este servicio totalmente administrado se encarga de preprocesar sus datos, capacitar y ajustar modelos de aprendizaje automático y aprovisionar la infraestructura. También corrige el sesgo y la estacionalidad. Se integra con servicios de Google relacionados, como Analytics 360, Tag Manager, Merchant Center, Cloud Storage y BigQuery. El entrenamiento y ajuste inicial del modelo demoran de dos a cinco días en completarse.TABLA DE CONTENIDO

Plataforma de inteligencia artificial de Google Cloud 

Google Cloud AI Platform y los aceleradores son para desarrolladores, científicos de datos e ingenieros de datos. La mayoría de las veces, usar Google Cloud AI Platform para resolver un problema puede suponer un gran esfuerzo. Si puede evitar ese esfuerzo utilizando AI Building Blocks, debería hacerlo.

Google Cloud AI Platform facilita un flujo de trabajo de aprendizaje automático de extremo a extremo para desarrolladores, científicos de datos e ingenieros de datos. Si bien no lo ayuda a obtener sus datos ni a codificar su modelo, sí lo ayuda a unir el resto de su flujo de trabajo de aprendizaje automático. 

plataforma google cloud ai 08
Google Cloud AI Platform une la mayor parte del flujo de trabajo de aprendizaje automático, desde el entrenamiento de modelos hasta el control de versiones y la gestión de modelos.

AI Platform incluye varios servicios de entrenamiento de modelos y una variedad de tipos de máquinas para entrenamiento y ajuste, incluidos aceleradores de GPU y TPU. El servicio de Predicción le permite entregar predicciones de cualquier modelo entrenado; no se limita a los modelos que entrenó usted mismo o los modelos que entrenó en Google.

Los Notebooks de AI Platform implementan los Notebooks de JupyterLab en las VM de Google, preconfigurados con TensorFlow, PyTorch y otros paquetes de aprendizaje profundo. El servicio de etiquetado de datos de AI Platform te permite solicitar etiquetado humano para un conjunto de datos que deseas usar para entrenar un modelo. Las imágenes de VM de aprendizaje profundo de AI Platform están optimizadas para la ciencia de datos y las tareas de aprendizaje automático, con marcos y herramientas clave de aprendizaje automático y compatibilidad con GPU.

Notebooks de AI Platform

Para muchos científicos de datos, usar Jupyter o JupyterLab Notebooks puede ser una de las formas más fáciles de desarrollar y compartir modelos y flujos de trabajo de aprendizaje automático. Los cuadernos de Google Cloud AI Platform facilitan la creación y administración de máquinas virtuales seguras preconfiguradas con JupyterLab, Git, integración de GCP y su elección de paquetes centrales de Python 2 o Python 3, R, Python y / o R, TensorFlow, PyTorch y CUDA.

Si bien Kaggle y Colab también son compatibles con los portátiles Jupyter, Kaggle está dirigido a entusiastas y profesionales del aprendizaje, y Colab está dirigido a investigadores y estudiantes, mientras que los portátiles Google Cloud AI están dirigidos a usuarios empresariales. Para trabajos pesados, AI Notebooks pueden funcionar con VM de aprendizaje profundo, clústeres de Dataproc y Dataflow, y pueden conectarse a fuentes de datos de GCP como BigQuery.

Puede comenzar a desarrollar con una máquina virtual pequeña y luego escalar a una máquina virtual más robusta con más memoria y CPU, y posiblemente con GPU o TPU para el entrenamiento de aprendizaje profundo. También puede guardar cuadernos en repositorios de Git y cargarlos en otras instancias. Alternativamente, puedes usar el servicio de capacitación de AI Platform que se analiza a continuación.

Pasé por un laboratorio de código práctico sobre el uso de Google Cloud AI Notebooks . A continuación, se muestran algunas capturas de pantalla de esa experiencia. También noté un directorio lleno de cuadernos de muestra precargados en JupyterLab; parecen interesantes, pero no tengo suficiente espacio aquí para discutirlos en profundidad.

plataforma google cloud ai 09
Cuando crea una nueva instancia de Google Cloud AI Notebook, puede elegir los puntos de partida para el entorno. La máquina virtual se puede refinar más adelante.
plataforma google cloud ai 11
El comienzo del laboratorio de código configura las importaciones de paquetes y ejecuta una consulta en un conjunto de datos público de BigQuery para adquirir datos para el análisis y el entrenamiento del modelo. Este laboratorio de código mezcla libremente métodos de Pandas, TensorFlow, NumPy y Scikit-learn. Witwidget es la herramienta Y si de Google. 
plataforma google cloud ai 12
Una vez que se han importado los datos, el laboratorio de código los divide para probarlos y entrenarlos y entrena una red neuronal simple y completamente conectada. El objetivo del laboratorio es demostrar Google Cloud AI Notebooks y no entrenar el mejor modelo posible, por lo que solo hay 10 épocas, y el error cuadrático medio final no es tan bueno.

IA explicable y la herramienta Y si …

Si usa TensorFlow como su marco para crear y ajustar un modelo, puede usar la herramienta Y si … de Google para comprender cómo los cambios en los valores en los datos de entrenamiento podrían afectar el modelo. En otros dominios, eso se llama estudio de sensibilidad. La herramienta Y si … también puede mostrar una serie de gráficos útiles.

plataforma google cloud ai 13
Si se ajusta a un modelo de TensorFlow, puede usar la herramienta Y si … de Google en su Notebook AI de Cloud para explorar la explicabilidad del modelo.

Entrenamiento de AI Platform

El entrenamiento de modelos a menudo requiere muchos más recursos informáticos que el desarrollo de modelos. Puede entrenar modelos simples en pequeños conjuntos de datos en un Google Cloud AI Notebook o en su propia máquina. Para entrenar modelos complejos en grandes conjuntos de datos, es mejor que uses el servicio AI Platform Training .

El servicio de entrenamiento ejecuta una aplicación de entrenamiento almacenada en un depósito de Cloud Storage contra los datos de entrenamiento y verificación almacenados en un depósito de Cloud Storage, Cloud Bigtable u otro servicio de almacenamiento de GCP. Si ejecuta un algoritmo integrado, no es necesario que cree su propia aplicación de entrenamiento.

Puede entrenar modelos que usan un paquete de código de Cloud Storage, actualmente TensorFlow, Scikit-learn y XGBoost, así como modelos que usan una imagen de contenedor personalizada de Cloud Storage y modelos que usan algoritmos integrados. También puedes usar una imagen de contenedor de PyTorch prediseñada derivada de los contenedores de aprendizaje profundo de AI Platform.

Los algoritmos incorporados actuales son XGBoost, XGBoost distribuido, Aprendizaje lineal, Aprendizaje amplio y profundo, Clasificación de imágenes, Detección de objetos de imagen y TabNet. Todos estos algoritmos, excepto la clasificación de imágenes y la detección de objetos de imágenes, se basan en datos tabulares. Todos menos los algoritmos XGBoost se basan actualmente en TensorFlow 1.14.

Puedes ejecutar AI Platform Training desde la pestaña Trabajos de la consola de AI Platform o emitiendo un gcloud ai-platform jobs submit trainingcomando. El método de invocación de la línea de comandos también puede automatizar la carga de su código de modelo a un depósito de Cloud Storage.

Puedes monitorear los trabajos de entrenamiento desde la pestaña Trabajos de la consola de la plataforma AI, desde un gcloud ai-platform jobscomando o desde el código Python. Cuando se completa un trabajo, normalmente guarda un modelo entrenado en el depósito de Cloud Storage que especificaste cuando comenzaste el trabajo.

Puedes realizar entrenamiento distribuido de AI Platform con Distributed XGBoost, TensorFlow y PyTorch. La configuración es diferente para cada marco. Para TensorFlow, hay tres posibles estrategias de distribución y seis opciones para “niveles de escala”, que definen la configuración del clúster de entrenamiento.

El ajuste de hiperparámetros funciona realizando múltiples entrenamientos de un modelo (para establecer pesos variables) con diferentes variables del proceso de entrenamiento (para controlar el algoritmo, por ejemplo, estableciendo la tasa de aprendizaje). Puede realizar el ajuste de hiperparámetros en los modelos de TensorFlow de manera bastante simple, ya que TensorFlow muestra su métrica de entrenamiento en sus informes de eventos resumidos. Para otros marcos, es posible que debas usar el cloudml-hypertunepaquete de Python para que AI Platform Training pueda detectar la métrica del modelo. Configura los hiperparámetros para ajustar, sus rangos y la estrategia de búsqueda de ajuste cuando define el trabajo de entrenamiento.

Puedes usar GPU o TPU para tus trabajos de entrenamiento. Por lo general, debe especificar un tipo de instancia que incluya las GPU o TPU que desea usar y habilitarlas desde el código. Cuanto más grande y complicado sea el modelo, más probable es que su entrenamiento pueda ser acelerado por GPU o TPU.

plataforma google cloud ai 14
Los trabajos de Google Cloud AI Platform son la forma de configurar el entrenamiento de modelos con uno de los tres marcos de aprendizaje automático o con una imagen de contenedor personalizada. Cuando selecciona un marco, también debe seleccionar una versión.
plataforma google cloud ai 15
Los algoritmos integrados son una alternativa al suministro de un marco y código de aprendizaje automático para un modelo personalizado.

Visir de AI Platform

Otra forma de realizar la optimización de hiperparámetros es utilizar AI Platform Vizier , un servicio de optimización de caja negra. Vizier realiza estudios con múltiples pruebas y puede resolver muchos tipos de problemas de optimización, no solo el entrenamiento de IA. Vizier todavía está en prueba beta.

Predicción de AI Platform

Una vez que tenga un modelo entrenado, debe implementarlo para la predicción. AI Platform Prediction administra los recursos informáticos en la nube para ejecutar sus modelos. Exportas tu modelo como artefactos que puedes implementar en AI Platform Prediction. Los modelos no tienen que estar entrenados en Google Cloud AI.

AI Platform Prediction asume que los modelos cambiarán con el tiempo, por lo que los modelos contienen versiones y son las versiones las que se pueden implementar. Las versiones pueden basarse en modelos de aprendizaje automático completamente diferentes, aunque ayuda si todas las versiones de un modelo utilizan las mismas entradas y salidas.

plataforma google cloud ai 16 sm
Esta fotografía y su superposición muestran las áreas que contribuyeron a que un modelo identificara al animal como un gato y no como un perro.

AI Platform Prediction asigna nodos para manejar las solicitudes de predicción en línea enviadas a una versión del modelo. Cuando implementas una versión de modelo, puedes personalizar la cantidad y el tipo de máquina virtual que AI Platform usa para estos nodos. Los nodos no son exactamente máquinas virtuales, pero los tipos de máquinas subyacentes son similares.

Puedes permitir que AI Platform Prediction escale los nodos de forma automática o manual. Si usa GPU para una versión de modelo, no puede escalar los nodos automáticamente. Si asigna tipos de máquinas que son demasiado grandes para su modelo, puede intentar escalar los nodos automáticamente, pero es posible que nunca se cumplan las condiciones de carga de la CPU para escalar. Idealmente, utilizará nodos que sean lo suficientemente grandes para sus modelos de aprendizaje automático.

Además de las predicciones, la plataforma puede proporcionar Explicaciones de IA en forma de atribuciones de características para una predicción en particular. Esto se encuentra actualmente en prueba beta. Puede obtener atribuciones de características como un gráfico de barras para datos tabulares y como una superposición para datos de imágenes.

Imágenes de VM de aprendizaje profundo de AI Platform

Cuando comienza con un sistema operativo simple, configurar su entorno para el aprendizaje automático y el aprendizaje profundo, los controladores CUDA y JupyterLab a veces puede llevar tanto tiempo como entrenar el modelo, al menos para modelos simples. El uso de una imagen preconfigurada resuelve ese problema.DE UN VISTAZO

  • Plataforma de aprendizaje automático e inteligencia artificial de Google CloudAprende Másen Google CloudGoogle Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, y muchos de los servicios ofrecidos todavía están en prueba beta. Pero en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, en el sentido de que nadie es despedido por elegir la inteligencia artificial de Google.

Puedes elegir una imagen de VM de aprendizaje profundo de AI Platform con TensorFlow, TensorFlow Enterprise, PyTorch, R o media docena de otros marcos. Todas las imágenes pueden incluir JupyterLab y las imágenes diseñadas para su uso con GPU pueden tener controladores CUDA.

Puede crear una instancia desde la línea de comandos de gcloud (instalada a través del SDK de Google Cloud) o desde el mercado de Google Cloud . Cuando crea su máquina virtual, puede elegir la cantidad de CPU virtuales (el tipo de máquina, que también determina la RAM) y la cantidad y tipo de GPU. Verá una estimación de su costo mensual según el hardware que elija, con un descuento por uso continuo. No hay cargo adicional por los marcos. Si elige una máquina virtual con GPU, debe permitir unos minutos para la instalación de los controladores CUDA.

plataforma google cloud ai 17
Puede crear una máquina virtual de aprendizaje profundo desde Google Cloud Console, así como desde la línea de comandos. Tenga en cuenta que el controlador CUDA y las instalaciones de JupyterLab solo requieren marcar una casilla. Las selecciones de marco, GPU, tipo de máquina y zona se realizan desde listas desplegables.

Contenedores de aprendizaje profundo de AI Platform

Google también proporciona contenedores de aprendizaje profundo adecuados para su uso en Docker en su máquina local o en Google Kubernetes Engine (GKE) . Los contenedores tienen todos los marcos, controladores y software de soporte que pueda desear, a diferencia de las imágenes de VM, que le permiten seleccionar solo lo que necesita. Los contenedores de aprendizaje profundo se encuentran actualmente en prueba beta.

Canalizaciones de AI Platform

MLOps (operaciones de aprendizaje automático) aplica prácticas de DevOps (operaciones de desarrollador) a los flujos de trabajo de aprendizaje automático. Gran parte de Google Cloud AI Platform admite MLOps de alguna manera, pero AI Platform Pipelines son el núcleo de lo que se trata MLOps.https://imasdk.googleapis.com/js/core/bridge3.423.0_es.html#goog_2084441660Volumen 0% 

AI Platform Pipelines , actualmente en prueba beta, hace que sea más fácil comenzar con MLOps al ahorrarle la dificultad de configurar Kubeflow Pipelines con TensorFlow Extended (TFX). El proyecto Kubeflow de código abierto está dedicado a hacer que las implementaciones de los flujos de trabajo de aprendizaje automático en Kubernetes sean simples, portátiles y escalables. Kubeflow Pipelines, un componente de Kubeflow que se encuentra actualmente en prueba beta, es una solución integral para implementar y administrar flujos de trabajo de aprendizaje automático de un extremo a otro.

plataforma google cloud ai 19
Cuando Spotify cambió sus MLOps a Kubeflow Pipelines y TFX, algunos equipos aumentaron 7 veces su número de experimentos.

TensorFlow Extended es una plataforma integral para implementar canalizaciones de aprendizaje automático de producción. TFX facilita la implementación de MLOps al proporcionar un conjunto de herramientas que lo ayuda a orquestar su proceso de aprendizaje automático en varios orquestadores, como Apache Airflow, Apache Beam y Kubeflow Pipelines. Google Cloud AI Platform Pipelines usa TFX Pipelines, que son DAG (gráficos acíclicos dirigidos), con Kubeflow Pipelines en lugar de Airflow o Beam.

Administras AI Platform Pipelines desde la pestaña Pipelines de AI Platform en tu consola de Google Cloud. La creación de una nueva instancia de canalización crea un clúster de Kubernetes, un depósito de almacenamiento en la nube y una canalización de Kubeflow. Luego, puede definir la canalización a partir de un ejemplo o desde cero con TFX.

Spotify usó TFX y Kubeflow para mejorar sus MLOps . La compañía informa que algunos equipos están produciendo 7 veces más experimentos.

Servicio de etiquetado de datos de AI Platform

El servicio de etiquetado de datos de Google Cloud  AI Platform te permite trabajar con etiquetadores humanos para generar etiquetas de alta precisión para una colección de datos que puedes usar en modelos de aprendizaje automático. El servicio se encuentra actualmente en prueba beta y la disponibilidad es muy limitada debido a COVID-19.

AI Hub

Google Cloud AI Hub , actualmente en prueba beta, ofrece una colección de activos para desarrolladores y científicos de datos que crean sistemas de inteligencia artificial. Puede buscar y compartir activos. Incluso en forma beta, AI Hub parece ser útil.

plataforma google cloud ai 18
Google Cloud AI Hub es una forma rápida de aprender, crear y compartir sus proyectos de IA en la nube de Google.

TensorFlow Enterprise

TensorFlow Enterprise proporciona a los usuarios una distribución optimizada de Google Cloud de TensorFlow con compatibilidad con versiones a largo plazo. La distribución empresarial de TensorFlow contiene paquetes relacionados y binarios de TensorFlow personalizados. Cada versión de TensorFlow Enterprise Distribution se basa en una versión particular de TensorFlow; todos los paquetes incluidos están disponibles en código abierto.TABLA DE CONTENIDO

Soluciones de inteligencia artificial de Google Cloud

Google dirige las soluciones de IA a los ejecutivos de negocios en lugar de a los científicos de datos o programadores. Las soluciones generalmente vienen con un componente opcional de consultoría o desarrollo de contratos; Los servicios de consultoría también están disponibles por separado. Debajo de las cubiertas, las soluciones de inteligencia artificial se basan en bloques de construcción de inteligencia artificial y plataforma de inteligencia artificial.

Centro de contacto AI

Contact Center AI (CCAI) es una solución de Google para centros de contacto diseñada para proporcionar interacciones humanas. Se basa en Dialogflow para proporcionar un agente virtual, monitorear la intención del cliente, cambiar a agentes en vivo cuando sea necesario y ayudar a los agentes humanos. Google tiene media docena de socios para ayudarlo a desarrollar e implementar una solución CCAI, y para brindar soporte y capacitar a sus agentes.

Construye y usa IA

Google Cloud Build and Use AI es una solución definida genéricamente que esencialmente ofrece la experiencia en inteligencia artificial de Google, los componentes básicos de la inteligencia artificial y la plataforma de inteligencia artificial para resolver sus problemas comerciales. Entre otros beneficios, esta solución le ayuda a configurar MLops con automatización de canalización y CI / CD .

Documento AI

Google Cloud Document AI aplica el componente básico de OCR de la API de Google Vision junto con Cloud Natural Language para extraer e interpretar información de documentos comerciales, que generalmente se proporcionan en formato PDF. Los componentes adicionales analizan formularios generales y formularios de factura. Actualmente se están probando soluciones específicas de la industria para el procesamiento y la adquisición de hipotecas. Google tiene media docena de socios para ayudarlo a implementar soluciones Document AI.

Elogio de Google Cloud AI Platform 

En general, la plataforma de aprendizaje automático e inteligencia artificial de Google Cloud es muy buena, tanto en alcance como en calidad. Ya sea que necesite analizar el idioma o las imágenes, usar servicios listos para usar o usarlos con personalizaciones para manejar sus propios datos, encontrará Google Cloud AI Platform en o cerca del estado de la técnica. Puede ensuciarse las manos solo cuando sea necesario. Los días en los que necesitabas un doctorado. en ciencia de datos y un conocimiento profundo de TensorFlow para entrenar e implementar un modelo hace mucho tiempo que desaparecieron.

Google Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, la falta de muchas opciones en las instalaciones y el hecho de que muchos de los servicios ofrecidos todavía están disponibles. en prueba beta. A pesar de esos problemas, Google Cloud AI puede satisfacer casi cualquier necesidad de aprendizaje automático o aprendizaje profundo. Me gustan especialmente las nuevas capacidades de canalización, a pesar de que es un servicio de prueba beta basado en productos de código abierto que también están todavía en prueba beta.

Si bien no voy a hablar más sobre la competencia, algunas de las cuales también son muy buenas, diré que en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, ya que nadie es despedido por elegir Google AI.-

Precios

Cloud AutoML Translation: Capacitación: $ 76.00 por hora; Traducción: $ 80 por millón de caracteres después de los primeros 500.000 caracteres. 

Cloud AutoML Natural Language: Entrenamiento: $ 3.00 por hora; Clasificación: $ 5 por mil registros de texto después de los primeros 30K registros. 

Cloud AutoML Vision: Entrenamiento: $ 20 por hora después de la primera hora; Clasificación: $ 3 por mil imágenes después de las primeras mil imágenes.

Tablas de Cloud AutoML: Capacitación: 6 horas de uso único gratuito + $ 19.32 por hora (92 máquinas equivalentes a n1-estándar-4 usadas en paralelo); Predicción por lotes: 6 horas de uso gratuito por única vez + $ 1,16 por hora (5,5 máquinas equivalentes a n1-estándar-4 utilizadas en paralelo); Predicción en línea: $ 0.21 por hora (1 máquina equivalente a n1-estándar-4); Implementación: $ 0.005 por GiB-hora x 9 máquinas (modelo replicado en 9 máquinas para propósitos de servicio de baja latencia); Visión: $ 1.50 / función / 1,000 unidades después de las primeras 1,000 unidades / mes para la mayoría de las funciones; más para detección web y localización de objetos. 

Video: $ 0.04 a $ 0.17 / minuto / función después de los primeros 1,000 minutos / mes. 

Lenguaje natural: $ 0.50 a $ 2.00 / función / 1,000 unidades después de las primeras 5,000 unidades / mes. 

Traducción: $ 20 / millón de caracteres después de los primeros 500.000 caracteres / mes. 

Traducción de medios: $ 0.068 a $ 0.084 / minuto después de los primeros 60 minutos / mes. 

Texto a voz: $ 4 / millón de caracteres después de los primeros 4 millones de caracteres / mes, voces estándar; $ 16 / millón de caracteres después del primer millón de caracteres / mes, voces de WaveNet. 

Voz a texto: $ 0.004 a $ 0.009 / 15 segundos después de los primeros 60 minutos / mes.

Agente de Dialogflow CX: $ 20/100 sesiones de chat, $ 45/100 sesiones de voz. 

Agente de Dialogflow ES: varía según el modo, refleja los cargos subyacentes de voz y lenguaje natural. 

Recomendaciones AI: $ 2.50 / nodo / hora para entrenamiento y ajuste; $ 0.27 / 1000 predicciones con descuentos por cantidad por niveles superiores a 20 millones de solicitudes / mes. 

GPU: $ 0.11 a $ 2.48 / GPU / hora.

TPU: $ 1.35 a $ 8 / TPU / hora.

Entrenamiento de AI Platform: $ 0.19 a $ 21.36 / hora.

Predicciones de AI Platform: $ 0.045 a $ 1.13 / nodo / hora más GPU a $ 0.45 a $ 2.48 / GPU / hora.

Plataforma

Todos los servicios se ejecutan en Google Cloud Platform; algunos también se pueden ejecutar en las instalaciones o en contenedores. DE UN VISTAZO

  • Plataforma de aprendizaje automático e inteligencia artificial de Google CloudAprende Másen Google CloudGoogle Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, y muchos de los servicios ofrecidos todavía están en prueba beta. Pero en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, en el sentido de que nadie es despedido por elegir la inteligencia artificial de Google.

Relacionado: 

Martin Heller es editor colaborador y revisor de InfoWorld. Anteriormente, consultor de programación web y Windows, desarrolló bases de datos, software y sitios web de 1986 a 2010. Más recientemente, se ha desempeñado como vicepresidente de tecnología y educación en Alpha Software y presidente y director ejecutivo de Tubifi.

Fuente: https://www.infoworld.com/article/3586836/review-google-cloud-ai-lights-up-machine-learning.html

Deja un comentario