por Martin Heller
A Google Cloud AI and Machine Learning Platform le faltan algunas piezas, y muchas aún están en versión beta, pero su alcance y calidad son insuperables.
- Bloques de creación de IA de Google Cloud
- AutoML
- Tablas de AutoML
- API Vision
- API de inteligencia de video
- API de lenguaje natural
- Traducción
- Texto a voz
- Dictado a texto
- Dialogflow
- API de inferencia en la nube
- API de recomendaciones
- Plataforma de inteligencia artificial de Google Cloud
- Notebooks de AI Platform
- IA explicable y la herramienta Y si …
- Entrenamiento de AI Platform
- Visir de AI Platform
- Predicción de AI Platform
- Imágenes de VM de aprendizaje profundo de AI Platform
- Contenedores de aprendizaje profundo de AI Platform
- Canalizaciones de AI Platform
- Servicio de etiquetado de datos de AI Platform
- AI Hub
- TensorFlow Enterprise
- Soluciones de inteligencia artificial de Google Cloud
- Elogio de Google Cloud AI Platform
Google tiene una de las pilas de aprendizaje automático más grandes de la industria, y actualmente se centra en su plataforma de aprendizaje automático e inteligencia artificial de Google Cloud. Google lanzó TensorFlow como código abierto hace años, pero TensorFlow sigue siendo el marco de aprendizaje profundo más maduro y citado . De manera similar, Google lanzó Kubernetes como código abierto hace años, pero sigue siendo el sistema de gestión de contenedores dominante.
Google es una de las principales fuentes de herramientas e infraestructura para desarrolladores, científicos de datos y expertos en aprendizaje automático, pero históricamente la IA de Google no ha sido tan atractiva para los analistas de negocios que carecen de conocimientos serios en ciencia de datos o programación. Eso está empezando a cambiar.
Google Cloud AI and Machine Learning Platform incluye componentes básicos de AI, la plataforma y aceleradores de AI, y soluciones de AI. Las soluciones de IA son bastante nuevas y están dirigidas a gerentes comerciales en lugar de científicos de datos. Pueden incluir consultas de Google o sus socios.
Los bloques de construcción de IA, que están entrenados previamente pero son personalizables, se pueden usar sin un conocimiento profundo de programación o ciencia de datos. Sin embargo, los científicos de datos expertos los utilizan a menudo por razones pragmáticas, esencialmente para hacer las cosas sin un entrenamiento extenso del modelo.
La plataforma de inteligencia artificial y los aceleradores son generalmente para científicos de datos serios y requieren habilidades de codificación, conocimiento de técnicas de preparación de datos y mucho tiempo de capacitación. Recomiendo ir allí solo después de probar los bloques de construcción relevantes.
Todavía faltan algunos enlaces en las ofertas de inteligencia artificial de Google Cloud, especialmente en la preparación de datos. Lo más parecido que tiene Google Cloud a un servicio de acondicionamiento e importación de datos es Cloud Dataprep de Trifacta; Lo probé hace un año y me decepcionó. Sin embargo, la ingeniería de funciones integrada en Cloud AutoML Tables es prometedora y sería útil tener ese tipo de servicio disponible para otros escenarios.
La parte inferior sórdida de la IA tiene que ver con la ética y la responsabilidad (o la falta de ellas), junto con los sesgos persistentes del modelo (a menudo debido a los datos sesgados utilizados para el entrenamiento). Google publicó sus Principios de IA en 2018. Es un trabajo en progreso, pero es una base para la orientación, como se discutió en una publicación reciente del blog sobre IA responsable.
Hay mucha competencia en el mercado de la IA (más de una docena de proveedores) y mucha competencia en el mercado de la nube pública (más de media docena de proveedores creíbles). Para hacer justicia a las comparaciones, tendría que escribir un artículo al menos cinco veces más largo que este, así que por mucho que odie dejarlos fuera, tendré que omitir la mayoría de las comparaciones de productos. Para la comparación más obvia, puedo resumir: AWS hace la mayor parte de lo que hace Google, y también es muy bueno, pero generalmente cobra precios más altos.
Los componentes básicos de la IA de Google Cloud no requieren mucha experiencia en aprendizaje automático, sino que se basan en modelos previamente entrenados y entrenamiento automático. AI Platform te permite entrenar e implementar tus propios modelos de aprendizaje automático y aprendizaje profundo.
Bloques de creación de IA de Google Cloud
Los Building Blocks de Google Cloud AI son componentes fáciles de usar que puedes incorporar en tus propias aplicaciones para agregar datos visuales, de lenguaje, de conversación y estructurados. Muchos de los componentes básicos de la IA son redes neuronales previamente entrenadas, pero se pueden personalizar con el aprendizaje por transferencia y la búsqueda de redes neuronales si no satisfacen sus necesidades de inmediato. AutoML Tables es un poco diferente, ya que automatiza el proceso que usaría un científico de datos para encontrar el mejor modelo de aprendizaje automático para un conjunto de datos tabulares.
AutoML
Los servicios de Google Cloud AutoML proporcionan redes neuronales profundas personalizadas para la traducción de pares de idiomas, clasificación de texto, detección de objetos, clasificación de imágenes y clasificación y seguimiento de objetos de video. Requieren datos etiquetados para la capacitación, pero no requieren un conocimiento significativo de aprendizaje profundo, aprendizaje por transferencia o programación.
Google Cloud AutoML personaliza las redes neuronales profundas de alta precisión probadas en batalla de Google para sus datos etiquetados. En lugar de comenzar desde cero al entrenar modelos a partir de sus datos, AutoML implementa el aprendizaje de transferencia profunda automática (lo que significa que comienza a partir de una red neuronal profunda existente entrenada en otros datos) y la búsqueda de arquitectura neuronal (lo que significa que encuentra la combinación correcta de capas de red adicionales ) para la traducción de pares de idiomas y los demás servicios enumerados anteriormente.
En cada área, Google ya tiene uno o más servicios previamente capacitados basados en redes neuronales profundas y enormes conjuntos de datos etiquetados. Estos pueden funcionar para sus datos sin modificar, y debe probarlos para ahorrar tiempo y dinero. Si no hacen lo que necesitas, Google Cloud AutoML te ayuda a crear un modelo que sí lo hace, sin requerir que sepas cómo realizar el aprendizaje por transferencia o cómo diseñar redes neuronales.
El aprendizaje por transferencia ofrece dos grandes ventajas sobre el entrenamiento de una red neuronal desde cero. Primero, requiere muchos menos datos para el entrenamiento, ya que la mayoría de las capas de la red ya están bien entrenadas. En segundo lugar, entrena mucho más rápido, ya que solo optimiza las capas finales.
Si bien los servicios de Google Cloud AutoML solían presentarse juntos como un paquete, ahora se enumeran con sus servicios básicos previamente capacitados. Lo que la mayoría de las otras empresas llaman AutoML lo realiza Google Cloud AutoML Tables.
Tablas de AutoML
El proceso habitual de ciencia de datos para muchos problemas de regresión y clasificación es crear una tabla de datos para entrenamiento, limpiar y acondicionar los datos, realizar ingeniería de características e intentar entrenar todos los modelos apropiados en la tabla transformada, incluido un paso para optimizar hiperparámetros de los mejores modelos. Google Cloud AutoML Tables puede realizar todo este proceso automáticamente una vez que identifica manualmente el campo de destino.
AutoML Tables busca automáticamente en el zoológico de modelos de Google datos estructurados para encontrar el mejor modelo para sus necesidades, que van desde modelos de regresión lineal / logística para conjuntos de datos más simples hasta métodos avanzados de búsqueda profunda, de conjuntos y de arquitectura para los más grandes y complejos. Automatiza la ingeniería de características en una amplia gama de primitivas de datos tabulares, como números, clases, cadenas, marcas de tiempo y listas, y lo ayuda a detectar y ocuparse de valores perdidos, valores atípicos y otros problemas comunes de datos.
Su interfaz sin código lo guía a través de todo el ciclo de vida del aprendizaje automático de punta a punta, lo que facilita que cualquier miembro de su equipo cree modelos e incorpore de manera confiable en aplicaciones más amplias. AutoML Tables proporciona una gran cantidad de datos de entrada y funciones de explicabilidad del comportamiento del modelo, junto con medidas de seguridad para evitar errores comunes. AutoML Tables también está disponible en entornos de API y portátiles.
AutoML Tables compite con Driverless AI y varias otras implementaciones y marcos de AutoML.
API Vision
La API de Google Cloud Vision es un servicio de aprendizaje automático previamente capacitado para categorizar imágenes y extraer varias funciones. Puede clasificar imágenes en miles de categorías previamente entrenadas, que van desde objetos genéricos y animales que se encuentran en la imagen (como un gato), a condiciones generales (por ejemplo, anochecer), a puntos de referencia específicos (Torre Eiffel, Gran Cañón), e identificar propiedades generales de la imagen, como sus colores dominantes. Puede aislar áreas que son caras, luego aplicar análisis geométricos (orientación facial y puntos de referencia) y emocionales a las caras, aunque no reconoce las caras como pertenecientes a personas específicas, excepto celebridades (que requiere una licencia de uso especial). Vision API utiliza OCR para detectar texto dentro de imágenes en más de 50 idiomas y varios tipos de archivos. También puede identificar logotipos de productos y detectar adultos,
API de inteligencia de video
La API de Google Cloud Video Intelligence reconoce automáticamente más de 20.000 objetos, lugares y acciones en videos almacenados y en streaming. También distingue los cambios de escena y extrae metadatos enriquecidos a nivel de video, toma o fotograma. Además, realiza la detección y extracción de texto mediante OCR, detecta contenido explícito, automatiza subtítulos y subtítulos, reconoce logotipos y detecta rostros, personas y poses.
Google recomienda la API de inteligencia de video para extraer metadatos para indexar, organizar y buscar su contenido de video. Puede transcribir videos y generar subtítulos, así como marcar y filtrar contenido inapropiado, todo de manera más rentable que los transcriptores humanos. Los casos de uso incluyen moderación de contenido, recomendaciones de contenido, archivos multimedia y anuncios contextuales.
API de lenguaje natural
El procesamiento del lenguaje natural (PNL) es una gran parte de la “salsa secreta” que hace que la entrada a la Búsqueda de Google y al Asistente de Google funcionen bien. La API de Google Cloud Natural Language expone esa misma tecnología a sus programas. Puede realizar análisis de sintaxis (ver la imagen a continuación), extracción de entidades, análisis de opiniones y clasificación de contenido, en 10 idiomas. Puede especificar el idioma si lo conoce; de lo contrario, la API intentará detectar automáticamente el idioma. Una API separada, actualmente disponible para acceso anticipado a pedido, se especializa en contenido relacionado con la atención médica.
Lea la revisión completa de las API de aprendizaje automático de Google Cloud
Traducción
La API de Google Cloud Translation puede traducir más de cien pares de idiomas, puede detectar automáticamente el idioma de origen si no lo especifica y viene en tres versiones: traducción básica, avanzada y multimedia. La API de traducción avanzada admite un glosario, traducción por lotes y el uso de modelos personalizados. La API de traducción básica es esencialmente lo que utiliza la interfaz de Google Translate para el consumidor. AutoML Translation te permite entrenar modelos personalizados mediante el aprendizaje por transferencia.
La API de traducción de medios traduce el contenido directamente del audio (voz), ya sea archivos de audio o transmisiones, en 12 idiomas, y genera puntuación automáticamente. Hay modelos separados para video y audio de llamadas telefónicas.
Texto a voz
La API de Google Cloud Text-to-Speech convierte el texto sin formato y el marcado SSML en sonido, con una selección de más de 200 voces y 40 idiomas y variantes. Las variantes incluyen diferentes acentos nacionales, como inglés estadounidense, británico, sudafricano, indio, irlandés y australiano.
Las voces básicas a menudo suenan bastante mecánicas; Las voces WaveNet suelen sonar más naturales, pero su uso cuesta un poco más. También puede crear voces personalizadas a partir de sus propias grabaciones de audio con calidad de estudio.
Puede ajustar la velocidad de las voces sintetizadas hasta 4 veces más rápido o más lento, y el tono hasta 20 semitonos hacia arriba o hacia abajo. Las etiquetas SSML le permiten agregar pausas, números, formato de fecha y hora y otras instrucciones de pronunciación. También puede aumentar la ganancia de volumen hasta 16 dB o disminuir el volumen hasta -96 dB.
Dictado a texto
La API de Google Cloud Speech-to-Text convierte la voz en texto utilizando los algoritmos de red neuronal de aprendizaje profundo más avanzados de Google para el reconocimiento automático de voz (ASR). Admite más de 125 idiomas y variantes, y se puede implementar en las instalaciones (con una licencia) y en Google Cloud. La conversión de voz a texto se puede ejecutar de forma sincrónica para muestras de audio cortas (un minuto o menos), de forma asincrónica para audio más largo (hasta 480 minutos) y transmisión para reconocimiento en tiempo real.
Puede personalizar el reconocimiento de voz para transcribir términos específicos del dominio y palabras raras proporcionando sugerencias . Hay modelos ASR especializados para video, llamadas telefónicas y comando y búsqueda, así como “predeterminado” (cualquier otra cosa). Si bien puede incrustar audio codificado en su solicitud de API, más a menudo proporcionará un URI a un archivo de audio binario almacenado en un depósito de almacenamiento de Google Cloud.
Dialogflow
Dialogflow Essentials de Google Cloud se basa en Speech-to-Text y Text-to-Speech, y puede aprovechar más de 40 agentes prediseñados como plantillas, para pequeños bots con conversaciones de un solo tema. Dialogflow CX es un paquete de desarrollo avanzado para crear aplicaciones de IA conversacionales, incluidos chatbots, bots de voz y bots IVR (respuesta de voz interactiva). Incluye una plataforma de creación de bots visuales (ver captura de pantalla a continuación), herramientas de colaboración y control de versiones, y compatibilidad con funciones avanzadas de IVR, y está optimizado para la escala y la complejidad de la empresa.
API de inferencia en la nube
Los datos de series de tiempo a menudo requieren un manejo especial, especialmente si desea realizarlos en tiempo real en datos de transmisión, además de manejar un gran conjunto de datos históricos. La API de inferencia de Google Cloud sin servidor totalmente administrada, actualmente en prueba alfa limitada, detecta tendencias y anomalías con marcadores de tiempo de eventos, maneja conjuntos de datos que consisten en hasta decenas de miles de millones de eventos, ejecuta miles de consultas por segundo y responde con baja latencia.
API de recomendaciones
La creación de sistemas de recomendación eficaces con aprendizaje automático tiene fama de ser complicada y requiere mucho tiempo. Google ha automatizado el proceso con la API de Recomendaciones, actualmente en prueba beta. Este servicio totalmente administrado se encarga de preprocesar sus datos, capacitar y ajustar modelos de aprendizaje automático y aprovisionar la infraestructura. También corrige el sesgo y la estacionalidad. Se integra con servicios de Google relacionados, como Analytics 360, Tag Manager, Merchant Center, Cloud Storage y BigQuery. El entrenamiento y ajuste inicial del modelo demoran de dos a cinco días en completarse.TABLA DE CONTENIDO
- Bloques de creación de IA de Google Cloud
- Plataforma de inteligencia artificial de Google Cloud
- Soluciones de inteligencia artificial de Google Cloud
- Elogio de Google Cloud AI Platform
Plataforma de inteligencia artificial de Google Cloud
Google Cloud AI Platform y los aceleradores son para desarrolladores, científicos de datos e ingenieros de datos. La mayoría de las veces, usar Google Cloud AI Platform para resolver un problema puede suponer un gran esfuerzo. Si puede evitar ese esfuerzo utilizando AI Building Blocks, debería hacerlo.
Google Cloud AI Platform facilita un flujo de trabajo de aprendizaje automático de extremo a extremo para desarrolladores, científicos de datos e ingenieros de datos. Si bien no lo ayuda a obtener sus datos ni a codificar su modelo, sí lo ayuda a unir el resto de su flujo de trabajo de aprendizaje automático.
AI Platform incluye varios servicios de entrenamiento de modelos y una variedad de tipos de máquinas para entrenamiento y ajuste, incluidos aceleradores de GPU y TPU. El servicio de Predicción le permite entregar predicciones de cualquier modelo entrenado; no se limita a los modelos que entrenó usted mismo o los modelos que entrenó en Google.
Los Notebooks de AI Platform implementan los Notebooks de JupyterLab en las VM de Google, preconfigurados con TensorFlow, PyTorch y otros paquetes de aprendizaje profundo. El servicio de etiquetado de datos de AI Platform te permite solicitar etiquetado humano para un conjunto de datos que deseas usar para entrenar un modelo. Las imágenes de VM de aprendizaje profundo de AI Platform están optimizadas para la ciencia de datos y las tareas de aprendizaje automático, con marcos y herramientas clave de aprendizaje automático y compatibilidad con GPU.
Notebooks de AI Platform
Para muchos científicos de datos, usar Jupyter o JupyterLab Notebooks puede ser una de las formas más fáciles de desarrollar y compartir modelos y flujos de trabajo de aprendizaje automático. Los cuadernos de Google Cloud AI Platform facilitan la creación y administración de máquinas virtuales seguras preconfiguradas con JupyterLab, Git, integración de GCP y su elección de paquetes centrales de Python 2 o Python 3, R, Python y / o R, TensorFlow, PyTorch y CUDA.
Si bien Kaggle y Colab también son compatibles con los portátiles Jupyter, Kaggle está dirigido a entusiastas y profesionales del aprendizaje, y Colab está dirigido a investigadores y estudiantes, mientras que los portátiles Google Cloud AI están dirigidos a usuarios empresariales. Para trabajos pesados, AI Notebooks pueden funcionar con VM de aprendizaje profundo, clústeres de Dataproc y Dataflow, y pueden conectarse a fuentes de datos de GCP como BigQuery.
Puede comenzar a desarrollar con una máquina virtual pequeña y luego escalar a una máquina virtual más robusta con más memoria y CPU, y posiblemente con GPU o TPU para el entrenamiento de aprendizaje profundo. También puede guardar cuadernos en repositorios de Git y cargarlos en otras instancias. Alternativamente, puedes usar el servicio de capacitación de AI Platform que se analiza a continuación.
Pasé por un laboratorio de código práctico sobre el uso de Google Cloud AI Notebooks . A continuación, se muestran algunas capturas de pantalla de esa experiencia. También noté un directorio lleno de cuadernos de muestra precargados en JupyterLab; parecen interesantes, pero no tengo suficiente espacio aquí para discutirlos en profundidad.
IA explicable y la herramienta Y si …
Si usa TensorFlow como su marco para crear y ajustar un modelo, puede usar la herramienta Y si … de Google para comprender cómo los cambios en los valores en los datos de entrenamiento podrían afectar el modelo. En otros dominios, eso se llama estudio de sensibilidad. La herramienta Y si … también puede mostrar una serie de gráficos útiles.
Entrenamiento de AI Platform
El entrenamiento de modelos a menudo requiere muchos más recursos informáticos que el desarrollo de modelos. Puede entrenar modelos simples en pequeños conjuntos de datos en un Google Cloud AI Notebook o en su propia máquina. Para entrenar modelos complejos en grandes conjuntos de datos, es mejor que uses el servicio AI Platform Training .
El servicio de entrenamiento ejecuta una aplicación de entrenamiento almacenada en un depósito de Cloud Storage contra los datos de entrenamiento y verificación almacenados en un depósito de Cloud Storage, Cloud Bigtable u otro servicio de almacenamiento de GCP. Si ejecuta un algoritmo integrado, no es necesario que cree su propia aplicación de entrenamiento.
Puede entrenar modelos que usan un paquete de código de Cloud Storage, actualmente TensorFlow, Scikit-learn y XGBoost, así como modelos que usan una imagen de contenedor personalizada de Cloud Storage y modelos que usan algoritmos integrados. También puedes usar una imagen de contenedor de PyTorch prediseñada derivada de los contenedores de aprendizaje profundo de AI Platform.
Los algoritmos incorporados actuales son XGBoost, XGBoost distribuido, Aprendizaje lineal, Aprendizaje amplio y profundo, Clasificación de imágenes, Detección de objetos de imagen y TabNet. Todos estos algoritmos, excepto la clasificación de imágenes y la detección de objetos de imágenes, se basan en datos tabulares. Todos menos los algoritmos XGBoost se basan actualmente en TensorFlow 1.14.
Puedes ejecutar AI Platform Training desde la pestaña Trabajos de la consola de AI Platform o emitiendo un gcloud ai-platform jobs submit training
comando. El método de invocación de la línea de comandos también puede automatizar la carga de su código de modelo a un depósito de Cloud Storage.
Puedes monitorear los trabajos de entrenamiento desde la pestaña Trabajos de la consola de la plataforma AI, desde un gcloud ai-platform jobs
comando o desde el código Python. Cuando se completa un trabajo, normalmente guarda un modelo entrenado en el depósito de Cloud Storage que especificaste cuando comenzaste el trabajo.
Puedes realizar entrenamiento distribuido de AI Platform con Distributed XGBoost, TensorFlow y PyTorch. La configuración es diferente para cada marco. Para TensorFlow, hay tres posibles estrategias de distribución y seis opciones para “niveles de escala”, que definen la configuración del clúster de entrenamiento.
El ajuste de hiperparámetros funciona realizando múltiples entrenamientos de un modelo (para establecer pesos variables) con diferentes variables del proceso de entrenamiento (para controlar el algoritmo, por ejemplo, estableciendo la tasa de aprendizaje). Puede realizar el ajuste de hiperparámetros en los modelos de TensorFlow de manera bastante simple, ya que TensorFlow muestra su métrica de entrenamiento en sus informes de eventos resumidos. Para otros marcos, es posible que debas usar el cloudml-hypertune
paquete de Python para que AI Platform Training pueda detectar la métrica del modelo. Configura los hiperparámetros para ajustar, sus rangos y la estrategia de búsqueda de ajuste cuando define el trabajo de entrenamiento.
Puedes usar GPU o TPU para tus trabajos de entrenamiento. Por lo general, debe especificar un tipo de instancia que incluya las GPU o TPU que desea usar y habilitarlas desde el código. Cuanto más grande y complicado sea el modelo, más probable es que su entrenamiento pueda ser acelerado por GPU o TPU.
Visir de AI Platform
Otra forma de realizar la optimización de hiperparámetros es utilizar AI Platform Vizier , un servicio de optimización de caja negra. Vizier realiza estudios con múltiples pruebas y puede resolver muchos tipos de problemas de optimización, no solo el entrenamiento de IA. Vizier todavía está en prueba beta.
Predicción de AI Platform
Una vez que tenga un modelo entrenado, debe implementarlo para la predicción. AI Platform Prediction administra los recursos informáticos en la nube para ejecutar sus modelos. Exportas tu modelo como artefactos que puedes implementar en AI Platform Prediction. Los modelos no tienen que estar entrenados en Google Cloud AI.
AI Platform Prediction asume que los modelos cambiarán con el tiempo, por lo que los modelos contienen versiones y son las versiones las que se pueden implementar. Las versiones pueden basarse en modelos de aprendizaje automático completamente diferentes, aunque ayuda si todas las versiones de un modelo utilizan las mismas entradas y salidas.
AI Platform Prediction asigna nodos para manejar las solicitudes de predicción en línea enviadas a una versión del modelo. Cuando implementas una versión de modelo, puedes personalizar la cantidad y el tipo de máquina virtual que AI Platform usa para estos nodos. Los nodos no son exactamente máquinas virtuales, pero los tipos de máquinas subyacentes son similares.
Puedes permitir que AI Platform Prediction escale los nodos de forma automática o manual. Si usa GPU para una versión de modelo, no puede escalar los nodos automáticamente. Si asigna tipos de máquinas que son demasiado grandes para su modelo, puede intentar escalar los nodos automáticamente, pero es posible que nunca se cumplan las condiciones de carga de la CPU para escalar. Idealmente, utilizará nodos que sean lo suficientemente grandes para sus modelos de aprendizaje automático.
Además de las predicciones, la plataforma puede proporcionar Explicaciones de IA en forma de atribuciones de características para una predicción en particular. Esto se encuentra actualmente en prueba beta. Puede obtener atribuciones de características como un gráfico de barras para datos tabulares y como una superposición para datos de imágenes.
Imágenes de VM de aprendizaje profundo de AI Platform
Cuando comienza con un sistema operativo simple, configurar su entorno para el aprendizaje automático y el aprendizaje profundo, los controladores CUDA y JupyterLab a veces puede llevar tanto tiempo como entrenar el modelo, al menos para modelos simples. El uso de una imagen preconfigurada resuelve ese problema.DE UN VISTAZO
- Plataforma de aprendizaje automático e inteligencia artificial de Google CloudAprende Másen Google CloudGoogle Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, y muchos de los servicios ofrecidos todavía están en prueba beta. Pero en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, en el sentido de que nadie es despedido por elegir la inteligencia artificial de Google.
Puedes elegir una imagen de VM de aprendizaje profundo de AI Platform con TensorFlow, TensorFlow Enterprise, PyTorch, R o media docena de otros marcos. Todas las imágenes pueden incluir JupyterLab y las imágenes diseñadas para su uso con GPU pueden tener controladores CUDA.
Puede crear una instancia desde la línea de comandos de gcloud (instalada a través del SDK de Google Cloud) o desde el mercado de Google Cloud . Cuando crea su máquina virtual, puede elegir la cantidad de CPU virtuales (el tipo de máquina, que también determina la RAM) y la cantidad y tipo de GPU. Verá una estimación de su costo mensual según el hardware que elija, con un descuento por uso continuo. No hay cargo adicional por los marcos. Si elige una máquina virtual con GPU, debe permitir unos minutos para la instalación de los controladores CUDA.
Contenedores de aprendizaje profundo de AI Platform
Google también proporciona contenedores de aprendizaje profundo adecuados para su uso en Docker en su máquina local o en Google Kubernetes Engine (GKE) . Los contenedores tienen todos los marcos, controladores y software de soporte que pueda desear, a diferencia de las imágenes de VM, que le permiten seleccionar solo lo que necesita. Los contenedores de aprendizaje profundo se encuentran actualmente en prueba beta.
Canalizaciones de AI Platform
MLOps (operaciones de aprendizaje automático) aplica prácticas de DevOps (operaciones de desarrollador) a los flujos de trabajo de aprendizaje automático. Gran parte de Google Cloud AI Platform admite MLOps de alguna manera, pero AI Platform Pipelines son el núcleo de lo que se trata MLOps.https://imasdk.googleapis.com/js/core/bridge3.423.0_es.html#goog_2084441660Volumen 0%
AI Platform Pipelines , actualmente en prueba beta, hace que sea más fácil comenzar con MLOps al ahorrarle la dificultad de configurar Kubeflow Pipelines con TensorFlow Extended (TFX). El proyecto Kubeflow de código abierto está dedicado a hacer que las implementaciones de los flujos de trabajo de aprendizaje automático en Kubernetes sean simples, portátiles y escalables. Kubeflow Pipelines, un componente de Kubeflow que se encuentra actualmente en prueba beta, es una solución integral para implementar y administrar flujos de trabajo de aprendizaje automático de un extremo a otro.
TensorFlow Extended es una plataforma integral para implementar canalizaciones de aprendizaje automático de producción. TFX facilita la implementación de MLOps al proporcionar un conjunto de herramientas que lo ayuda a orquestar su proceso de aprendizaje automático en varios orquestadores, como Apache Airflow, Apache Beam y Kubeflow Pipelines. Google Cloud AI Platform Pipelines usa TFX Pipelines, que son DAG (gráficos acíclicos dirigidos), con Kubeflow Pipelines en lugar de Airflow o Beam.
Administras AI Platform Pipelines desde la pestaña Pipelines de AI Platform en tu consola de Google Cloud. La creación de una nueva instancia de canalización crea un clúster de Kubernetes, un depósito de almacenamiento en la nube y una canalización de Kubeflow. Luego, puede definir la canalización a partir de un ejemplo o desde cero con TFX.
Spotify usó TFX y Kubeflow para mejorar sus MLOps . La compañía informa que algunos equipos están produciendo 7 veces más experimentos.
Servicio de etiquetado de datos de AI Platform
El servicio de etiquetado de datos de Google Cloud AI Platform te permite trabajar con etiquetadores humanos para generar etiquetas de alta precisión para una colección de datos que puedes usar en modelos de aprendizaje automático. El servicio se encuentra actualmente en prueba beta y la disponibilidad es muy limitada debido a COVID-19.
AI Hub
Google Cloud AI Hub , actualmente en prueba beta, ofrece una colección de activos para desarrolladores y científicos de datos que crean sistemas de inteligencia artificial. Puede buscar y compartir activos. Incluso en forma beta, AI Hub parece ser útil.
TensorFlow Enterprise
TensorFlow Enterprise proporciona a los usuarios una distribución optimizada de Google Cloud de TensorFlow con compatibilidad con versiones a largo plazo. La distribución empresarial de TensorFlow contiene paquetes relacionados y binarios de TensorFlow personalizados. Cada versión de TensorFlow Enterprise Distribution se basa en una versión particular de TensorFlow; todos los paquetes incluidos están disponibles en código abierto.TABLA DE CONTENIDO
- Bloques de creación de IA de Google Cloud
- Plataforma de inteligencia artificial de Google Cloud
- Soluciones de inteligencia artificial de Google Cloud
- Elogio de Google Cloud AI Platform
Soluciones de inteligencia artificial de Google Cloud
Google dirige las soluciones de IA a los ejecutivos de negocios en lugar de a los científicos de datos o programadores. Las soluciones generalmente vienen con un componente opcional de consultoría o desarrollo de contratos; Los servicios de consultoría también están disponibles por separado. Debajo de las cubiertas, las soluciones de inteligencia artificial se basan en bloques de construcción de inteligencia artificial y plataforma de inteligencia artificial.
Centro de contacto AI
Contact Center AI (CCAI) es una solución de Google para centros de contacto diseñada para proporcionar interacciones humanas. Se basa en Dialogflow para proporcionar un agente virtual, monitorear la intención del cliente, cambiar a agentes en vivo cuando sea necesario y ayudar a los agentes humanos. Google tiene media docena de socios para ayudarlo a desarrollar e implementar una solución CCAI, y para brindar soporte y capacitar a sus agentes.
Construye y usa IA
Google Cloud Build and Use AI es una solución definida genéricamente que esencialmente ofrece la experiencia en inteligencia artificial de Google, los componentes básicos de la inteligencia artificial y la plataforma de inteligencia artificial para resolver sus problemas comerciales. Entre otros beneficios, esta solución le ayuda a configurar MLops con automatización de canalización y CI / CD .
Documento AI
Google Cloud Document AI aplica el componente básico de OCR de la API de Google Vision junto con Cloud Natural Language para extraer e interpretar información de documentos comerciales, que generalmente se proporcionan en formato PDF. Los componentes adicionales analizan formularios generales y formularios de factura. Actualmente se están probando soluciones específicas de la industria para el procesamiento y la adquisición de hipotecas. Google tiene media docena de socios para ayudarlo a implementar soluciones Document AI.
Elogio de Google Cloud AI Platform
En general, la plataforma de aprendizaje automático e inteligencia artificial de Google Cloud es muy buena, tanto en alcance como en calidad. Ya sea que necesite analizar el idioma o las imágenes, usar servicios listos para usar o usarlos con personalizaciones para manejar sus propios datos, encontrará Google Cloud AI Platform en o cerca del estado de la técnica. Puede ensuciarse las manos solo cuando sea necesario. Los días en los que necesitabas un doctorado. en ciencia de datos y un conocimiento profundo de TensorFlow para entrenar e implementar un modelo hace mucho tiempo que desaparecieron.
Google Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, la falta de muchas opciones en las instalaciones y el hecho de que muchos de los servicios ofrecidos todavía están disponibles. en prueba beta. A pesar de esos problemas, Google Cloud AI puede satisfacer casi cualquier necesidad de aprendizaje automático o aprendizaje profundo. Me gustan especialmente las nuevas capacidades de canalización, a pesar de que es un servicio de prueba beta basado en productos de código abierto que también están todavía en prueba beta.
Si bien no voy a hablar más sobre la competencia, algunas de las cuales también son muy buenas, diré que en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, ya que nadie es despedido por elegir Google AI.-
Precios
Cloud AutoML Translation: Capacitación: $ 76.00 por hora; Traducción: $ 80 por millón de caracteres después de los primeros 500.000 caracteres.
Cloud AutoML Natural Language: Entrenamiento: $ 3.00 por hora; Clasificación: $ 5 por mil registros de texto después de los primeros 30K registros.
Cloud AutoML Vision: Entrenamiento: $ 20 por hora después de la primera hora; Clasificación: $ 3 por mil imágenes después de las primeras mil imágenes.
Tablas de Cloud AutoML: Capacitación: 6 horas de uso único gratuito + $ 19.32 por hora (92 máquinas equivalentes a n1-estándar-4 usadas en paralelo); Predicción por lotes: 6 horas de uso gratuito por única vez + $ 1,16 por hora (5,5 máquinas equivalentes a n1-estándar-4 utilizadas en paralelo); Predicción en línea: $ 0.21 por hora (1 máquina equivalente a n1-estándar-4); Implementación: $ 0.005 por GiB-hora x 9 máquinas (modelo replicado en 9 máquinas para propósitos de servicio de baja latencia); Visión: $ 1.50 / función / 1,000 unidades después de las primeras 1,000 unidades / mes para la mayoría de las funciones; más para detección web y localización de objetos.
Video: $ 0.04 a $ 0.17 / minuto / función después de los primeros 1,000 minutos / mes.
Lenguaje natural: $ 0.50 a $ 2.00 / función / 1,000 unidades después de las primeras 5,000 unidades / mes.
Traducción: $ 20 / millón de caracteres después de los primeros 500.000 caracteres / mes.
Traducción de medios: $ 0.068 a $ 0.084 / minuto después de los primeros 60 minutos / mes.
Texto a voz: $ 4 / millón de caracteres después de los primeros 4 millones de caracteres / mes, voces estándar; $ 16 / millón de caracteres después del primer millón de caracteres / mes, voces de WaveNet.
Voz a texto: $ 0.004 a $ 0.009 / 15 segundos después de los primeros 60 minutos / mes.
Agente de Dialogflow CX: $ 20/100 sesiones de chat, $ 45/100 sesiones de voz.
Agente de Dialogflow ES: varía según el modo, refleja los cargos subyacentes de voz y lenguaje natural.
Recomendaciones AI: $ 2.50 / nodo / hora para entrenamiento y ajuste; $ 0.27 / 1000 predicciones con descuentos por cantidad por niveles superiores a 20 millones de solicitudes / mes.
GPU: $ 0.11 a $ 2.48 / GPU / hora.
TPU: $ 1.35 a $ 8 / TPU / hora.
Entrenamiento de AI Platform: $ 0.19 a $ 21.36 / hora.
Predicciones de AI Platform: $ 0.045 a $ 1.13 / nodo / hora más GPU a $ 0.45 a $ 2.48 / GPU / hora.
Plataforma
Todos los servicios se ejecutan en Google Cloud Platform; algunos también se pueden ejecutar en las instalaciones o en contenedores. DE UN VISTAZO
- Plataforma de aprendizaje automático e inteligencia artificial de Google CloudAprende Másen Google CloudGoogle Cloud AI and Machine Learning Platform tiene algunas lagunas, como la falta de un servicio de preparación de datos de Google de primera mano, y muchos de los servicios ofrecidos todavía están en prueba beta. Pero en el ámbito de las aplicaciones de inteligencia artificial, Google es esencialmente la nueva IBM, en el sentido de que nadie es despedido por elegir la inteligencia artificial de Google.
Relacionado:
Martin Heller es editor colaborador y revisor de InfoWorld. Anteriormente, consultor de programación web y Windows, desarrolló bases de datos, software y sitios web de 1986 a 2010. Más recientemente, se ha desempeñado como vicepresidente de tecnología y educación en Alpha Software y presidente y director ejecutivo de Tubifi.
Fuente: https://www.infoworld.com/article/3586836/review-google-cloud-ai-lights-up-machine-learning.html