Cerebras Systems anunció hoy que alojará el innovador modelo de inteligencia artificial R1 de DeepSeek en servidores estadounidenses, prometiendo velocidades hasta 57 veces más rápidas que las soluciones basadas en GPU, manteniendo los datos confidenciales dentro de las fronteras estadounidenses. La medida se produce en medio de crecientes preocupaciones sobre el rápido avance de la inteligencia artificial en China y la privacidad de los datos.

por Michael Núñez

Crédito: VentureBeat realizado con Midjourney

La startup de chips de IA implementará una versión de 70 mil millones de parámetros de DeepSeek-R1 que se ejecutará en su hardware patentado a escala de oblea, entregando 1.600 tokens por segundo, una mejora dramática con respecto a las implementaciones de GPU tradicionales que han tenido problemas con los modelos de IA de “razonamiento” más nuevos.

Tiempos de respuesta de las principales plataformas de IA, medidos en segundos. Cerebras logra la respuesta más rápida, con poco más de un segundo, mientras que el sistema de Novita tarda casi 38 segundos en generar su primer resultado, una métrica fundamental para las aplicaciones del mundo real. (Fuente: Artificial Analysis)

Por qué los modelos de razonamiento de DeepSeek están transformando la IA empresarial

“Estos modelos de razonamiento afectan a la economía”, dijo James Wang, un alto ejecutivo de Cerebras, en una entrevista exclusiva con VentureBeat. “Cualquier trabajador del conocimiento básicamente tiene que realizar algún tipo de tareas cognitivas de varios pasos. Y estos modelos de razonamiento serán las herramientas que ingresen a su flujo de trabajo”.

El anuncio se produce tras una semana tumultuosa en la que la aparición de DeepSeek desencadenó la mayor pérdida de valor de mercado de la historia de Nvidia, casi 600.000 millones de dólares , lo que plantea interrogantes sobre la supremacía de la IA del gigante de los chips. La solución de Cerebras aborda directamente dos preocupaciones clave que han surgido: las demandas computacionales de los modelos avanzados de IA y la soberanía de los datos.

“Si se utiliza la API de DeepSeek , que es muy popular en este momento, esos datos se envían directamente a China”, explicó Wang. “Esa es una advertencia importante que hace que muchas empresas y compañías estadounidenses… no estén dispuestas a considerarla”.

Cerebras demuestra ventajas de rendimiento espectaculares en cuanto a velocidad de salida, ya que procesa 1508 tokens por segundo, casi seis veces más rápido que su competidor más cercano, Groq, y aproximadamente 100 veces más rápido que las soluciones tradicionales basadas en GPU como Novita. (Fuente: Artificial Analysis)

Cómo la tecnología a escala de oblea de Cerebras supera a las GPU tradicionales en velocidad de IA

Cerebras logra su ventaja de velocidad gracias a una novedosa arquitectura de chip que mantiene modelos de IA completos en un único procesador del tamaño de una oblea, eliminando así los cuellos de botella de memoria que afectan a los sistemas basados ​​en GPU. La empresa afirma que su implementación de DeepSeek-R1 iguala o supera el rendimiento de los modelos patentados de OpenAI, a la vez que se ejecuta completamente en suelo estadounidense.

Este desarrollo representa un cambio significativo en el panorama de la IA. DeepSeek , fundada por el ex ejecutivo de fondos de cobertura Liang Wenfeng, sorprendió a la industria al lograr capacidades de razonamiento de IA sofisticadas, según se informa, a solo el 1 % del costo de los competidores estadounidenses. La solución de alojamiento de Cerebras ahora ofrece a las empresas estadounidenses una forma de aprovechar estos avances y, al mismo tiempo, mantener el control de los datos.

“Es una historia muy bonita que los laboratorios de investigación estadounidenses hayan dado este regalo al mundo. Los chinos lo tomaron y lo mejoraron, pero tiene limitaciones porque se ejecuta en China, tiene algunos problemas de censura, y ahora lo estamos recuperando y lo estamos ejecutando en centros de datos estadounidenses, sin censura, sin retención de datos”, dijo Wang.

Los resultados de los análisis de rendimiento muestran que DeepSeek-R1, que se ejecuta en Cerebras, supera tanto a GPT-4o como a o1-mini de OpenAI en tareas de respuesta a preguntas, razonamiento matemático y codificación. Los resultados sugieren que el desarrollo de la IA china puede estar acercándose o superando las capacidades estadounidenses en algunas áreas. (Crédito: Cerebras)

El liderazgo tecnológico de EE. UU. enfrenta nuevas preguntas a medida que la innovación en inteligencia artificial se globaliza

El servicio estará disponible a través de una versión preliminar para desarrolladores a partir de hoy. Si bien inicialmente será gratuito, Cerebras planea implementar controles de acceso a API debido a la fuerte demanda inicial.

La medida se produce en un momento en que los legisladores estadounidenses lidian con las implicaciones del ascenso de DeepSeek, que ha expuesto posibles limitaciones en las restricciones comerciales estadounidenses diseñadas para mantener las ventajas tecnológicas sobre China. La capacidad de las empresas chinas para lograr capacidades de inteligencia artificial innovadoras a pesar de los controles a la exportación de chips ha provocado demandas de nuevos enfoques regulatorios.

Los analistas del sector sugieren que este desarrollo podría acelerar el abandono de la infraestructura de IA dependiente de la GPU. “Nvidia ya no es líder en rendimiento de inferencia”, señaló Wang, señalando los puntos de referencia que muestran un rendimiento superior de varios chips de IA especializados. “Estas otras empresas de chips de IA son realmente más rápidas que las GPU para ejecutar estos últimos modelos”.

El impacto se extiende más allá de las métricas técnicas. A medida que los modelos de IA incorporan cada vez más capacidades de razonamiento sofisticadas, sus demandas computacionales se han disparado. Cerebras sostiene que su arquitectura es más adecuada para estas cargas de trabajo emergentes, lo que podría reconfigurar el panorama competitivo en la implementación de IA empresarial.

Fuente: https://venturebeat.com/ai/cerebras-becomes-the-worlds-fastest-host-for-deepseek-r1-outpacing-nvidia-gpus-by-57x

Deja una respuesta