La Nvidia DGX Spark es la pequeña caja dorada que se encuentra sobre el escritorio, a la izquierda del monitor. Imagen: Nvidia
El sistema DGX Spark de 1 petaflop ejecuta modelos de IA con 200 mil millones de parámetros localmente por $4000.
por Benj Edwards
El martes, Nvidia anunció que comenzará a aceptar pedidos del DGX Spark, un ordenador de escritorio con IA de 4.000 dólares que combina un petaflop de rendimiento informático y 128 GB de memoria unificada en un formato tan pequeño que cabe en un escritorio. Su principal atractivo es probablemente su gran memoria integrada, capaz de ejecutar modelos de IA más grandes que las GPU de consumo.
Nvidia comenzará a aceptar pedidos del DGX Spark el miércoles 15 de octubre a través de su sitio web , y los sistemas también estarán disponibles a través de socios de fabricación y tiendas minoristas selectas de EE. UU.
El DGX Spark, que Nvidia presentó como “Proyecto DIGITS” en enero y nombró formalmente en mayo, representa el intento de Nvidia de crear una nueva categoría de estación de trabajo de computadora de escritorio específicamente para el desarrollo de IA.
Con Spark, Nvidia busca abordar un problema que enfrentan algunos desarrolladores de IA: muchas tareas de IA superan la capacidad de memoria y software de las PC y estaciones de trabajo estándar (más información a continuación), lo que los obliga a trasladar su trabajo a servicios en la nube o centros de datos. Sin embargo, el mercado actual para estaciones de trabajo de IA de escritorio sigue siendo incierto, sobre todo considerando el costo inicial en comparación con las alternativas en la nube, que permiten a los desarrolladores pagar por uso.
Según se informa, Spark de Nvidia incluye suficiente memoria para ejecutar modelos de IA más grandes de lo habitual para tareas locales, con hasta 200 000 millones de parámetros, y ajustar modelos con hasta 70 000 millones de parámetros sin necesidad de infraestructura remota. Entre sus posibles usos se incluyen la ejecución de modelos de lenguaje de pesos abiertos más grandes y modelos de síntesis de medios, como generadores de imágenes de IA.
Según Nvidia, los usuarios pueden personalizar los modelos Flux.1 de Black Forest Labs para la generación de imágenes, crear agentes de búsqueda y resumen de visión utilizando el modelo de lenguaje de visión Cosmos Reason de Nvidia o crear chatbots utilizando el modelo Qwen3 optimizado para la plataforma DGX Spark.
Un gran recuerdo en una pequeña caja
Nvidia ha logrado comprimir mucho en una caja de 1,2 kg que mide 15,9 x 15,9 x 5,99 pulgadas y consume 240 vatios. El sistema funciona con el superchip GB10 Grace Blackwell de Nvidia , incluye conectividad de red ConnectX-7 de 200 Gb/s y utiliza la tecnología NVLink-C2C, que proporciona cinco veces el ancho de banda de PCIe Gen 5. También incluye los ya mencionados 128 GB de memoria unificada, que se comparten entre las tareas del sistema y la GPU.
En cuanto al sistema operativo, Spark es un sistema basado en ARM que ejecuta DGX OS de Nvidia , un sistema operativo basado en Ubuntu Linux diseñado específicamente para el procesamiento por GPU. Viene con la pila de software de IA de Nvidia preinstalada, incluyendo bibliotecas CUDA y los microservicios NIM de la compañía.
El precio de la DGX Spark parte de US$3999. Puede parecer mucho, pero considerando el costo de las GPU de gama alta con amplia RAM de video, como la RTX Pro 6000 (unos US$9000) o las GPU para servidores de IA (unos US$25 000 para una H100 básica ), la DGX Spark podría ser una opción mucho más económica en general, aunque no es tan potente.
De hecho, según The Register, el rendimiento de computación de la GPU del chip GB10 es aproximadamente equivalente al de una RTX 5070. Sin embargo, la 5070 está limitada a 12 GB de memoria de video, lo que limita el tamaño de los modelos de IA que se pueden ejecutar en dicho sistema. Con 128 GB de memoria unificada, la DGX Spark puede ejecutar modelos mucho más grandes, aunque a una velocidad menor que, por ejemplo, una RTX 5090 (que normalmente se entrega con 24 GB de RAM). Por ejemplo, para ejecutar la versión más grande de 120 mil millones de parámetros del reciente modelo de lenguaje gpt-oss de OpenAI , se necesitarían unos 80 GB de memoria, que es mucho más de lo que se puede obtener en una GPU de consumo.
Un regreso a 2016
El fundador y director ejecutivo de Nvidia, Jensen Huang, celebró el lanzamiento del DGX Spark entregando personalmente una de las primeras unidades a Elon Musk en las instalaciones Starbase de SpaceX en Texas, haciéndose eco de una entrega similar que Huang realizó a Musk en OpenAI en 2016.
En 2016, construimos DGX-1 para que los investigadores de IA tuvieran su propia supercomputadora. Entregué personalmente el primer sistema a Elon en una pequeña startup llamada OpenAI, y de ahí surgió ChatGPT —declaró Huang—. DGX-1 marcó el inicio de la era de las supercomputadoras de IA y descifró las leyes de escalabilidad que impulsan la IA moderna. Con DGX Spark, retomamos esa misión.
El autor
Benj Edwards Reportero sénior de inteligencia artificialBenj Edwards es el reportero sénior de IA de Ars Technica y fundador de la sección dedicada a la IA del sitio en 2022. También es historiador tecnológico con casi dos décadas de experiencia. En su tiempo libre, escribe y graba música, colecciona computadoras antiguas y disfruta de la naturaleza. Vive en Raleigh, Carolina del Norte.
Fuente: https://arstechnica.com/ai/2025/10/nvidia-sells-tiny-new-computer-that-puts-big-ai-on-your-desktop/
