DeepSeek, una empresa china de inteligencia artificial, está revolucionando la industria con sus modelos de lenguaje de gran tamaño, de código abierto y de bajo costo, desafiando a los gigantes tecnológicos estadounidenses.
- ¿Qué es DeepSeek?
- Comparación entre OpenAI y DeepSeek
- Innovaciones en formación en DeepSeek
- Modelos de lenguaje de gran tamaño de DeepSeek
- Por qué está generando alarma en EE.UU.
- Prohibiciones de DeepSeek
- Ciberataque DeepSeek
- Datos de DeepSeek expuestos
- Lea más:
- DeepSeek, la grieta digital y el ajedrez de la nueva tecnología

En el mundo de la IA, ha prevalecido la idea de que el desarrollo de modelos de lenguaje de gran tamaño de vanguardia requiere importantes recursos técnicos y financieros. Esa es una de las principales razones por las que el gobierno de Estados Unidos se comprometió a apoyar el Proyecto Stargate de 500 mil millones de dólares anunciado por el presidente Donald Trump.
Pero la empresa china de desarrollo de inteligencia artificial DeepSeek ha trastocado esa idea. El 20 de enero de 2025, DeepSeek lanzó su modelo R1 LLM a una fracción del coste que otros proveedores han tenido que asumir para desarrollarlo. DeepSeek también ofrece sus modelos R1 bajo una licencia de código abierto, lo que permite su uso gratuito.
A los pocos días de su lanzamiento, el asistente de inteligencia artificial DeepSeek (una aplicación móvil que proporciona una interfaz de chatbot para DeepSeek-R1) alcanzó la cima de la lista de la App Store de Apple, superando a la aplicación móvil ChatGPT de OpenAI . El meteórico ascenso de DeepSeek en términos de uso y popularidad desencadenó una liquidación en el mercado de valores el 27 de enero de 2025, ya que los inversores pusieron en duda el valor de los grandes proveedores de inteligencia artificial con sede en EE. UU., incluida Nvidia . Microsoft, Meta Platforms, Oracle, Broadcom y otros gigantes tecnológicos también sufrieron caídas significativas a medida que los inversores reevaluaban las valoraciones de la inteligencia artificial.
¿Qué es DeepSeek?
DeepSeek es una empresa de desarrollo de inteligencia artificial con sede en Hangzhou, China. La empresa fue fundada por Liang Wenfeng, un graduado de la Universidad de Zhejiang, en mayo de 2023. Wenfeng también cofundó High-Flyer, un fondo de cobertura cuantitativo con sede en China que posee DeepSeek. Actualmente, DeepSeek opera como un laboratorio de investigación de inteligencia artificial independiente bajo el paraguas de High-Flyer. El monto total de la financiación y la valoración de DeepSeek no se han revelado públicamente.
DeepSeek se centra en el desarrollo de LLM de código abierto. El primer modelo de la empresa se lanzó en noviembre de 2023. La empresa ha iterado varias veces su LLM principal y ha desarrollado varias variaciones diferentes. Sin embargo, no fue hasta enero de 2025, después del lanzamiento de su modelo de razonamiento R1, que la empresa se hizo famosa a nivel mundial.
La empresa ofrece múltiples servicios para sus modelos, incluida una interfaz web, una aplicación móvil y acceso API .
Comparación entre OpenAI y DeepSeek
DeepSeek representa el último desafío para OpenAI, que se estableció como líder de la industria con el debut de ChatGPT en 2022. OpenAI ha ayudado a impulsar la industria de la IA generativa con su familia de modelos GPT, así como su clase o1 de modelos de razonamiento.
Si bien ambas empresas están desarrollando LLM de IA generativa, tienen enfoques diferentes.
Datos | IA abierta | Búsqueda profunda |
Año de fundación | 2015 | 2023 |
Sede | San Francisco, California. | Hangzhou, China |
Enfoque de desarrollo | Amplias capacidades de IA | Modelos eficientes de código abierto |
Modelos clave | GPT-4o, o1 | DeepSeek-V3, DeepSeek-R1 |
Modelos especializados | Dall-E (generación de imágenes), Whisper (reconocimiento de voz) | DeepSeek Coder (codificación), Janus Pro (modelo de visión) |
Precios de API (por millón de tokens) | o1: $15 (entrada), $60 (salida) | DeepSeek-R1: $0,55 (entrada), $2,19 (salida) |
Política de código abierto | Limitado | Mayormente de código abierto |
Enfoque de formación | Ajuste fino supervisado y basado en instrucciones | Aprendizaje por refuerzo |
Costo de desarrollo | Cientos de millones de dólares por o1 (estimado) | Según la compañía, DeepSeek-R1 costará menos de 6 millones de dólares |
Innovaciones en formación en DeepSeek
DeepSeek utiliza un enfoque diferente para entrenar sus modelos R1 que el que utiliza OpenAI. El entrenamiento requirió menos tiempo, menos aceleradores de IA y un menor costo de desarrollo. El objetivo de DeepSeek es lograr una inteligencia artificial general , y los avances de la empresa en capacidades de razonamiento representan un progreso significativo en el desarrollo de la IA.
En un artículo de investigación, DeepSeek describe las múltiples innovaciones que desarrolló como parte del modelo R1, incluidas las siguientes:
- Aprendizaje por refuerzo. DeepSeek utilizó un enfoque de aprendizaje por refuerzo a gran escala centrado en tareas de razonamiento.
- Ingeniería de recompensas. Los investigadores desarrollaron un sistema de recompensas basado en reglas para el modelo que supera a los modelos de recompensas neuronales que se utilizan con más frecuencia. La ingeniería de recompensas es el proceso de diseño del sistema de incentivos que guía el aprendizaje de un modelo de IA durante el entrenamiento.
- Destilación. Mediante técnicas eficientes de transferencia de conocimientos, los investigadores de DeepSeek lograron comprimir las capacidades en modelos de tan solo 1.500 millones de parámetros.
- Red de comportamiento emergente. La innovación de DeepSeek en materia de comportamiento emergente es el descubrimiento de que los patrones de razonamiento complejos pueden desarrollarse de forma natural a través del aprendizaje por refuerzo sin necesidad de programarlos explícitamente.
Modelos de lenguaje de gran tamaño de DeepSeek
Desde que se creó la empresa en 2023, DeepSeek ha lanzado una serie de modelos de IA generativa. Con cada nueva generación, la empresa ha trabajado para mejorar tanto las capacidades como el rendimiento de sus modelos:
- DeepSeek Coder. Lanzado en noviembre de 2023, este es el primer modelo de código abierto de la empresa diseñado específicamente para tareas relacionadas con la codificación.
- DeepSeek LLM . Lanzada en diciembre de 2023, esta es la primera versión del modelo de propósito general de la empresa.
- DeepSeek-V2 . Lanzada en mayo de 2024, es la segunda versión del LLM de la empresa y se centra en un alto rendimiento y menores costos de capacitación.
- DeepSeek-Coder-V2. Lanzado en julio de 2024, este es un modelo de 236 mil millones de parámetros que ofrece una ventana de contexto de 128 000 tokens, diseñado para desafíos de codificación complejos.
- DeepSeek-V3 . Lanzado en diciembre de 2024, DeepSeek-V3 utiliza una arquitectura de combinación de expertos , capaz de manejar una variedad de tareas. El modelo tiene 671 mil millones de parámetros con una longitud de contexto de 128 000.
- DeepSeek-R1. Lanzado en enero de 2025, este modelo se basa en DeepSeek-V3 y se centra en tareas de razonamiento avanzado que compiten directamente con el modelo o1 de OpenAI en cuanto a rendimiento, al tiempo que mantiene una estructura de costos significativamente menor. Al igual que DeepSeek-V3, el modelo tiene 671 mil millones de parámetros con una longitud de contexto de 128 000.
- Janus-Pro-7B. Lanzado en enero de 2025, Janus-Pro-7B es un modelo de visión que puede comprender y generar imágenes.
Por qué está generando alarma en EE.UU.
Si bien hubo mucho revuelo en torno al lanzamiento de DeepSeek-R1 , generó alarmas en los EE. UU., lo que desencadenó inquietudes y una liquidación del mercado de valores de las acciones tecnológicas. El lunes 27 de enero de 2025, el Nasdaq Composite cayó un 3,4 % en la apertura del mercado, con Nvidia cayendo un 17 % y perdiendo aproximadamente $600 mil millones en capitalización de mercado.
DeepSeek está generando alarma en Estados Unidos por varias razones, entre ellas las siguientes:
- Disrupción de costos. DeepSeek afirma haber desarrollado su modelo R1 por menos de 6 millones de dólares. El desarrollo de bajo costo amenaza el modelo de negocios de las empresas tecnológicas estadounidenses que han invertido miles de millones en IA. DeepSeek también es más económico para los usuarios que OpenAI.
- Logros técnicos a pesar de las restricciones. La exportación de chips GPU y aceleradores de IA de más alto rendimiento desde Estados Unidos está restringida a China. Sin embargo, a pesar de eso, DeepSeek ha demostrado que es posible desarrollar IA de vanguardia sin acceso a la tecnología estadounidense más avanzada.
- Amenaza al modelo de negocio . A diferencia de OpenAI, que es una tecnología patentada, DeepSeek es de código abierto y gratuito, lo que desafía el modelo de ingresos de las empresas estadounidenses que cobran tarifas mensuales por servicios de inteligencia artificial.
- Preocupaciones geopolíticas. Con sede en China, DeepSeek desafía el dominio tecnológico de Estados Unidos en materia de inteligencia artificial. El inversor tecnológico Marc Andreessen lo llamó el ” momento Sputnik ” de la inteligencia artificial, comparándolo con el gran avance de la carrera espacial de la Unión Soviética en la década de 1950.
Prohibiciones de DeepSeek
Países y organizaciones de todo el mundo ya han prohibido DeepSeek, citando problemas de ética, privacidad y seguridad dentro de la empresa. Debido a que todos los datos de los usuarios se almacenan en China, la mayor preocupación es la posibilidad de una fuga de datos al gobierno chino. El LLM también fue formado con una visión del mundo china, un problema potencial debido al gobierno autoritario del país.
Los lugares donde DeepSeek está prohibido incluyen los siguientes:
- Agencias del gobierno australiano.
- Gobierno central de la India.
- Italia.
- La NASA.
- Ministerio de Industria de Corea del Sur.
- Agencias gubernamentales de Taiwán.
- Gobierno del estado de Texas.
- Congreso de Estados Unidos.
- Marina de los EE.UU.
- Pentágono de Estados Unidos.
Ciberataque DeepSeek
La popularidad de DeepSeek no ha pasado desapercibida para los ciberatacantes.
El 27 de enero de 2025, DeepSeek informó de ataques maliciosos a gran escala a sus servicios, lo que obligó a la empresa a limitar temporalmente el registro de nuevos usuarios. El momento del ataque coincidió con el momento en que la aplicación de asistente de inteligencia artificial de DeepSeek superó a ChatGPT como la aplicación más descargada en la App Store de Apple.
A pesar del ataque, DeepSeek mantuvo el servicio para los usuarios existentes. El problema se prolongó hasta el 28 de enero, cuando la empresa informó que había identificado el problema y había implementado una solución.
DeepSeek no ha especificado la naturaleza exacta del ataque, aunque la especulación generalizada de informes públicos indicó que se trataba de algún tipo de ataque DDoS dirigido a su API y plataforma de chat web.
Datos de DeepSeek expuestos
El 29 de enero de 2025, Wiz Research, un equipo del proveedor de seguridad en la nube Wiz Inc., publicó sus hallazgos sobre una base de datos de back-end de acceso público que difundía información confidencial en la web, un error de ciberseguridad de “principiantes” . La información incluía el historial de chat de DeepSeek, datos de back-end, flujos de registros, claves API y detalles operativos. DeepSeek desconectó la base de datos poco después de recibir la información. No está claro durante cuánto tiempo estuvo expuesta la base de datos.
Lea más:
- DeepSeek-R1 genera contenido peligroso con mayor facilidad que otros modelos de lenguaje grandes
- Las técnicas de jailbreaking con IA resultan muy eficaces contra DeepSeek
- Wiz revela claves API y historial de chat expuestos en la base de datos DeepSeek
- New Relic amplía la capacidad de observación de DeepSeek
- Microsoft, AWS y Cerebras lanzan el modelo DeepSeek-R1
Fuente: https://www.techtarget.com/WhatIs/feature/DeepSeek-explained-Everything-you-need-to-know
DeepSeek, la grieta digital y el ajedrez de la nueva tecnología
China metió un jaque en la partida de la IA con un modelo de código abierto que sacudió a Silicon Valley y los mercados financieros. ¿El preámbulo de una Segunda Guerra Fría cibernética?
por Federico Winer
El sol apenas despuntaba sobre Wall Street cuando el rumor estalló como un vidrio astillado. DeepSeek (DS), una ignota startup china con sede en Hangzhou, había logrado en sólo 18 meses lo que Silicon Valley llevaba años puliendo. Como si hubiera descubierto un gualicho digital, DS se coló entre los grandes, eclipsando en rendimiento a titanes como ChatGPT, Claude y Gemini.
En un mundo donde la Inteligencia Artificial es la piedra filosofal del poder, la noticia dinamitó los mercados y volcó más de un capuchino con leche de soja en oficinas con vista a Manhattan. También copó las conversaciones en los congresos tecnológicos más relevantes, como el sTARTUp Day 2025 celebrado la semana pasada en Estonia.
En los pasillos y en las charlas de bar dentro de la Universidad de Tartu, una de las más antiguas de Europa al fundarse en 1632, se hablaba de algo más profundo: una fractura geopolítica que sigue ensanchándose. Porque si el siglo XX tuvo su Carrera Espacial, el XXI es testigo de la Carrera Algorítmica. Y DeepSeek acaba de irrumpir como los soviéticos hicieron con el Sputnik en el siglo pasado, en un tablero de ajedrez global donde las tecnologías y la geopolítica se enredan en un nudo marinero.
Uno. El secreto de DS no está en la fuerza bruta, sino en la eficiencia para economizar recursos, al activar menos funciones necesarias en cada momento, lo que se traduce en un menor consumo de energía en los megaservidores donde se asientan esos servicios. Así, en pruebas de referencia como MATH-500, CNMO 2024 o Codeforces, arrasó como un motor de inyección electrónica contra otro de carburador.
La piña fue técnica y, también, estratégica. Mientras OpenAI y Google encierran sus modelos en castillos inexpugnables, DeepSeek hizo algo hasta ahora poco extendido en este segmento industrial de la IA: liberó su código fuente. Ahora cualquiera puede descargarlo, modificarlo y adaptarlo sin restricciones.
En el ecosistema tecnológico, este movimiento no es sólo una jugada audaz, es una declaración de principios. Porque al abrir las puertas, DS garantiza que miles de desarrolladores contribuyan con mejoras sin necesidad de ser empleados. Lo mejoren, lo modifiquen. Un golpe al mentón del statu quo. El código libre es el mismo principio que hizo grande a los sistemas Linux desde finales del siglo XX y que hoy dominan con más de un 90% el mercado mundial de los web servers.
Pero si es gratis, ¿cómo gana dinero DS? Al ofrecer acceso profesional a sus modelos vía API, una suerte de puente común para que otras empresas integren la tecnología en productos o servicios. ¿Y si DeepSeek domina el futuro de la IA? ¿Y si a esos servidores solamente los pueden apagar o auditar los marines de los mandarines?, se preguntan los inversores tech en las bolsas. De allí la tensión extrema.
Dos. En el puerto de Buenos Aires descargaban servidores para actualizar los sistemas del gobierno durante una de las presidencias K. Entonces, Guillermo Moreno, el hoy presidente del partido Principios y Valores y entonces Secretario de Comercio Interior de la Nación, se cruzó con una directiva de la empresa norteamericana que fabricaba esos fierros. Sonrió, picante:
—Dígame, señorita, ¿cuánto van a tardar en enterarse en Washington de los datos y números del gobierno argentino?
La anécdota es un recordatorio de las eternas cuestiones de soberanía digital, ese fantasma que merodea entre cables de cobre y routers con lucecitas de kermesse. ¿Quién tiene acceso a qué? ¿Quién controla? ¿Quién espía? En la vieja serie El Super Agente 86 (Mel Brooks-Buck Henry, 1965-1970), la malvada organización KAOS era el chivo expiatorio perfecto: siempre había un villano con un plan oscuro listo para ser desbaratado por Maxwell Smart. Hoy, ese mote parece encajarle sin esfuerzo a los más de doscientos ingenieros que comanda Liang Wenfeng, CEO y fundador de DS.
Desde Occidente, los think thank divulgaron ríos de tinta de inmediato con tono de veredicto: «Los datos no estarán seguros en manos del gobierno del Partido Comunista Chino». Bien, pero la pregunta incómoda persiste: ¿Quién garantiza que los otros guardianes de los datos sean puros de toda pureza? Carlos Saúl Menem tenía su propio método para lidiar con los profetas de la transparencia: decía que cuando alguno se sentaba a su mesa a hablar de ética esperaba al final de la comida «para contar los cubiertos». Sabiduría Made in Anillaco.
Tres. La Patagonia se extiende como una gran sábana helada, un territorio de extremos. En diciembre pasado, Javier Milei vislumbró esa tierra como una promesa de futuro: la región inhóspita que puede convertirse en uno de los refugios de la soberanía digital. Un lugar donde los data centers broten como fortalezas tecnológicas entre el hielo, los corderitos y el viento, resguardando información y poder en este combate global.
Para suerte del presidente argentino, estos últimos sucesos podrían convertirse en un viento de cola inesperado en su segundo año de mandato. Los cambios en el tablero pueden jugarle a favor más rápido de lo previsto, siempre y cuando logre, aunque sea, una masita en el banquete de la gran discusión sobre metadatos e Inteligencia Artificial.
Porque si algo distingue a este presidente argentino es su capacidad para sentarse en la mesa de los tiburones tech. Con Elon Musk, por poner un ejemplo, logró una interacción que ningún otro mandatario argentino había conseguido. Tipos que a Mauricio Macri ni siquiera le clavaban el visto. Y que en la era de Alberto eran mala palabra por amor a una revolución imaginaria.
Es todo un giro digno de Turandot, una de las óperas de Puccini que fascinan a Javier Milei. En el papel de Calaf, entre susurros libertarios y alguna bravuconada de entrecasa, intenta descifrar los acertijos de la geopolítica digital. Pero acá la princesa no es de carne y hueso, sino un tablero de ajedrez con chips, transistores y piezas de silicio. Y la conquista no se gana al descifrar tres acertijos, sino con algoritmos, servidores y tratados que nadie lee pero todos temen como al cuco.
Tanto para su gobierno como para la oposición, que la Argentina logre colarse en esta guerra sin fusiles con el filo de la eficiencia y la audacia de lo inesperado debería ser cuestión de Estado. Las óperas viven de sus tensiones, de esos arcos que se estiran hasta el límite antes del estallido final. En esta gran batalla por el dominio digital de la Inteligencia Artificial, el telón no cae. Apenas empieza a levantarse.