El “tigre de la IA” chino Moonshot AI estrena su última incorporación al mundo de código abierto: Kimi K2 Thinking.

por Michelle Hawley

Los inversores llaman a Moonshot AI de Beijing una de las empresas “AI Tiger” de China, una empresa a la vanguardia de la carrera de China hacia el dominio global de la IA. Según el cofundador Yang Zhilin, su objetivo es construir modelos fundamentales para lograr la inteligencia artificial general (AGI).

Esta semana, Moonshot AI lanzó lo que llama su modelo de pensamiento de código abierto “más capaz”: Kimi K2 Thinking.

Todo sobre Kimi K2 Thinking

Según los funcionarios de la compañía, Kimi K2 Thinking (a veces denominado simplemente K2 Thinking) está construido como un “agente de pensamiento de código abierto que razona paso a paso” mientras usa herramientas.

La interfaz de pensamiento Kimi K2

Las características clave de K2 Thinking incluyen:

  • Pensamiento profundo y orquestación de herramientas: Entrenado para tejer el razonamiento en cadena de pensamiento con llamadas a herramientas, lo que permite tareas autónomas como flujos de trabajo de investigación, codificación y escritura.
  • Cuantización INT4 nativa: El entrenamiento consciente de la cuantificación (QAT) se utiliza en la etapa posterior al entrenamiento para ofrecer una aceleración del 2× sin pérdidas.
  • Agencia estable de largo horizonte: K2 Thinking puede ejecutar 200-300 llamadas de herramientas consecutivas sin interferencia humana (los modelos anteriores se degradaron después de 30-50 pasos).

Especificaciones de Kimi K2 Thinking

ArquitecturaMezcla de expertos (MoE)
Parámetros totales1 billón
Parámetros
activados
32 mil millones
Número de capas (capa densa incluida)61
Número de capas densas1
Atención Dimensión
Oculta
7168
Dimensión oculta del Ministerio de Educación (por experto)2048
Número de cabezales
de atención
64
Número de expertos384
Expertos seleccionados por token8
Número de expertos
compartidos
1
Tamaño del
vocabulario
160 mil
Longitud del
contexto
256 mil
Mecanismo de
atención
MLA
Función de
activación
 SwiGLU

¿Cómo se Compara Kimi? K2 Thinking vs GPT-5 vs Claude Soneto 4.5

Según Moonshot AI, K2 Thinking establece nuevos récords en los puntos de referencia para el razonamiento, la codificación y las capacidades de los agentes. Se comparó con GPT-5 (Alto) de OpenAI y Claude Sonnet 4.5 (Pensamiento) de Anthropic.

K2 Aprendizaje logrado:

  • 44.9% en El último examen de la humanidad (con herramientas)
  • 60.2% en BrowseComp
  • 71.3% en SWE-Bench verificado
Puntajes de evaluación de Kimi K2 Learning
Puntajes de evaluación de Kimi K2 Thinking

Una nota sobre la precisión de la evaluación de IA

A diferencia del software tradicional con salidas deterministas, los LLM generan resultados probabilísticos, lo que significa que la misma entrada puede producir diferentes salidas. Las evaluaciones generalmente se basan en puntos de referencia estandarizados (como MMLU o GPQA), pero estas herramientas tienen limitaciones notables.

Algunos puntos de referencia carecen de usabilidad práctica o no representan adecuadamente los escenarios del mundo real, y los resultados pueden ser engañosos si no se interpretan con el contexto adecuado.

“Los puntos de referencia son profundamente políticos, performativos y generativos en el sentido de que no describen y miden pasivamente cómo son las cosas en el mundo, sino que participan activamente en su configuración”, señalaron los investigadores. Estos puntos de referencia influyen en cómo se entrenan, ajustan y aplican los modelos de IA, agregaron, prácticas con amplios impactos políticos, económicos y culturales.

Capacidades agénticas de Kimi K2 Thinking

Según Moonshot AI, Kimi K2 Thinking sobresale en:

Razonamiento Agéntico

K2 Thinking está configurado con un conjunto de herramientas diverso que le permite planificar, razonar, ejecutar y adaptarse a través de cientos de pasos. En un ejemplo, según los creadores del modelo, resolvió un problema matemático de nivel de doctorado a través de 23 razonamientos entrelazados y llamadas a herramientas.

Codificación Agéntica

K2 Thinking razona mientras usa herramientas, lo que le permite integrarse en agentes de software para completar flujos de trabajo de desarrollo complejos y de varios pasos.

Algunos ejemplos que Kimi K2 Thinking construyó a partir de un solo mensaje, según la compañía, incluyen:

  • Un sitio web con muchos componentes
  • Una breve visualización explicativa de matemáticas
  • Una simulación de células que atacan virus en el torrente sanguíneo
  • Una simulación de disco de vinilo
  • Música de codificación en vivo con Strudel.cc

Búsqueda y navegación de Agentic

K2 Thinking realiza ciclos de pensamiento → búsqueda → uso del navegador → pensar → código. Durante esos ciclos, genera y refina hipótesis, verifica información, razona y construye respuestas.

El razonamiento entrelazado del modelo de IA le permite convertir problemas vagos y abiertos en subtareas claras y procesables.

Capacidades generales de Kimi K2 Thinking

Según Moonshot AI, las otras capacidades generales de K2 Learning incluyen:

  • Escritura creativa: K2 Thinking tiene un fuerte dominio del estilo y la instrucción, capaz de manejar diversos tonos y formatos con fluidez natural.
  • Escritura práctica: Según los informes, K2 Thinking sigue las indicaciones con alta precisión, a menudo ampliando cada punto mencionado para garantizar una cobertura completa.
  • Personal y emoción: El modelo de IA responde con empatía al abordar preguntas personales o emocionales, ofreciendo perspectivas matizadas y próximos pasos prácticos.
K2 Pensando vs K2 0905

Cómo usar Kimi K2 Thinking

Puedes usar Kimi K2 Thinking ahora en Kimi.com en el modo de chat.

Cómo activar K2 Thinking

Este modo solo usa un subconjunto de herramientas y reduce la cantidad de llamadas a herramientas, lo que significa que usar K2 Thinking de esta manera puede no reproducir los puntajes de referencia, según los funcionarios de la compañía.

El modo agente completo estará disponible pronto, lo que los fabricantes de modelos dicen que “reflejará todas las capacidades de K2 Thinking”.

También se puede acceder al modelo a través de la API Kimi K2 Thinking.

Sobre el autor

Michelle Hawley

Michelle Hawley es una periodista experimentada que se especializa en informar sobre el impacto de la tecnología en la sociedad. Como directora editorial de Simpler Media Group, supervisa las operaciones diarias de VKTR, cubriendo el mundo de la IA empresarial y administrando una red de escritores colaboradores. También es la presentadora de CMO Circle de CMSWire y copresentadora de CX Decoded de CMSWire. Con una maestría en escritura creativa y experiencia tanto en noticias como en marketing, ofrece conocimientos únicos sobre los temas de disrupción tecnológica, responsabilidad corporativa, legislación cambiante de IA y más. Actualmente reside en Pensilvania con su esposo y dos perros.

Fuente: https://www.vktr.com/ai-market/introducing-kimi-k2-thinking-chinas-most-capable-open-source-model/

Deja una respuesta