El “tigre de la IA” chino Moonshot AI estrena su última incorporación al mundo de código abierto: Kimi K2 Thinking.
por Michelle Hawley
Los inversores llaman a Moonshot AI de Beijing una de las empresas “AI Tiger” de China, una empresa a la vanguardia de la carrera de China hacia el dominio global de la IA. Según el cofundador Yang Zhilin, su objetivo es construir modelos fundamentales para lograr la inteligencia artificial general (AGI).
Esta semana, Moonshot AI lanzó lo que llama su modelo de pensamiento de código abierto “más capaz”: Kimi K2 Thinking.
Todo sobre Kimi K2 Thinking
Según los funcionarios de la compañía, Kimi K2 Thinking (a veces denominado simplemente K2 Thinking) está construido como un “agente de pensamiento de código abierto que razona paso a paso” mientras usa herramientas.
Las características clave de K2 Thinking incluyen:
- Pensamiento profundo y orquestación de herramientas: Entrenado para tejer el razonamiento en cadena de pensamiento con llamadas a herramientas, lo que permite tareas autónomas como flujos de trabajo de investigación, codificación y escritura.
- Cuantización INT4 nativa: El entrenamiento consciente de la cuantificación (QAT) se utiliza en la etapa posterior al entrenamiento para ofrecer una aceleración del 2× sin pérdidas.
- Agencia estable de largo horizonte: K2 Thinking puede ejecutar 200-300 llamadas de herramientas consecutivas sin interferencia humana (los modelos anteriores se degradaron después de 30-50 pasos).
Especificaciones de Kimi K2 Thinking
| Arquitectura | Mezcla de expertos (MoE) |
| Parámetros totales | 1 billón |
| Parámetros activados | 32 mil millones |
| Número de capas (capa densa incluida) | 61 |
| Número de capas densas | 1 |
| Atención Dimensión Oculta | 7168 |
| Dimensión oculta del Ministerio de Educación (por experto) | 2048 |
| Número de cabezales de atención | 64 |
| Número de expertos | 384 |
| Expertos seleccionados por token | 8 |
| Número de expertos compartidos | 1 |
| Tamaño del vocabulario | 160 mil |
| Longitud del contexto | 256 mil |
| Mecanismo de atención | MLA |
| Función de activación | SwiGLU |
¿Cómo se Compara Kimi? K2 Thinking vs GPT-5 vs Claude Soneto 4.5
Según Moonshot AI, K2 Thinking establece nuevos récords en los puntos de referencia para el razonamiento, la codificación y las capacidades de los agentes. Se comparó con GPT-5 (Alto) de OpenAI y Claude Sonnet 4.5 (Pensamiento) de Anthropic.
K2 Aprendizaje logrado:
- 44.9% en El último examen de la humanidad (con herramientas)
- 60.2% en BrowseComp
- 71.3% en SWE-Bench verificado
Una nota sobre la precisión de la evaluación de IA
A diferencia del software tradicional con salidas deterministas, los LLM generan resultados probabilísticos, lo que significa que la misma entrada puede producir diferentes salidas. Las evaluaciones generalmente se basan en puntos de referencia estandarizados (como MMLU o GPQA), pero estas herramientas tienen limitaciones notables.
Algunos puntos de referencia carecen de usabilidad práctica o no representan adecuadamente los escenarios del mundo real, y los resultados pueden ser engañosos si no se interpretan con el contexto adecuado.
“Los puntos de referencia son profundamente políticos, performativos y generativos en el sentido de que no describen y miden pasivamente cómo son las cosas en el mundo, sino que participan activamente en su configuración”, señalaron los investigadores. Estos puntos de referencia influyen en cómo se entrenan, ajustan y aplican los modelos de IA, agregaron, prácticas con amplios impactos políticos, económicos y culturales.
Capacidades agénticas de Kimi K2 Thinking
Según Moonshot AI, Kimi K2 Thinking sobresale en:
Razonamiento Agéntico
K2 Thinking está configurado con un conjunto de herramientas diverso que le permite planificar, razonar, ejecutar y adaptarse a través de cientos de pasos. En un ejemplo, según los creadores del modelo, resolvió un problema matemático de nivel de doctorado a través de 23 razonamientos entrelazados y llamadas a herramientas.
Codificación Agéntica
K2 Thinking razona mientras usa herramientas, lo que le permite integrarse en agentes de software para completar flujos de trabajo de desarrollo complejos y de varios pasos.
Algunos ejemplos que Kimi K2 Thinking construyó a partir de un solo mensaje, según la compañía, incluyen:
- Un sitio web con muchos componentes
- Una breve visualización explicativa de matemáticas
- Una simulación de células que atacan virus en el torrente sanguíneo
- Una simulación de disco de vinilo
- Música de codificación en vivo con Strudel.cc
Búsqueda y navegación de Agentic
K2 Thinking realiza ciclos de pensamiento → búsqueda → uso del navegador → pensar → código. Durante esos ciclos, genera y refina hipótesis, verifica información, razona y construye respuestas.
El razonamiento entrelazado del modelo de IA le permite convertir problemas vagos y abiertos en subtareas claras y procesables.
Capacidades generales de Kimi K2 Thinking
Según Moonshot AI, las otras capacidades generales de K2 Learning incluyen:
- Escritura creativa: K2 Thinking tiene un fuerte dominio del estilo y la instrucción, capaz de manejar diversos tonos y formatos con fluidez natural.
- Personal y emoción: El modelo de IA responde con empatía al abordar preguntas personales o emocionales, ofreciendo perspectivas matizadas y próximos pasos prácticos.
Cómo usar Kimi K2 Thinking
Puedes usar Kimi K2 Thinking ahora en Kimi.com en el modo de chat.
Este modo solo usa un subconjunto de herramientas y reduce la cantidad de llamadas a herramientas, lo que significa que usar K2 Thinking de esta manera puede no reproducir los puntajes de referencia, según los funcionarios de la compañía.
El modo agente completo estará disponible pronto, lo que los fabricantes de modelos dicen que “reflejará todas las capacidades de K2 Thinking”.
También se puede acceder al modelo a través de la API Kimi K2 Thinking.
Sobre el autor
Michelle Hawley es una periodista experimentada que se especializa en informar sobre el impacto de la tecnología en la sociedad. Como directora editorial de Simpler Media Group, supervisa las operaciones diarias de VKTR, cubriendo el mundo de la IA empresarial y administrando una red de escritores colaboradores. También es la presentadora de CMO Circle de CMSWire y copresentadora de CX Decoded de CMSWire. Con una maestría en escritura creativa y experiencia tanto en noticias como en marketing, ofrece conocimientos únicos sobre los temas de disrupción tecnológica, responsabilidad corporativa, legislación cambiante de IA y más. Actualmente reside en Pensilvania con su esposo y dos perros.
Fuente: https://www.vktr.com/ai-market/introducing-kimi-k2-thinking-chinas-most-capable-open-source-model/