Presentamos Kimi K2 Thinking, el modelo de código abierto “más capaz” de China

El “tigre de la IA” chino Moonshot AI estrena su última incorporación al mundo de código abierto: Kimi K2 Thinking.

Contenido

Todo sobre Kimi K2 Thinking
Especificaciones de Kimi K2 Thinking
¿Cómo se Compara Kimi? K2 Thinking vs GPT-5 vs Claude Soneto 4.5
- Una nota sobre la precisión de la evaluación de IA
Capacidades agénticas de Kimi K2 Thinking
Capacidades generales de Kimi K2 Thinking
Cómo usar Kimi K2 Thinking
Sobre el autor

Los inversores llaman a Moonshot AI de Beijing una de las empresas “AI Tiger” de China, una empresa a la vanguardia de la carrera de China hacia el dominio global de la IA. Según el cofundador Yang Zhilin, su objetivo es construir modelos fundamentales para lograr la inteligencia artificial general (AGI).

Esta semana, Moonshot AI lanzó lo que llama su modelo de pensamiento de código abierto “más capaz”: Kimi K2 Thinking.

Todo sobre Kimi K2 Thinking

Según los funcionarios de la compañía, Kimi K2 Thinking (a veces denominado simplemente K2 Thinking) está construido como un “agente de pensamiento de código abierto que razona paso a paso” mientras usa herramientas.

Las características clave de K2 Thinking incluyen:

Pensamiento profundo y orquestación de herramientas: Entrenado para tejer el razonamiento en cadena de pensamiento con llamadas a herramientas, lo que permite tareas autónomas como flujos de trabajo de investigación, codificación y escritura.
Cuantización INT4 nativa: El entrenamiento consciente de la cuantificación (QAT) se utiliza en la etapa posterior al entrenamiento para ofrecer una aceleración del 2× sin pérdidas.
Agencia estable de largo horizonte: K2 Thinking puede ejecutar 200-300 llamadas de herramientas consecutivas sin interferencia humana (los modelos anteriores se degradaron después de 30-50 pasos).

Especificaciones de Kimi K2 Thinking

Arquitectura	Mezcla de expertos (MoE)
Parámetros totales	1 billón
Parámetros activados	32 mil millones
Número de capas (capa densa incluida)	61
Número de capas densas	1
Atención Dimensión Oculta	7168
Dimensión oculta del Ministerio de Educación (por experto)	2048
Número de cabezales de atención	64
Número de expertos	384
Expertos seleccionados por token	8
Número de expertos compartidos	1
Tamaño del vocabulario	160 mil
Longitud del contexto	256 mil
Mecanismo de atención	MLA
Función de activación	SwiGLU

¿Cómo se Compara Kimi? K2 Thinking vs GPT-5 vs Claude Soneto 4.5

Según Moonshot AI, K2 Thinking establece nuevos récords en los puntos de referencia para el razonamiento, la codificación y las capacidades de los agentes. Se comparó con GPT-5 (Alto) de OpenAI y Claude Sonnet 4.5 (Pensamiento) de Anthropic.

K2 Aprendizaje logrado:

44.9% en El último examen de la humanidad (con herramientas)
60.2% en BrowseComp
71.3% en SWE-Bench verificado

Puntajes de evaluación de Kimi K2 Learning — *Puntajes de evaluación de Kimi K2 Thinking*

Una nota sobre la precisión de la evaluación de IA

A diferencia del software tradicional con salidas deterministas, los LLM generan resultados probabilísticos, lo que significa que la misma entrada puede producir diferentes salidas. Las evaluaciones generalmente se basan en puntos de referencia estandarizados (como MMLU o GPQA), pero estas herramientas tienen limitaciones notables.

Algunos puntos de referencia carecen de usabilidad práctica o no representan adecuadamente los escenarios del mundo real, y los resultados pueden ser engañosos si no se interpretan con el contexto adecuado.

“Los puntos de referencia son profundamente políticos, performativos y generativos en el sentido de que no describen y miden pasivamente cómo son las cosas en el mundo, sino que participan activamente en su configuración”, señalaron los investigadores. Estos puntos de referencia influyen en cómo se entrenan, ajustan y aplican los modelos de IA, agregaron, prácticas con amplios impactos políticos, económicos y culturales.

Capacidades agénticas de Kimi K2 Thinking

Según Moonshot AI, Kimi K2 Thinking sobresale en:

Razonamiento Agéntico

K2 Thinking está configurado con un conjunto de herramientas diverso que le permite planificar, razonar, ejecutar y adaptarse a través de cientos de pasos. En un ejemplo, según los creadores del modelo, resolvió un problema matemático de nivel de doctorado a través de 23 razonamientos entrelazados y llamadas a herramientas.

Codificación Agéntica

K2 Thinking razona mientras usa herramientas, lo que le permite integrarse en agentes de software para completar flujos de trabajo de desarrollo complejos y de varios pasos.

Algunos ejemplos que Kimi K2 Thinking construyó a partir de un solo mensaje, según la compañía, incluyen:

Un sitio web con muchos componentes
Una breve visualización explicativa de matemáticas
Una simulación de células que atacan virus en el torrente sanguíneo
Una simulación de disco de vinilo
Música de codificación en vivo con Strudel.cc

Búsqueda y navegación de Agentic

K2 Thinking realiza ciclos de pensamiento → búsqueda → uso del navegador → pensar → código. Durante esos ciclos, genera y refina hipótesis, verifica información, razona y construye respuestas.

El razonamiento entrelazado del modelo de IA le permite convertir problemas vagos y abiertos en subtareas claras y procesables.

Capacidades generales de Kimi K2 Thinking

Según Moonshot AI, las otras capacidades generales de K2 Learning incluyen:

Escritura creativa: K2 Thinking tiene un fuerte dominio del estilo y la instrucción, capaz de manejar diversos tonos y formatos con fluidez natural.
Escritura práctica: Según los informes, K2 Thinking sigue las indicaciones con alta precisión, a menudo ampliando cada punto mencionado para garantizar una cobertura completa.
Personal y emoción: El modelo de IA responde con empatía al abordar preguntas personales o emocionales, ofreciendo perspectivas matizadas y próximos pasos prácticos.

Cómo usar Kimi K2 Thinking

Puedes usar Kimi K2 Thinking ahora en Kimi.com en el modo de chat.

Este modo solo usa un subconjunto de herramientas y reduce la cantidad de llamadas a herramientas, lo que significa que usar K2 Thinking de esta manera puede no reproducir los puntajes de referencia, según los funcionarios de la compañía.

El modo agente completo estará disponible pronto, lo que los fabricantes de modelos dicen que “reflejará todas las capacidades de K2 Thinking”.

También se puede acceder al modelo a través de la API Kimi K2 Thinking.

Sobre el autor

Michelle Hawley es una periodista experimentada que se especializa en informar sobre el impacto de la tecnología en la sociedad. Como directora editorial de Simpler Media Group, supervisa las operaciones diarias de VKTR, cubriendo el mundo de la IA empresarial y administrando una red de escritores colaboradores. También es la presentadora de CMO Circle de CMSWire y copresentadora de CX Decoded de CMSWire. Con una maestría en escritura creativa y experiencia tanto en noticias como en marketing, ofrece conocimientos únicos sobre los temas de disrupción tecnológica, responsabilidad corporativa, legislación cambiante de IA y más. Actualmente reside en Pensilvania con su esposo y dos perros.

Fuente: https://www.vktr.com/ai-market/introducing-kimi-k2-thinking-chinas-most-capable-open-source-model/

Todo sobre Kimi K2 Thinking

Especificaciones de Kimi K2 Thinking

¿Cómo se Compara Kimi? K2 Thinking vs GPT-5 vs Claude Soneto 4.5

Una nota sobre la precisión de la evaluación de IA

Capacidades agénticas de Kimi K2 Thinking

Razonamiento Agéntico

Codificación Agéntica

Búsqueda y navegación de Agentic

Capacidades generales de Kimi K2 Thinking

Cómo usar Kimi K2 Thinking

Sobre el autor

Related Articles

Pantallas, prisas y actividades: qué ocio necesita realmente un niño menor de tres años

¿Ven las máquinas mejor que nosotros si una imagen es falsa?

Todo lo que necesitas saber sobre Ethernet

¿Qué revelan las notificaciones del teléfono?

Rol de Cuidador en la Sociedad Digital

¿La IA está mejorando nuestra forma de pensar o la reemplaza?

Deja una respuesta Cancelar la respuesta

Política de Cookies