Los modelos de razonamiento están cambiando la forma en que usamos la IA. Descubre qué son, cómo funcionan y cómo utilizarlos para obtener resultados más precisos y profundos.

por Solon Teal

“El preentrenamiento ha muerto”, afirmó Ilya Sutskever, cofundador de OpenAI, en respuesta a las preguntas de diciembre de 2024 sobre el futuro del escalado de la IA, lo que marcó un punto de inflexión para los desarrolladores de IA. Durante años, la estrategia dominante para construir modelos más eficaces fue simple: alimentarlos con más datos y procesarlos. Pero con los datos humanos de alta calidad llegando a su límite, el comentario de Ilya marcó un cambio estratégico que ya se estaba produciendo en todo el sector.

Uno de los nuevos enfoques son los modelos de razonamiento, también llamados “modelos de pensamiento”. Desde GPT-o1 de OpenAI hasta “Extended Thinking” de Claude, “Flash Thinking” de Google, r1 de DeepSeek y las actualizaciones de Grok de xAI, casi todos los principales proveedores cuentan ahora con un modelo diseñado no solo para generar, sino también para razonar.

Si bien el razonamiento de estos modelos no es el mismo que el razonamiento humano, aumentan la complejidad de las tareas que los LLM pueden realizar, especialmente en áreas como matemáticas y programación, donde las respuestas tienden a ser más precisas. Sin embargo, al diferir de los modelos de chatbots de los últimos años, requieren un enfoque ligeramente distinto para obtener los mejores resultados. En esta guía, exploraremos los principios fundamentales de los modelos de razonamiento y cómo impulsarlos eficazmente.

¿Qué son los modelos de razonamiento?

Los modelos de razonamiento integran los mejores conocimientos del desarrollo de modelos y la ingeniería de impulsos. Un principio fundamental en su diseño es el uso de la incitación por cadena de pensamiento , que mejora los resultados al animar al modelo a razonar paso a paso. A diferencia de los modelos base, esta estrategia se entrena en el sistema: en lugar de necesitar que se le indique que “piense paso a paso”, el modelo lo hace por defecto, utilizando un enfoque más estratégico y orientado a procesos.

Para utilizar una metáfora de la cognición humana:

  • Los modelos estándar responden con “lo primero que tienen en mente”, como el pensamiento Tipo 1 de Daniel Kahneman : intuitivo, rápido y siempre presente.
  • Los modelos de razonamiento hacen una pausa para “tomarse un momento y pensar”, más parecido al pensamiento tipo 2: lento, reflexivo y metacognitivo.

Parte de ese pensamiento se transmite al usuario, pero gran parte del razonamiento permanece interno. Por ello, los modelos de razonamiento pueden tardar más tiempo, a veces minutos —como con o1-Pro de OpenAI— en responder, lo que aumenta los costes de inferencia y, a menudo, resulta en límites de velocidad más estrictos. El retraso puede convertirse en una limitación operativa incluso cuando el coste no es un factor. Por eso, estos modelos se benefician de un diseño de indicaciones más estratégico.

Modelos de razonamiento incitativo: mejores prácticas

No existe una “mejor práctica” universal para la inducción: si algo funciona repetidamente, funciona. Sin embargo, hay principios fundamentales que son más importantes en los modelos de razonamiento. A continuación, se presentan tres que destacan, seguidos de una lista resumida de recomendaciones de los principales proveedores de modelos.

Utilice un marco mental diferente: los modelos de razonamiento están hiperenfocados

Los modelos de razonamiento funcionan más como investigadores analíticos si los LLM estándar funcionan como becarios útiles. Si bien los modelos de razonamiento suelen ser más eficientes a la hora de solicitar claridad ante la ambigüedad, aún así toman una indicación, por muy clara que sea, la analizan y luego responden con su mejor evaluación. 

Aunque pueden ser más eficaces con problemas matemáticos y lógicos, siguen siendo fundamentalmente motores predictivos que pueden seguir rutas de razonamiento incorrectas. Son potentes, pero analizarán metódicamente cada palabra de tu propuesta, a veces con ventaja, a veces para tu frustración.

Lo más importante es que realizar experimentos paralelos entre las indicaciones existentes y las optimizadas para el razonamiento resulta invaluable, especialmente para quienes se inician en los modelos de razonamiento. Los usuarios suelen decepcionarse con los resultados de los modelos de razonamiento al usar indicaciones estándar, sobre todo porque sus características distintivas pueden verse afectadas por su proceso de inferencia altamente recursivo. A menudo, las indicaciones iniciales más eficaces para los modelos de razonamiento abordan problemas que los modelos existentes no logran resolver sistemáticamente.

Definir claramente el éxito, los objetivos y los resultados

Una de las mayores fortalezas de la IA es reconocer patrones demasiado sutiles o amplios para que los humanos los detecten. Pero esto es un arma de doble filo: así como los modelos pueden encontrar información útil, también pueden crear patrones engañosos, lo que resulta en alucinaciones o una lógica errónea.

Por eso es fundamental definir claramente:

  1. Tu objetivo
  2. Criterios de éxito
  3. Expectativas de producción

Sé explícito. Establece límites. Ofrece ejemplos. Si no lo haces, el modelo intentará completar los espacios en blanco y podría llevar tu tarea por un camino inesperado.

Anatomía de un aviso o1

Un esquema de razonamiento  avalado por Greg Brockman  sobre cómo incita a la IA

Por el contrario, los humanos a menudo carecen de una claridad total sobre sus objetivos, por lo que, además de experimentar con estímulos desafiantes para los modelos estándar, puede ser valioso plantear preguntas metacognitivas a los modelos de razonamiento, como “¿Cuál crees que debería ser mi objetivo dada esta situación?”. En lugar de buscar respuestas específicas de inmediato, los modelos de razonamiento pueden ser más eficaces al ayudar a analizar un problema de forma integral.

Utilice una estructura clara para comunicarse y organizarse

Los marcos de sugerencias siempre dependen de una estructura general de sugerencias . Asignar roles, compartir ejemplos y ser específico con los estilos son formas de optimizar la densidad de la intención del usuario y el contexto en una sugerencia. Sin embargo, con los modelos de razonamiento, usar una estructura organizativa clara resulta especialmente útil.

Los delimitadores para las distintas secciones de la solicitud, como <task>, #context u otros formatos Markdown/XML, ayudan al modelo a considerar las distintas secciones individualmente. Si bien este enfoque también beneficia a los modelos estándar, resulta esencial para los modelos de razonamiento asegurar una contextualización precisa de cada componente de información.

Este enfoque estructurado también te beneficia a ti, el usuario. La disciplina de usar indicaciones estructuradas suele fomentar una reflexión más profunda sobre el problema subyacente y las posibles soluciones. Es común empezar a redactar una indicación de razonamiento con delimitadores y etiquetas, solo para darse cuenta de que faltan datos esenciales o contexto. ¡Uy!, debería incluir #datosdelaindustria. Etiquetar la información facilita una resolución de problemas más eficaz y el refinamiento de las indicaciones de razonamiento, sobre todo gracias a sus amplias ventanas de contexto que permiten la revisión de documentos completos o bases de código.

Resumen de las mejores prácticas de motivación (ejemplo de IA)

Para ver cómo estos principios se aplican en la práctica, creé una propuesta de razonamiento utilizando el modelo o1 de OpenAI. La tarea: evaluar las guías de Anthropic y OpenAI, y luego generar una lista ordenada de las consideraciones más importantes al proponer modelos de razonamiento. Realicé esta prueba con o1 , o1-Pro  y 4o. A continuación, se muestra la respuesta de 4o , que se lee con mayor claridad en el contexto de este artículo:

  1. Utilice instrucciones claras y directas.
    Los modelos de razonamiento son excelentes con indicaciones concisas que definen claramente la tarea. Las entradas demasiado verbosas o ambiguas reducen el rendimiento: exprese con precisión lo que desea.
  2. Evite las indicaciones paso a paso a menos que sea necesario.
    Estos modelos gestionan internamente el razonamiento de varios pasos. Instruirles a “pensar paso a paso” a veces puede perjudicar los resultados en lugar de beneficiarlos.
  3. Empiece con cero intentos y escale solo si es necesario.
    Comience con una propuesta clara y añada ejemplos (pocos intentos) solo si el modelo presenta dificultades. Demasiados ejemplos pueden confundir o limitar el razonamiento interno del modelo.
  4. Delimitar las secciones de entrada con estructura.
    Usar Markdown, etiquetas XML o títulos claros para separar instrucciones, datos o ejemplos. Esto ayuda a los modelos a analizar la entrada y centrarse en la información correcta.
  5. Sea explícito sobre las restricciones y los criterios de éxito.
    Defina directamente cualquier límite (p. ej., “menos de $500”) o los requisitos de producción. Los modelos de razonamiento responden bien cuando la definición de “éxito” es clara.
  6. No predefina el razonamiento del modelo.
    En lugar de prescribir un flujo lógico fijo, deje que el modelo determine la mejor manera de resolver el problema; a menudo encuentra enfoques más inteligentes o eficientes.
  7. Trate al modelo como un experto, no como un seguidor.
    Los modelos de razonamiento funcionan mejor cuando se les pide que resuelvan problemas de forma autónoma, no que ejecuten instrucciones. Exija un análisis profundo, no cálculos mecánicos.
  8. Repita con retroalimentación, sin reformular.
    Si los resultados no son correctos, refine con retroalimentación como “esto no cumple con X” o “por favor, incluya Y” en lugar de reformular la pregunta original.
  9. Utiliza modos de pensamiento (como el pensamiento extendido de Claude) cuando la profundidad sea importante.
    Habilitar el razonamiento interno (p. ej., con bloques de pensamiento) permite que el modelo delibere y, a menudo, mejora la precisión y la trazabilidad en tareas complejas.
  10. Prefiera las indicaciones generales y luego refine.
    Comience con instrucciones generales como “analizar a fondo” o “evaluar las compensaciones”. Solo pase a un andamiaje detallado si es necesario para guiar la lógica del modelo.

Evaluación del mensaje del autor

He aquí algunas reflexiones rápidas:

  • Incluí el resultado 40 arriba porque se lee mejor. Esto coincide con mi experiencia de que los chatbots son mucho mejores para comunicarse, mientras que los modelos de razonamiento son mejores para racionalizar; una distinción importante.
  • La segunda respuesta que más me gustó fue la de o1-Pro, pero no mencionó la importancia de la estructura, lo que no fue genial considerando lo importante que mi experiencia ha demostrado que es.
  • Si no hubiera usado el marco mental de un modelo de razonamiento, 40 no habría sido el ganador con una pregunta de una sola prueba (lo comprobé). Normalmente, habría sido más perezoso y habría dicho algo como “sintetiza esto, etc.” en mi primer intento para ver qué tan lejos llegaba.
  • Si optimizara esto para que un modelo de razonamiento fuera la “mejor” opción, seguiría la lista anterior. Un modelo de razonamiento sería la mejor opción en un entorno sistémico.

Cuándo utilizar modelos de razonamiento

Los modelos de razonamiento son excelentes en tareas que exigen precisión, matices y una reflexión profunda. Son especialmente adecuados para:

  • Resolución estratégica de problemas complejos de múltiples pasos
  • Navegar por la ambigüedad o las instrucciones incompletas intuyendo lo que se debe hacer dadas instrucciones vagas
  • Analizar conjuntos de datos grandes o no estructurados para extraer información clave, especialmente con ventanas de contexto más largas
  • Planificar y ejecutar flujos de trabajo de varios pasos en una sola instrucción, en lugar de una cadena de instrucciones
  • Depurar código o analizar lógica compleja que tenga más probabilidades de tener una respuesta racional

Por el contrario, los modelos estándar son ideales para tareas bien definidas y de ejecución rápida: generar resúmenes, redactar correos electrónicos o publicaciones de blogs, responder preguntas sencillas o gestionar solicitudes repetitivas donde la velocidad y la eficiencia importan más que la profundidad.

En la práctica, los flujos de trabajo más eficaces suelen implicar ambos. Utilice modelos de razonamiento para la formulación, el análisis y la toma de decisiones; luego, transmita los resultados a modelos estándar para su comunicación, formato o ejecución. Los modelos de razonamiento le ayudan a resolver el problema adecuado. Los modelos estándar le ayudan a avanzar con rapidez una vez que sabe qué hacer.

Modelos de razonamiento: un componente central de la IA del futuro

Si bien los modelos de razonamiento son nuevos, es probable que se integren más en el uso diario de los modelos. Según se informa, ChatGPT-5 incorporará un selector de modelos para que el modo de pensamiento se active automáticamente según la solicitud del usuario. Algunos analistas los consideran un componente fundamental de la capacidad de generalización de los modelos .

El enfoque de los modelos de pensamiento en dominios deterministas como las matemáticas y la programación los convierte en componentes esenciales de la futura generación de datos sintéticos, lo que mejorará los modelos futuros. Sin embargo, independientemente de cómo determinen el futuro de la IA, comunicar eficazmente la intención, la visión y el proceso a los modelos de razonamiento, tanto ahora como en el futuro, permitirá a los usuarios expertos obtener resultados mejores y más matizados.

Acerca del autor

Cerceta de Solon

Solon Teal es un ejecutivo de operaciones de producto con una trayectoria dinámica que abarca el capital de riesgo, la innovación en startups y el diseño. Es un operador experimentado, emprendedor en serie, consultor de bienestar digital para adolescentes e investigador de IA, especializado en metacognición de herramientas y teoría práctica. Teal comenzó su carrera en Google, trabajando de forma transversal y vertical, y ha colaborado con empresas desde su inicio hasta su fase de crecimiento. Tiene un MBA y una maestría en innovación y estrategia de diseño por la Kellogg School of Management de la Universidad Northwestern y una licenciatura en historia y gobierno por el Claremont McKenna College. 

Fuente: https://www.vktr.com/ai-technology/how-to-prompt-reasoning-models-for-better-results/

Deja una respuesta