Qwen3: el modelo de IA de Alibaba con “pensamiento rápido” y “pensamiento lento”
Alibaba presentó Qwen3, la nueva versión de su modelo de IA de código abierto.
Alibaba anunció el lanzamiento de Qwen3, su modelo insignia de lenguaje de Inteligencia Artificial (IA), que muestra resultados altamente competitivos en puntos de referencia como código, matemáticas y capacidad general en comparación con los modelos superiores como DeepSeek-R1, o1, o3-mini, Grok-3 y Gemini-2.5-Pro.
Alibaba reveló que publicaron en código abierto dos modelos: Qwen3-235B-A22B, un modelo grande con más de 235 mil millones de parámetros totales y más de 22 mil millones de parámetros de activación, y Qwen3-30B-A3B, un modelo pequeño con aproximadamente 30 mil millones de parámetros totales y 3 mil millones de parámetros de activación.
El modelo Qwen3 además tiene un sistema denominado “modelo de inferencia híbrida”, en el que se integran dos modos de funcionamiento: uno de “pensamiento rápido” para resolver tareas simples de manera inmediata, y otro de “pensamiento lento” para abordar problemas más complejos mediante razonamientos de varios pasos.
Alibaba detalló que en el modo de pensamiento el modelo razonará paso a paso y dará una respuesta final después de una cuidadosa consideración. Dijo que este enfoque es adecuado para problemas complejos que requieren un pensamiento profundo.
En cambio, en el modo sin pensamiento el modelo proporciona respuestas rápidas, casi instantáneas, y es adecuado para problemas simples donde la velocidad es más importante que la profundidad.
“Esta flexibilidad permite al usuario controlar el grado en que el modelo ‘piensa’, dependiendo de la tarea específica. Por ejemplo, las preguntas complejas se pueden resolver ampliando los pasos de razonamiento, mientras que las preguntas simples se pueden responder de manera directa y rápida sin demora”, dijo la compañía china.
Asimismo, Qwen3 exhibe ganancias de rendimiento escalables y fluidas que están directamente relacionadas con el presupuesto de inferencia computacional asignado. Este diseño, agregó Alibaba, permite a los usuarios configurar más fácilmente presupuestos específicos para diferentes tareas y lograr un mejor equilibrio entre costo-efectividad y calidad de inferencia.
Apenas la semana pasada, la empresa Baidu anunció el lanzamiento de dos nuevos modelos de IA: Ernie 4.5 Turbo y Ernie X1 Turbo.