Anthropic lanza nueva versión de Claude Opus para la etapa agéntica de la IA

Anthropic presentó la actualización de su modelo más potente Claude Opus 4.6, que ahora incluye múltiples novedades con mejoras sustanciales en habilidades de codificación, razonamiento y gestión de tareas complejas. Una de las principales características de la nueva versión, que llega apenas dos meses después de su versión anterior, es que ahora posee la capacidad de gestionar equipos de agentes para trabajo en conjunto.

Esta nueva versión de Claude Opus presentada por Anthropic introduce por primera vez una ventana de contexto de un millón de tokens en versión beta. Esta capacidad permite al modelo procesar cantidades significativamente mayores de información, trabajar con bases de código más extensas y manejar documentos de gran tamaño con mayor eficiencia. Básicamente, significa también que Claude puede “recordar” y trabajar con mayores cantidades de información de una sola vez.

La compañía desarrolladora afirma que el modelo ha demostrado un rendimiento excepcional en evaluaciones de referencia del sector, logrando la puntuación más alta en Terminal-Bench 2.0 para codificación Agéntica y liderando en Humanity’s Last Exam, una prueba compleja que mide el razonamiento multidisciplinario. Según Anthropic, Opus 4.6 supera a competidores destacados como GPT-5.2 de OpenAI, con una ventaja de 144 puntos Elo en la evaluación GDPval-AA.

Equipos de agentes: la novedad estrella

Entre las novedades más significativas se encuentra la capacidad experimental de formar “equipos de Agentes” en Claude Code. Esta funcionalidad permite dividir tareas complejas en trabajos segmentados que se ejecutan de manera coordinada. La compañía explica que “una sesión actúa como líder del equipo, coordinando el trabajo, asignando tareas y sintetizando resultados, mientras los compañeros de equipo trabajan de forma independiente en su propia ventana de contexto”.

Por otro lado, Claude ahora también puede funcionar en aplicaciones del ecosistema Office de Microsoft como Excel y PowerPoint. En Excel, por ejemplo, puede gestionar tareas largas y complejas, y puede planificar antes de actuar, procesar datos no estructurados e inferir la estructura correcta sin necesidad de guía.

El trabajo en Excel se puede combinar con PowerPoint, por lo que podrá procesar y estructurar datos primero en Excel y luego presentarlos de forma visual con las capacidades de PowerPoint. Claude lee diseños, fuentes y patrones de diapositivas para mantener la imagen de marca.

Las aplicaciones prácticas del modelo abarcan análisis financieros, investigación, creación de documentos, hojas de cálculo y presentaciones. Opus 4.6 está integrado en Claude Cowork y ya disponible en PowerPoint en versión preliminar, permitiendo generar presentaciones completas a partir de instrucciones simples.

Además, ante el mayor interés en el llamado vibe coding, una técnica para escribir código a través de un modelo grande de lenguaje (LLM), Opus 4.6 promete avances notables en sus capacidades de programación, lo que incluye mejor planificación, mayor fiabilidad en bases de código extensas y capacidades mejoradas de revisión y depuración que le permiten “detectar sus propios errores”.

Según Anthropic, el modelo incorpora una función de “compactación” para resumir su propio contexto y ejecutar tareas de mayor duración, junto con pensamiento adaptativo que optimiza el uso de recursos según las necesidades contextuales.

La compañía de IA también ha puesto especial énfasis en que Opus 4.6 opera de forma segura, con bajos índices de comportamiento desalineado en las evaluaciones. Para ello, ha implementado nuevas salvaguardas específicas para ciberseguridad, manteniendo un equilibrio entre potencia y responsabilidad.

Claude Opus 4.6 ya está disponible en claude.ai, a través de la API y en las principales plataformas en la Nube para usuarios suscritos a Claude Pro. Los precios se mantienen sin cambios: 5 dólares por millón de tokens de entrada y 25 dólares por millón de tokens de salida.

Claude Opus disponible en Google Cloud para tareas agénticas

De forma paralela, Google Cloud anunció que ya tiene disponible el modelo Claude Opus 4.6 en su plataforma de desarrollo para Inteligencia Artificial, Vertex AI, que ahora incluye un stack completo para construir sistemas agénticos. La compañía asegura que la plataforma podrá ayudar a las empresas a construir agentes que pueden mantener el contexto, tomar decisiones autónomas y operar de forma segura a escala.

Entre sus principales características se encuentran Vertex AI Agent Builder stack, que incluye Agent Development Kit, que permiten llevar flujos de trabajo agénticos de múltiples pasos, desde el prototipo hasta producción escalada.

La plataforma también cuenta con Agent Engine para desplegar Agentes a escala en un entorno serverless; funciones de eficiencia para mantener el rendimiento en horas de demanda pico; controles integrados que mantienen los Agentes enfocados en sus tareas con acciones registradas; y medidas de seguridad contra amenazas, como inyección de avisos y envenenamiento de herramientas.