El lunes, Anthropic anunció el lanzamiento de Opus 4.5, la última versión de su modelo insignia. Esta nueva versión corona la serie 4.5 de modelos de Anthropic, que comenzó con la presentación de Sonnet 4.5 en septiembre y Haiku 4.5 en octubre. Opus 4.5 ha demostrado un rendimiento excepcional en una variedad de indicadores, destacándose especialmente en tareas de programación y capacidad de uso de herramientas.
Rendimiento y capacidades destacadas de Opus 4.5
Opus 4.5 ofrece un rendimiento de vanguardia en múltiples benchmark (pruebas de rendimiento), incluyendo:
- SWE-Bench y Terminal-bench para codificación.
- tau2-bench y MCP Atlas para el uso de herramientas.
- ARC-AGI 2 y GPQA Diamond para la resolución general de problemas.
Lo más notable es que Opus 4.5 ha sido el primer modelo en obtener una puntuación superior al 80 % en la verificación de SWE-Bench, un benchmark de codificación muy respetado.
Nuevos productos y mejoras en la memoria
Anthropic ha aprovechado el lanzamiento de Opus 4.5 para presentar productos paralelos como Claude for Chrome y Claude for Excel, que estarán ampliamente disponibles tras un periodo de prueba. La extensión de Chrome será accesible para todos los usuarios de Max, mientras que el modelo enfocado en Excel estará disponible para usuarios de Max, Team y Enterprise.
El nuevo modelo también incluye mejoras de memoria para operaciones de largo contexto, lo que exigió ajustes significativos en la gestión de memoria del modelo. Dianne Na Penn, responsable de gestión de productos en Anthropic, subrayó la importancia de saber qué detalles recordar, además de contar con una ventana de contexto más amplia.
Función de «chat infinito»
Una de las características más esperadas que se ha implementado es la función de «chat infinito» para usuarios de pago de Claude. Esta función permitirá a los usuarios continuar sus chats sin interrupciones, incluso cuando el modelo alcanza su ventana de contexto. En lugar de alertar al usuario, el modelo comprimirá su memoria de contexto para mantener la conversación fluida.
Aplicaciones en uso agente
Muchas de las mejoras de Opus 4.5 se han desarrollado pensando en casos de uso agente, especialmente en situaciones donde Opus actúa como un agente principal que coordina un grupo de sub-agentes impulsados por Haiku. Administrar estas tareas exige un sólido dominio de la memoria de trabajo, y es en este aspecto donde las mejoras de memoria resultan más valiosas.
Penn destacó que “este es el momento en que conceptos fundamentales como la memoria se vuelven realmente cruciales”, ya que Claude necesita ser capaz de explorar bases de código y documentos extensos, además de saber cuándo retroceder y verificar algo.
Competencia en el mercado
Opus 4.5 se enfrentará a una fuerte competencia por parte de otros modelos de frontera recientemente lanzados, como GPT 5.1 de OpenAI y Gemini 3 de Google, que se presentaron el 12 y 18 de noviembre, respectivamente.
Consejos para emprendedores
-
Mantenerse actualizado: Las tendencias en inteligencia artificial y software cambian rápidamente. Asegúrate de estar al tanto de los últimos desarrollos en tecnología.
-
Invertir en formación: Capacitar a tu equipo sobre nuevas herramientas, como Opus 4.5, puede mejorar la eficiencia y productividad de tu negocio.
-
Explorar la automatización: Aprovecha modelos como Opus 4.5 para automatizar tareas repetitivas, permitiendo que tu personal se enfoque en actividades más estratégicas.
- Adoptar la colaboración: Utilizar tecnologías que fomenten el trabajo en equipo y la colaboración puede ser clave para el éxito en proyectos complejos.
Conclusiones
El lanzamiento de Opus 4.5 representa un avance significativo en el campo de la inteligencia artificial, con su gran rendimiento y nuevas capacidades que abren puertas a diversas aplicaciones empresariales. Las empresas deben considerar cómo integrar estas tecnologías en sus operaciones para no quedarse atrás en un mercado cada vez más competitivo. Al invertir en formación y en el uso de herramientas avanzadas, pueden mejorar su rendimiento y adaptarse mejor a las demandas del futuro.