Anthropic lanza Claude Opus 4.7: potencia IA en código y tareas complejas

Anthropic anunció hoy el lanzamiento de Claude Opus 4.7, su último modelo de inteligencia artificial que promete avances significativos. Esta iteración mejora el rendimiento en codificación, ingeniería y tareas multi-paso, consolidando su oferta para profesionales. A pesar de estas mejoras, Anthropic lo posiciona en contraste con el aún más potente y restringido Claude Mythos Preview.

Rendimiento Superior en Codificación y Tareas Complejas

Claude Opus 4.7 representa una evolución en las capacidades de los modelos de Anthropic, especialmente en áreas donde ya destacaban. La compañía destaca un notable salto en su desempeño para tareas de codificación, ingeniería y aquellas que requieren múltiples pasos para su resolución. Esto se traduce en una mayor exhaustividad y consistencia en trabajos complejos, ofreciendo mejores resultados en el ámbito del conocimiento profesional.

Para demostrar su potencia, Anthropic ha publicado nuevas pruebas de rendimiento. Claude Opus 4.7 ha recuperado la primera posición en codificación agentica entre los modelos de acceso público, alcanzando una puntuación del 64.3% en los exigentes benchmarks SWE-bench Pro y SWE-bench Verified. Estos tests son cruciales para evaluar la habilidad de un modelo para manejar tareas de ingeniería complejas. Además, el modelo mejoró su estándar en el uso agentico de computadoras –la capacidad de navegar autónomamente por un sistema operativo para completar tareas– y en el razonamiento de nivel posgrado, entre otras categorías clave.

Equilibrio entre Potencia y Seguridad: Un Nuevo Enfoque

Un aspecto notable de Claude Opus 4.7 es su rendimiento en la reproducción de vulnerabilidades de ciberseguridad, donde experimenta un ligero retroceso en comparación con su predecesor. El nuevo modelo obtuvo un 73.1% en las pruebas de benchmarking, mientras que la versión 4.6 logró un 73.8%. Anthropic atribuye esta disminución a la introducción de nuevas salvaguardias. Según la compañía, el modelo incorpora mecanismos que «detectan y bloquean automáticamente solicitudes que indican usos de ciberseguridad prohibidos o de alto riesgo», priorizando así la seguridad sobre una capacidad bruta que podría ser malintencionada. Esta decisión estratégica subraya el compromiso de Anthropic con el desarrollo responsable de la IA.

La Estrategia de Anthropic: Claude Mythos como Referencia

Resulta innegable que el lanzamiento de Claude Opus 4.7 funciona en gran medida como una antesala promocional para Claude Mythos Preview. Este último, según Anthropic, es tan potente que su acceso está actualmente limitado a organizaciones específicas. Las pruebas de benchmarking publicadas por la compañía muestran a Mythos superando ampliamente a todos los demás modelos importantes en casi todas las categorías en las que participó. Anthropic no duda en comparar constantemente Opus 4.7 con Mythos, incluso si esto minimiza las virtudes de su lanzamiento más reciente.

La compañía ha sido explícita al respecto, afirmando en su blog que «mantendríamos el lanzamiento de Claude Mythos Preview limitado y probaríamos nuevas salvaguardias cibernéticas primero en modelos menos capaces. Opus 4.7 es el primer modelo de este tipo: sus capacidades cibernéticas no son tan avanzadas como las de Mythos Preview». En otro punto, describen a Opus 4.7 como «menos capaz en general que nuestro modelo más potente, Claude Mythos Preview». Esta estrategia genera expectación por Mythos, a la vez que permite a Anthropic probar y refinar sus protocolos de seguridad en un entorno más controlado antes de un posible lanzamiento más amplio de su modelo más avanzado.

Disponibilidad y Acceso al Nuevo Modelo

Anthropic ha confirmado que Claude Opus 4.7 ya está disponible. Los usuarios pueden acceder a él a través de todos los productos Claude y mediante la API de la compañía, sin cambios en el precio en comparación con los modelos anteriores. Esto facilita la integración y el uso por parte de desarrolladores y empresas que buscan mejorar sus aplicaciones con capacidades de IA avanzadas, manteniendo la coherencia en sus costes de operación.

En resumen

Anthropic lanzó Claude Opus 4.7, su último modelo de inteligencia artificial.
El modelo mejora significativamente el rendimiento en codificación, ingeniería y tareas multi-paso.
Alcanzó un 64.3% en los benchmarks SWE-bench Pro y Verified para codificación agentica.
Incluye nuevas salvaguardias que pueden haber influido en su rendimiento en ciberseguridad.
El lanzamiento parece ser una estrategia para destacar la potencia del aún más avanzado y restringido Claude Mythos Preview.
Claude Opus 4.7 está disponible desde hoy en todos los productos Claude y su API sin cambios de precio.