Anthropic lanza Claude Opus 4.8: su modelo más capaz y "honesto" hasta la fecha
Anthropic presentó Claude Opus 4.8, su modelo insignia. Mejora el código agéntico, reduce a un cuarto la chance de dejar pasar errores sin avisar y suma Dynamic Workflows para orquestar cientos de subagentes en paralelo, todo al mismo precio que 4.7.
Anthropic · Modelos · Claude
Qué trae Opus 4.8
Anthropic presentó Claude Opus 4.8, el modelo más capaz que ofrece de forma general hasta la fecha. Construido sobre Opus 4.7, mejora de forma medible en los benchmarks y se posiciona como un colaborador más efectivo para tareas complejas.
Los números acompañan el anuncio: el puntaje de código agéntico pasa de 64,3% a 69,2% y el razonamiento multidisciplinario con herramientas sube de 54,7% a 57,9%. En el Super-Agent benchmark es el único modelo que completa todos los casos de principio a fin, por encima de versiones previas de Opus y de GPT-5.5 a paridad de costo.
Más honesto, no solo más potente
El eje que más destaca Anthropic no es la potencia bruta, sino la confiabilidad. Según sus evaluaciones internas, Opus 4.8 es cuatro veces menos probable que su antecesor de dejar pasar errores en el código sin remarcarlos.
Esa mejora en honestidad y autocalibración importa cuando el modelo deja de responder texto y empieza a tomar decisiones dentro de un flujo real: que avise cuando algo está mal o cuando no está seguro vale tanto como que acierte.
Dynamic Workflows: del prompt a la orquestación
La novedad más estratégica es Dynamic Workflows. Permite a Claude abordar problemas a muy gran escala: planifica el trabajo, ejecuta cientos de subagentes en paralelo dentro de una misma sesión y verifica los resultados antes de reportar.
Es un paso más en la dirección que veníamos marcando: el valor no está solo en el modelo que responde, sino en su capacidad de coordinar tareas, herramientas y verificación de punta a punta.
Qué significa para quienes implementan agentes
Para una agencia como ADA, un modelo más honesto y mejor para orquestar trabajo es una buena noticia concreta: agentes que avisan cuando algo no cierra y que pueden encarar tareas grandes con supervisión son más fáciles de poner a operar en negocios reales.
Y que el precio no se mueva respecto de 4.7 (USD 5 por millón de tokens de entrada y USD 25 de salida) baja la barrera para aprovechar estas mejoras sin rediseñar la economía de cada implementación.
Otras notas relacionadas
Si esta nota te interesó, estas otras siguen la misma línea: agentes, producto, integración y señales del mercado.
OpenAI y Anthropic se preparan para su salida a bolsa
OpenAI y Anthropic avanzan con su planificación para salir a bolsa en medio de un auge en el mercado de la IA.
Anthropic retira Claude Mythos tras detectar riesgos críticos en ciberseguridad
Anthropic ha decidido retirar su modelo Claude Mythos debido a riesgos de ciberseguridad descubiertos recientemente.
Anthropic presenta Claude Design, la herramienta que facilita el diseño visual
Anthropic ha lanzado Claude Design, una nueva herramienta que promete innovar el diseño visual mediante el uso efectivo de inteligencia artificial.