
ARTDEPARTMENT

El 2025 marca un hito esencia en la crecimiento de la inteligencia fabricado con el emanación de su nueva procreación de modelos desarrollados por la startup Anthropic, que ya se posicionan a la vanguardia del sector, desafiando a gigantes como OpenAI y Google. ¿Qué los hace tan especiales? ¿Por qué están siendo adoptados incluso por GitHub (teórico competidor)?
La compañía ha enérgico su esperada serie Claude 4, compuesta por los modelos Claude Opus 4 y Claude Sonnet 4 (la tercera variedad de Claude, Haiku, más ligera pero con menos capacidad de contexto, tendrá que esperar poco más para actualizarse).
Presentados durante su primera conferencia de desarrolladores ('Code with Claude'), estos modelos prometen sobrellevar la colaboración entre humanos y máquinas a un nuevo nivel, particularmente en tres ámbitos: el de la programación, el del razonamiento arduo y en el uso de agentes autónomos.
El anuncio de Claude 4 llega en un momento en que competidores como OpenAI, Google y Microsoft todavía han intensificado su ofrecimiento de modelos generativos


Claude Opus 4, la dije de la corona de Anthropic, es descrito por sus desarrolladores como "el mejor maniquí de codificación del mundo", una afirmación esperable en términos de marketing, pero que parece vebir respaldada por resultados en benchmarks como SWE-bench (72,5%) y Terminal-bench (43,2%).
Según afirma la compañía, este maniquí ya no es una mera aparejo de autocompletado, sino un colaborador inteligente, capaz de sostener conversaciones, razonar, ejecutar tareas complejas y nutrir memoria contextual.
De hecho, este maniquí está específicamente diseñado para ejecutar tareas complejas durante horas sin perder coherencia ni rendimiento, un avance trascendente frente a generaciones anteriores que casi nada podían sostener su rendimiento durante una o dos horas.

Rakuten, por ejemplo, ha hecho sabido que usó Opus 4 para refactorizar código de forma autónoma durante siete horas consecutivas con stop rendimiento.
Por su parte, Claude Sonnet 4 se postula como una crecimiento significativa de su predecesor 3.7 (justificando así su cambio de numeración): así, alcanza un 72,7% en el benchmark SWE-bench y ofreciendo una mejor respuesta a instrucciones complejas y viejo estabilidad en tareas cotidianas.
Empresas líderes como GitHub, Replit, Cursor, Rakuten y Block ya están integrando estos modelos en sus productos. GitHub, por ejemplo, utilizará Claude Sonnet 4 como colchoneta para su nuevo agente de codificación en Copilot
Una de las innovaciones más destacadas es la inmersión del modo “pensamiento extendido con uso de herramientas”, en el que los modelos pueden relevarse entre razonamiento interno y uso de herramientas externas como búsquedas web.
Esta funcionalidad permite una resolución de problemas más sofisticada, combinando pasos de razonamiento con acciones prácticas como ejecutar código o analizar archivos.
Encima, los dos modelos pueden usar múltiples herramientas en paralelo, accediendo a archivos locales para construir y nutrir memoria contextual a lo espacioso del tiempo, lo que progreso su desempeño en proyectos largos y continuos.
Contiguo con los modelos, Anthropic ha puesto a disposición de los usuarios su aparejo Claude Code, una interfaz pensada para integrarse con entornos como VS Code y JetBrains, permitiendo programación asistida directamente en el IDE del desarrollador.
Esta aparejo no solo sugiere cambios en tiempo positivo, sino que también puede trabajar en segundo plano mediante GitHub Actions, respondiendo a feedback de revisores, corrigiendo errores de CI, y gestionando tareas complejas de mejora.
Vía | Anthropic
Imagen | Marcos Merino mediante IA
En Genbeta | "Escribir código no es 'lo monótono', es mi oficio". Este programador ha vuelto al modo texto para evitar la tentación de la IA
Compartir este artículo
Consultoria Personalizada
¡Si aun no tienes presencia en internet o
necesitas ayuda con tus proyectos, por favor, escribenos!