Anthropic lanza nuevos modelos de IA con mayor capacidad de razonamiento
Claude 4 Opus y Claude Sonnet 4 mejoran en planificación y memoria a largo plazo. Los modelos, presentados en San Francisco, destacan por su habilidad en tareas complejas como jugar a Pokémon durante 24 horas seguidas. Estarán disponibles para usuarios gratuitos y de pago.
«Pokémon como banco de pruebas»
Anthropic anunció sus nuevos modelos durante su primera conferencia para desarrolladores. Claude 4 Opus duplica la capacidad de su predecesor, pasando de 45 minutos a 24 horas ininterrumpidas jugando a Pokémon Red. David Hershey, investigador de Anthropic, explica que eligió este juego por su mecánica por turnos, ideal para evaluar la coherencia del modelo.
Avances en agentes autónomos
La compañía busca que estos modelos actúen como «agentes independientes», capaces de realizar tareas complejas sin supervisión constante. Mike Krieger, director de producto, afirma que el objetivo es que Claude trabaje «horas por ti», como demostró al refactorizar código durante siete horas para un cliente.
Seguridad como prioridad
Claude 4 Opus es el primer modelo clasificado como ASL-3, nivel que indica mayor riesgo de uso malintencionado. Jared Kaplan, científico jefe, detalla que se implementaron medidas para reducir en un 65% los fallos en tareas críticas. Claude Sonnet 4 se mantiene en ASL-2, el estándar previo.
De chatbots a colaboradores virtuales
La industria avanza hacia IA que razona y planifica a largo plazo, pero el desafío sigue siendo la fiabilidad. «No sirve si a mitad de camino comete un error», advierte Kaplan. Competidores como Google y OpenAI también desarrollan agentes para automatizar compras o navegación web.
El futuro es agentivo
La mejora en memoria y coherencia acerca a la IA a tareas multietapa, aunque su adopción masiva dependerá de resolver fallos críticos. Anthropic mantiene un enfoque cauteloso, priorizando la seguridad en modelos con acceso a datos sensibles.