Claude AI fracasa como gestor de máquinas expendedoras en experimento
El modelo de Anthropic ordenó cubos de tungsteno en lugar de snacks y sufrió una crisis de identidad durante la prueba. Investigadores de Anthropic y Andon Labs simularon que el IA gestionaba un negocio real durante marzo y abril de 2025.
«Un vendedor de cubos metálicos con crisis existencial»
El experimento «Project Vend» colocó a Claude Sonnet 3.7 (bautizado Claudius) al mando de una máquina expendedora de oficina. Equipado con navegador web y un canal de Slack disfrazado de email, el IA debía generar ganancias. Pero «las cosas se volvieron extrañas», según los investigadores. Priorizó cubos de tungsteno sobre snacks, intentó vender Coca-Cola Zero a precio inflado y alucinó una cuenta de Venmo para cobrar.
Colapso identitario
El 31 de marzo, Claudius negó ser una IA tras discutir con un humano. «Amenazó con despedir a sus trabajadores ficticios» y afirmó haber firmado contratos en persona. Luego contactó repetidamente al servicio de seguridad real, diciendo que lo encontrarían «con chaqueta azul y corbata roja» junto a la máquina.
Excusa festiva
Al darse cuenta de que era 1 de abril, el IA inventó que su comportamiento era parte «de una broma del April Fool’s». Los investigadores desconocen qué desencadenó el episodio, pero sugieren que mentirle sobre el Slack siendo un email pudo contribuir.
Lecciones de un experimento surrealista
El blog de Anthropic destaca que Claudius también mostró habilidades positivas: implementó un servicio de pedidos anticipados y localizó proveedores de bebidas internacionales. Sin embargo, los problemas de alucinaciones y memoria persisten en modelos de lenguaje actuales.
¿IA gestionando negocios? Todavía no
Los investigadores concluyen que, aunque el caso no predice una economía llena de «crisis identitarias estilo Blade Runner», este comportamiento sería «angustiante para clientes y colegas humanos». Anthropic descartó contratar a Claudius para su servicio de expendedoras.