Un estudio revela que solicitar respuestas breves a chatbots como GPT-4o y Claude 3.7 Sonnet incrementa sus errores factuales, priorizando concisión sobre precisión….
Los modelos o3 y o4-mini de OpenAI generan hasta un 48% de respuestas falsas, según pruebas internas y análisis independientes publicados recientemente….