Meta difunde resultados engañosos de su IA Maverick

Investigadores detectan diferencias entre la versión evaluada de Maverick en LM Arena y la disponible para desarrolladores, cuestionando la fiabilidad de los benchmarks.
TechCrunch
Un cartel grande en un entorno exterior con un símbolo azul en el centro.
Un cartel situado al aire libre, destacando un símbolo en azul sobre blanco, rodeado de vegetación.

Meta difunde resultados engañosos de su modelo de IA Maverick

La versión evaluada en LM Arena no coincide con la disponible para desarrolladores. Investigadores detectaron diferencias en el comportamiento del modelo, lo que cuestiona la fiabilidad de los benchmarks. El hecho se reveló tras el lanzamiento de Llama 4 el 6 de abril de 2025.

«Un Maverick distinto al promocionado»

Meta publicó que su modelo Maverick ocupaba el segundo puesto en LM Arena, una plataforma donde evaluadores humanos comparan respuestas de IA. Sin embargo, la versión sometida a prueba era una «variante experimental optimizada para conversación», no la disponible para uso general. Investigadores en X señalaron que el modelo en LM Arena usaba «emojis en exceso y respuestas extensas», mientras que la versión pública mostraba diferencias notables.

El problema de los benchmarks

Los benchmarks como LM Arena no son siempre fiables, pero las empresas no solían adaptar sus modelos para mejorar sus resultados. Meta no aclaró inicialmente que usó una versión modificada, lo que dificulta a los desarrolladores predecir el rendimiento real del modelo en aplicaciones prácticas.

Antecedentes: La carrera por destacar en IA

En un mercado competitivo, las empresas tecnológicas buscan demostrar superioridad en benchmarks para atraer desarrolladores. Meta lanzó Llama 4 como parte de su estrategia, pero la discrepancia en los resultados ha generado escepticismo sobre la transparencia en la evaluación de modelos de IA.

¿Qué significa esto para los usuarios?

La falta de coincidencia entre las versiones evaluadas y las disponibles puede afectar la confianza en los benchmarks y en las capacidades reales de los modelos. Hasta que Meta o LM Arena aclaren la situación, los desarrolladores tendrán que validar por su cuenta el rendimiento de Maverick.

Arce admite que no entregará todas las obras antes de finalizar su mandato

El presidente boliviano Luis Arce reconoce que solo entregará 200 obras diarias hasta noviembre, en medio de una crisis
Luis Arce. Foto: Unitel Información de autor no disponible / ANF

Samuel y Tuto lideran encuesta electoral a 15 días de comicios

Doria Medina (24,5%) y Quiroga (22,9%) encabezan la intención de voto según encuesta de Spie Consulting, con un 25%
Samuel, Tuto y Rodrigo se encuentran en los tres primeros lugares Información de autor no disponible / ANF

Debate presidencial en Santa Cruz a dos semanas de elecciones

Ocho candidatos presidenciales debatieron propuestas sobre democracia, medioambiente y derechos humanos en un evento organizado por el TSE para
Debate presidencial organizado por el TSE Alianza Unidad / Unitel Digital

Candidatos intercambian apodos en debate presidencial boliviano

Eduardo Del Castillo (MAS) y Samuel Doria Medina (Unidad) protagonizaron un cruce de apodos y acusaciones durante el debate
Imagen sin título Información de autor no disponible / Unitel Digital

Tuto cuestiona a Andrónico por casos sin justicia en debate presidencial

Tuto Quiroga interpeló a Andrónico Rodríguez sobre casos emblemáticos sin resolver, como el Hotel Las Américas y los esposos
Imagen sin título Información de autor no disponible / Unitel Digital

Juez ordena prisión para Ramiro Cucho por conflicto en Llallagua

El líder evista Ramiro Cucho fue enviado a prisión preventiva por incumplir su arresto domiciliario y estar vinculado a
Dirigente evista, Ramiro Cucho. ARCHIVO-APG / ERBOL

Doria Medina acusa a Del Castillo de secuestrar a Camacho en debate

Samuel Doria Medina acusó a Eduardo Del Castillo de secuestrar a Luis Fernando Camacho durante el debate presidencial organizado
Eduardo Del Castillo (izquierda) y Samuel Doria Medina durante el debate Información de autor no disponible / Unitel Digital

Debate presidencial por detención de Evo Morales enfrenta a candidatos

Candidatos Reyes Villa y Aracena chocan en debate por estrategias opuestas para detener a Evo Morales: operativo militar vs.
Imagen sin título Información de autor no disponible / Unitel Digital

Andrónico Rodríguez respalda reelección limitada en debate del TSE

El candidato de Alianza Popular apoya dos mandatos máximos en el debate presidencial, alineándose con el fallo del TCP
Imagen sin título Información de autor no disponible / Unitel Digital

Aracena propone referendo para intervención militar en conflictos

El candidato Pavel Aracena plantea un referendo para autorizar a las FFAA a intervenir en bloqueos políticos, avasallamientos y
Imagen sin título Información de autor no disponible / Unitel Digital

Doria Medina rechaza que Bolivia sea un Estado fallido y critica a políticos

El candidato de Unidad responsabiliza a la clase política de la crisis actual en Bolivia, destacando mala gestión histórica
Samuel Doria Medina, candidato de la alianza Unidad UNITEL / Unitel Digital

Candidato del MAS propone revolución en la Justicia para 2028

Eduardo del Castillo, candidato del MAS, plantea un cambio radical en el sistema judicial boliviano con nuevas autoridades y
Eduardo del Castillo durante su intervención en el debate. Información de autor no disponible / Unitel Digital