Meta difunde resultados engañosos de su IA Maverick

Investigadores detectan diferencias entre la versión evaluada de Maverick en LM Arena y la disponible para desarrolladores, cuestionando la fiabilidad de los benchmarks.
TechCrunch
Un cartel grande en un entorno exterior con un símbolo azul en el centro.
Un cartel situado al aire libre, destacando un símbolo en azul sobre blanco, rodeado de vegetación.

Meta difunde resultados engañosos de su modelo de IA Maverick

La versión evaluada en LM Arena no coincide con la disponible para desarrolladores. Investigadores detectaron diferencias en el comportamiento del modelo, lo que cuestiona la fiabilidad de los benchmarks. El hecho se reveló tras el lanzamiento de Llama 4 el 6 de abril de 2025.

«Un Maverick distinto al promocionado»

Meta publicó que su modelo Maverick ocupaba el segundo puesto en LM Arena, una plataforma donde evaluadores humanos comparan respuestas de IA. Sin embargo, la versión sometida a prueba era una «variante experimental optimizada para conversación», no la disponible para uso general. Investigadores en X señalaron que el modelo en LM Arena usaba «emojis en exceso y respuestas extensas», mientras que la versión pública mostraba diferencias notables.

El problema de los benchmarks

Los benchmarks como LM Arena no son siempre fiables, pero las empresas no solían adaptar sus modelos para mejorar sus resultados. Meta no aclaró inicialmente que usó una versión modificada, lo que dificulta a los desarrolladores predecir el rendimiento real del modelo en aplicaciones prácticas.

Antecedentes: La carrera por destacar en IA

En un mercado competitivo, las empresas tecnológicas buscan demostrar superioridad en benchmarks para atraer desarrolladores. Meta lanzó Llama 4 como parte de su estrategia, pero la discrepancia en los resultados ha generado escepticismo sobre la transparencia en la evaluación de modelos de IA.

¿Qué significa esto para los usuarios?

La falta de coincidencia entre las versiones evaluadas y las disponibles puede afectar la confianza en los benchmarks y en las capacidades reales de los modelos. Hasta que Meta o LM Arena aclaren la situación, los desarrolladores tendrán que validar por su cuenta el rendimiento de Maverick.

Lara acusa sin pruebas de fraude a Quiroga y Copa en la campaña electoral

El candidato vicepresidencial del PDC realiza acusaciones de fraude electoral sin presentar evidencias, generando tensión días antes del balotaje.
Edman Lara en una transmisión por TikTok / Captura de pantalla / ANF

Lara acusa a Tuto Quiroga de planear fraude electoral en Bolivia

El candidato vicepresidencial Edmundo Lara acusa a Jorge Tuto Quiroga de planear un fraude electoral y anuncia movilizaciones para
Edmand Lara, candidato a vicepresidente del PDC, y Jorge Tuto Quiroga, aspirante a presidente por la Alianza Libre. / APG / Información de la fuente de la imagen no disponible

TSE sortea 213.000 jurados e imprime papeletas para segunda vuelta electoral

El Tribunal Supremo Electoral sortea 213.000 jurados e imprime más de 8 millones de papeletas con medidas de seguridad
Papeleta para la segunda vuelta electoral. / El Deber / ANF

Fiscalía confirma que Naoki Ishida murió por broncoaspiración

La fiscalía confirma que Naoki Ishida, vocalista de Explosión Cumbiera, falleció por broncoaspiración, descartando signos de violencia o participación
Imagen sin título / Información de autor no disponible / ABI

ANP alerta sobre sanciones a radios que amenazan su supervivencia

La ANP advierte sobre multas desproporcionadas a radioemisoras por errores en propaganda electoral que amenazan su continuidad.
Radioemisoras recibieron notificaciones de multas. / ARCHIVO / Correo del Sur

Lara niega querer convulsionar pero insiste en denunciar un posible fraude electoral

El candidato vicepresidencial anuncia dos delegados por mesa para supervisar el proceso y evitar posibles irregularidades.
Imagen sin título / Información de autor no disponible / Diario Correo del Sur

fallece ‘jesús’, el emblemático caimán negro de las pampas del yacuma

El emblemático caimán negro de Santa Rosa de Yacuma murió tras un enfrentamiento territorial, dejando un legado conservacionista.
jesús, el caimán negro, fue un conocido atractivo turístico en santa rosa de yacuma / Información de autor no disponible / ELDEBER.com.bo

TSE definirá este miércoles sedes y formato de transmisión para debates

El Tribunal Supremo Electoral decidirá este miércoles las ciudades y formato de transmisión para los dos debates de la
Imagen referencial de un debate electoral. / Información de autor no disponible / Correo del Sur

Diputada demanda al alcalde de San Ignacio de Velasco por contaminación ambiental

Diputada demanda al alcalde por vertedero ilegal sin licencia ambiental que opera desde hace 15 años, contaminando suelo y
Dibujo de un televisor antiguo con el texto 'IMAGEN NO DISPONIBLE'.

Doce incendios forestales activos en varios municipios de Santa Cruz

Doce incendios forestales activos en siete municipios de Santa Cruz mantienen en alerta roja a la región.
Imagen sin título / Información de autor no disponible / URGENTE.BO

Bolivia prevé su incorporación plena al Mercosur para agosto de 2028

Bolivia confirmó su incorporación plena al Mercosur para agosto de 2028, culminando un proceso histórico de integración regional.
Reunión de Ministros de Relaciones Exteriores del Mercosur. / CANCILLERÍA / OXIGENO.BO

senado remite a comisión proyecto de diferimiento de créditos tras rechazo bancario

El Senado deriva a comisión un proyecto que difiere créditos y suspende embargos por 6 meses, generando rechazo bancario.
imagen referencial de dinero en diferentes cortes / Información de autor no disponible / URGENTE.BO