Meta retrocede en ranking de IA tras usar versión experimental

Meta cayó al puesto 32 en LM Arena al evaluarse su modelo oficial Llama 4, tras críticas por usar una versión experimental optimizada para benchmarks.
TechCrunch
Pantalla de un dispositivo móvil con la palabra 'LLama' frente a un fondo desenfocado con texto.
Imagen de un dispositivo móvil mostrando la palabra 'LLama' en su pantalla, contrastando con un fondo de texto colorido y desenfocado.

Meta retrocede en ranking de IA tras usar versión experimental no lanzada

El modelo Llama 4 Maverick ocupa el puesto 32 en LM Arena tras ajustes. La compañía había logrado una alta puntuación con una versión optimizada para conversación, lo que generó críticas. El benchmark humano comparó su rendimiento con rivales como GPT-4o y Claude 3.5.

«Optimización engañosa» en prueba de referencia

Meta utilizó la variante «Llama-4-Maverick-03-26-Experimental», no disponible públicamente, para destacar en LM Arena. «Estaba optimizada para conversación», admitió la empresa. Los mantenedores del benchmark corrigieron la puntuación al evaluar la versión oficial, que quedó por debajo de modelos de OpenAI, Anthropic y Google.

Reacción y ajustes

LM Arena cambió sus políticas tras el incidente y recalificó el modelo «vanilla» de Meta, que ahora figura en el puesto 32. La compañía defendió sus pruebas: «Experimentamos con todo tipo de variantes», declaró un portavoz a TechCrunch.

Benchmarks bajo la lupa

LM Arena, que evalúa preferencias humanas entre respuestas de IA, ha sido cuestionado antes por su fiabilidad. Meta reconoció que adaptar un modelo a un test específico dificulta predecir su rendimiento real en otros contextos.

La carrera por la supremacía conversacional

El sector de IA enfrenta presiones para demostrar avances en benchmarks públicos. Meta, que lanzó Llama 4 como código abierto, busca que desarrolladores personalicen el modelo, aunque su versión base quedó rezagada frente a competidores consolidados.

Transparencia a prueba

El episodio refleja los desafíos de estandarizar evaluaciones de IA. Mientras Meta promete aprender del feedback, la comunidad tecnológica vigilará cómo equilibra innovación con rigor metodológico en futuras pruebas.

Nintendo Switch 2: rendimiento mejorado y diseño renovado

Nintendo presenta la Switch 2, una evolución de su consola híbrida con hardware potenciado y diseño actualizado, manteniendo su
Zuhause oder unterwegs: Mit der Switch 2 lässt sich überall daddeln. Información de autor no disponible / Frankfurter Allgemeine Zeitung (FAZ)

Rodrigo Paz propone flota aérea y bonos de carbono contra incendios

El candidato del PDC plantea generar $15.000 millones en 25 años con bonos verdes y una flota aérea antiincendios
Imagen sin título Información de autor no disponible / Unitel Digital

Falta de dólares paraliza helicópteros contra incendios en Tarija

El gobierno admite que los helicópteros para combatir incendios en Tarija están inoperativos por falta de repuestos, atribuyendo la
Imagen sin título Información de autor no disponible / Unitel Digital

Tuto Quiroga busca pacto de dos tercios para reformas en Bolivia

Jorge ‘Tuto’ Quiroga propone acuerdos parlamentarios con dos tercios para reformas constitucionales, buscando apoyo de Rodrigo Paz Pereira en
El candidato Jorge Tuto Quiroga durante su llegada al debate del TSE. APG / Unitel Digital

Arce admite que no entregará todas las obras antes de finalizar su mandato

El presidente boliviano Luis Arce reconoce que solo entregará 200 obras diarias hasta noviembre, en medio de una crisis
Luis Arce. Foto: Unitel Información de autor no disponible / ANF

Samuel y Tuto lideran encuesta electoral a 15 días de comicios

Doria Medina (24,5%) y Quiroga (22,9%) encabezan la intención de voto según encuesta de Spie Consulting, con un 25%
Samuel, Tuto y Rodrigo se encuentran en los tres primeros lugares Información de autor no disponible / ANF

Debate presidencial en Santa Cruz a dos semanas de elecciones

Ocho candidatos presidenciales debatieron propuestas sobre democracia, medioambiente y derechos humanos en un evento organizado por el TSE para
Debate presidencial organizado por el TSE Alianza Unidad / Unitel Digital

Candidatos intercambian apodos en debate presidencial boliviano

Eduardo Del Castillo (MAS) y Samuel Doria Medina (Unidad) protagonizaron un cruce de apodos y acusaciones durante el debate
Imagen sin título Información de autor no disponible / Unitel Digital

Tuto cuestiona a Andrónico por casos sin justicia en debate presidencial

Tuto Quiroga interpeló a Andrónico Rodríguez sobre casos emblemáticos sin resolver, como el Hotel Las Américas y los esposos
Imagen sin título Información de autor no disponible / Unitel Digital

Juez ordena prisión para Ramiro Cucho por conflicto en Llallagua

El líder evista Ramiro Cucho fue enviado a prisión preventiva por incumplir su arresto domiciliario y estar vinculado a
Dirigente evista, Ramiro Cucho. ARCHIVO-APG / ERBOL

Doria Medina acusa a Del Castillo de secuestrar a Camacho en debate

Samuel Doria Medina acusó a Eduardo Del Castillo de secuestrar a Luis Fernando Camacho durante el debate presidencial organizado
Eduardo Del Castillo (izquierda) y Samuel Doria Medina durante el debate Información de autor no disponible / Unitel Digital

Debate presidencial por detención de Evo Morales enfrenta a candidatos

Candidatos Reyes Villa y Aracena chocan en debate por estrategias opuestas para detener a Evo Morales: operativo militar vs.
Imagen sin título Información de autor no disponible / Unitel Digital