Pantalla de computadora con porcentajes en diferentes filas y colores.
Actualizado hace 2 semanas
Analizar 12 modelos avanzados duplica el gasto frente a 80 convencionales. OpenAI y Anthropic lideran esta tendencia, donde pruebas como MMLU-Pro superan los 1.800 dólares por ejecución….
Pantalla de un dispositivo móvil con la palabra 'LLama' frente a un fondo desenfocado con texto.
Actualizado hace 2 semanas
Meta cayó al puesto 32 en LM Arena al evaluarse su modelo oficial Llama 4, tras críticas por usar una versión experimental optimizada para benchmarks….
Símbolo azul sobre fondo con logotipos pequeños en varios colores.
Actualizado hace 3 semanas
El vicepresidente de IA generativa de Meta desmiente rumores sobre ajustes en benchmarks de sus modelos Maverick y Scout….
Cargando más noticias