Google lanza Gemini 2.5, su familia de modelos de IA con razonamiento avanzado
La nueva versión supera a competidores en pruebas de codificación y multimodalidad. Presentado hoy, el modelo estará disponible para desarrolladores y suscriptores de Gemini Advanced. La compañía busca competir con OpenAI y otros líderes del sector.
\»Pensar antes de responder\»: el salto cualitativo de Gemini 2.5
Google anunció este martes Gemini 2.5 Pro Experimental, un modelo multimodal que \»pausa para razonar\» antes de generar respuestas. Según la compañía, es su \»modelo más inteligente hasta la fecha\», diseñado para destacar en creación de aplicaciones web y tareas de codificación agentiva. Estará accesible en Google AI Studio y en la app Gemini para suscriptores de Gemini Advanced (20 dólares mensuales).
Rendimiento en benchmarks
En pruebas comparativas, Gemini 2.5 Pro logró un 68.6% en Aider Polyglot (edición de código), superando a modelos de OpenAI, Anthropic y DeepSeek. Sin embargo, en SWE-bench Verified (desarrollo de software), obtuvo 63.8%, por debajo del Claude 3.7 Sonnet de Anthropic (70.3%). En el examen multimodal Humanity’s Last Exam, alcanzó 18.8%, superando a la mayoría de competidores.
Capacidad de procesamiento récord
El modelo incluye inicialmente una ventana de contexto de 1 millón de tokens (equivalente a 750.000 palabras), con planes de ampliarla a 2 millones pronto. Google no reveló precios para su API, prometiendo detalles en semanas próximas.
Antecedentes
La industria aceleró el desarrollo de modelos con razonamiento tras el lanzamiento de o1 por OpenAI en septiembre de 2024. Google ya había probado esta tecnología en diciembre pasado, pero Gemini 2.5 representa su apuesta definitiva para superar a la serie \»o\» de OpenAI. Estos modelos consumen más recursos pero mejoran precisión en matemáticas, codificación y verificación de hechos.
Cierre
La incorporación de razonamiento en IA marca un paso hacia sistemas autónomos más confiables. El despliegue de Gemini 2.5 podría redefinir el equilibrio competitivo entre los principales actores tecnológicos.