DeepSeek lanza modelo de IA R1 optimizado para una GPU

DeepSeek presenta su modelo R1 optimizado para funcionar con una sola GPU, superando a competidores en pruebas matemáticas y disponible para uso comercial.
TechCrunch
Pantalla de un dispositivo móvil mostrando una aplicación con un icono de ballena.
Pantalla de inicio de una aplicación visualizada en un dispositivo móvil con indicador de batería completa y señal de wifi.

DeepSeek lanza modelo de IA R1 optimizado para una sola GPU

El nuevo DeepSeek-R1-0528-Qwen3-8B supera a modelos similares en pruebas matemáticas. La versión reducida del modelo chino funciona con menos recursos y está disponible para uso comercial. Fue presentado el 29 de mayo de 2025.

«Un salto en eficiencia sin sacrificar rendimiento»

DeepSeek, laboratorio chino de IA, ha desarrollado este modelo «destilado» a partir de su R1 original. Supera a Google Gemini 2.5 Flash en el test AIME 2025 y se acerca al rendimiento de Microsoft Phi 4 en HMMT, dos benchmarks matemáticos. «Combina investigación académica y aplicaciones industriales», según su ficha técnica en Hugging Face.

Ventajas técnicas

Mientras el R1 completo necesita 12 GPUs de 80GB, esta versión funciona con una sola GPU de 40GB-80GB (como la Nvidia H100). Se entrenó usando textos generados por el R1 original para ajustar Qwen3-8B, modelo base de Alibaba lanzado en mayo.

Accesibilidad y licencia

Distribuido bajo licencia MIT, permite uso comercial sin restricciones. Plataformas como LM Studio ya ofrecen acceso mediante API.

La carrera por la IA ligera

La industria busca modelos más eficientes ante los altos costes computacionales. DeepSeek compite con gigantes como Google y Microsoft en este segmento, priorizando escalabilidad.

Un paso hacia la democratización

El modelo acerca capacidades avanzadas de razonamiento a entornos con recursos limitados. Su adopción dependerá de cómo equilibre rendimiento y accesibilidad en aplicaciones reales.