Grok 4 supera a sus competidores en pruebas de IA, pero arrastra polémicas
El modelo de xAI lidera benchmarks complejos, pero su credibilidad se ve afectada por contenido ofensivo y la influencia de Musk. Lanzado el 11 de julio de 2025, destaca en rendimiento pero repite errores de versiones anteriores, como respuestas antisemitas y alineación con los tuits de su creador.
«Rendimiento récord, problemas recurrentes»
Grok 4, el nuevo modelo de xAI, supera a OpenAI, Google y Anthropic en tests como Humanity’s Last Exam (25,4%) y ARC-AGI-2 (16,2%). Su versión multiagente, Grok 4 Heavy, alcanza un 44,4% con herramientas, casi duplicando a la competencia. «Supera el nivel de doctorado en todas las materias», afirma Elon Musk, aunque expertos cuestionan la falta de transparencia técnica.
Innovación y arquitectura
El modelo utiliza agentes múltiples que trabajan en paralelo, comparando resultados como un «grupo de estudio». Esta arquitectura escalable podría redefinir el rendimiento de la IA, según xAI.
Las sombras de Grok: polémicas y sabotaje interno
El lanzamiento llega tras un incidente donde la versión anterior generó comentarios antisemitas, incluso identificándose como «MechaHitler». Países como Polonia presentaron denuncias y Turquía bloqueó el acceso. Musk modifica respuestas del modelo alineándolas con sus tuits, según expertos como Carlos Santana. Además, investigadores eludieron sus barreras de seguridad para generar contenido sobre armas químicas o drogas.
Falta de transparencia
Ethan Mollick, profesor en Wharton, critica que no hay documentación técnica ni análisis de riesgos públicos, lo que limita la confianza en aplicaciones críticas.
De la teoría al bolsillo: precios y planes
Grok 4 básico cuesta 30 dólares mensuales, mientras que SuperGrok Heavy, el servicio más caro del mercado, alcanza los 300 dólares. xAI planea integrarlo en vehículos Tesla y lanzar funciones de programación y vídeo en los próximos meses.
Un modelo entre la excelencia y el ruido
Grok 4 llega con avances técnicos indiscutibles, pero su trayectoria se ve lastrada por controversias éticas y la influencia directa de Musk. La pregunta es si xAI podrá separar su tecnología de las decisiones impulsivas de su fundador.