OpenAI reconoce aumento de alucinaciones en sus nuevos modelos

Los modelos o3 y o4-mini de OpenAI generan hasta un 48% de respuestas falsas, según pruebas internas y análisis independientes publicados recientemente.
TechCrunch
Diseño abstracto de un patrón blanco y negro con efecto de distorsión en el centro.
Un diseño abstracto que presenta un patrón repetido, destacando un elemento más nítido en el centro con un efecto de distorsión en tonos azules y rojos.

Los nuevos modelos de razonamiento de OpenAI aumentan las alucinaciones

Los modelos o3 y o4-mini generan más respuestas falsas que versiones anteriores. OpenAI reconoce no entender las causas del retroceso en un problema clave de la IA. Los datos surgen de pruebas internas y análisis externos publicados este 18 de abril.

«Un paso atrás en la batalla contra los errores»

Según los tests de OpenAI, o3 inventó respuestas en el 33% de las preguntas en PersonQA, su benchmark interno, duplicando la tasa de modelos anteriores como o1 (16%). El o4-mini empeoró aún más, con un 48% de alucinaciones. «Es un retroceso inesperado», admite el informe técnico de la compañía.

Hallazgos preocupantes

El laboratorio independiente Transluce detectó que o3 inventa acciones falsas, como afirmar que ejecutó código en un MacBook externo, capacidad que no posee. Neil Chowdhury, investigador de Transluce, sugiere que «el aprendizaje por refuerzo en estos modelos amplifica errores que otros sistemas mitigaban».

Luces y sombras

Aunque los modelos mejoran en tareas de programación y matemáticas, su mayor volumen de afirmaciones incrementa también los errores. Kian Katanforoosh, CEO de Workera, confirma que o3 destaca en flujos de codificación, pero «genera enlaces rotos con frecuencia», un problema para usos profesionales.

El dilema de la precisión frente a la creatividad

Las alucinaciones, aunque útiles para ideas innovadoras, limitan su aplicación en sectores como el legal o médico. OpenAI explora integrar búsqueda web para mejorar la exactitud, como ya hace GPT-4o, que alcanza un 90% de precisión en SimpleQA.

La carrera por dominar el razonamiento

La industria prioriza los modelos de razonamiento ante el estancamiento de las IA tradicionales. Estos requieren menos recursos de entrenamiento y mejoran múltiples tareas, pero el avance en o3 y o4-mini revela un efecto secundario: más invenciones falsas.

Un problema que no espera

OpenAI afirma trabajar en soluciones, pero el retroceso en sus últimos lanzamientos complica la adopción empresarial. La eficacia de futuros modelos dependerá de equilibrar razonamiento y fiabilidad, un desafío técnico aún sin respuesta.

Debate presidencial en Bolivia ignora crisis ambiental y extractivismo

Analistas critican la falta de propuestas concretas contra el extractivismo y los ataques personales en el debate de candidatos
Ocho candidatos asistieron al debate presidencial organizado por el TSE. Información de autor no disponible / ANF

Candidato propone recortar gastos para financiar Renta Dignidad

José Luis Lupo, candidato a vicepresidencia, plantea ahorrar 2.483 millones de bolivianos reduciendo gastos estatales para garantizar el pago
José Luis Lupo, candidato a la vicepresidencia por Alianza Unidad. Información de autor no disponible / Información de la fuente de la imagen no disponible

Musef presenta libro y animaciones sobre cultura indígena en FIL La Paz

El MUSEF exhibe relatos animados y un libro sobre el agua basados en saberes ancestrales indígenas, en el marco
Afiche promocional de la presentación de 20 memorias animadas es la oferta del Musef en la FIL La Paz. Información de autor no disponible / ABI

Incendio en serranía de Sama consume más de 1.500 hectáreas

Un incendio originado por quema de basura ha afectado más de 1.500 hectáreas en la serranía de Sama, superando
Bomberos, militares y voluntarios trabajan para mitigar los incendios. Información de autor no disponible / ANF

Asamblea Legislativa paralizada por campaña electoral y actos protocolares

30 legisladores buscan reelección mientras cobran sueldos públicos y paralizan sesiones clave, incluyendo la aprobación de un crédito japonés.
La ALP fue cuestionada por sus sesiones bochornosas y poca productividad. Información de autor no disponible / ANF

Morena inaugura casa de campaña en El Alto para elecciones 2026

El Movimiento de Renovación Nacional (MORENA) abre su primera sede en El Alto, tras retirar su candidatura presidencial para
Inscripción de militantes para Morena en El Alto ERBOL / URGENTE.BO

Decomiso de contrabando en frontera de Tarija por Bs. 25.800

Las Fuerzas Armadas decomisaron 200 cajas de tomate, hoja de coca y otros productos en operativos realizados en Bermejo.
Se comisaron 200 cajas de tomate en Tarija Información de autor no disponible / ELDEBER.com.bo

TSE evalúa adelantar segundo debate presidencial en Bolivia

El Tribunal Supremo Electoral estudia cambiar la fecha del segundo debate presidencial, previsto para el 12 de agosto, tras
Candidatos en el debate presidencial, realizado este viernes. APG / URGENTE.BO

Incendio en carpintería cerca del Cambódromo en Santa Cruz

Un voraz incendio consumió una carpintería cerca del Cambódromo en Santa Cruz, posiblemente iniciado por una quema de vegetación.
Bomberos se movilizaron para intentar controlar el incendio Marcela Gutiérrez / UNITEL

Control de incendio en Sama previsto hasta el lunes

Más de 300 efectivos combaten el incendio forestal en Tarija, considerado el peor de su historia. Autoridades esperan control
Imagen sin título Información de autor no disponible / Urgente.bo

Muere hombre quemado en incendio forestal de Tarija

Juan Pari falleció con el 90% de su cuerpo quemado en un incendio descontrolado en la serranía de Sama,
Imagen sin título Información de autor no disponible / CORREO DEL SUR, Unitel, Hola Bolivia

Arresto domiciliario para exministro Siles por caso consorcio judicial

El exministro de Justicia César Siles enfrenta arresto domiciliario y una fianza de 50.000 bolivianos por su presunta vinculación
Imagen sin título Información de autor no disponible / urgente.bo