OpenAI reconoce aumento de alucinaciones en sus nuevos modelos

Los modelos o3 y o4-mini de OpenAI generan hasta un 48% de respuestas falsas, según pruebas internas y análisis independientes publicados recientemente.
TechCrunch
Diseño abstracto de un patrón blanco y negro con efecto de distorsión en el centro.
Un diseño abstracto que presenta un patrón repetido, destacando un elemento más nítido en el centro con un efecto de distorsión en tonos azules y rojos.

Los nuevos modelos de razonamiento de OpenAI aumentan las alucinaciones

Los modelos o3 y o4-mini generan más respuestas falsas que versiones anteriores. OpenAI reconoce no entender las causas del retroceso en un problema clave de la IA. Los datos surgen de pruebas internas y análisis externos publicados este 18 de abril.

«Un paso atrás en la batalla contra los errores»

Según los tests de OpenAI, o3 inventó respuestas en el 33% de las preguntas en PersonQA, su benchmark interno, duplicando la tasa de modelos anteriores como o1 (16%). El o4-mini empeoró aún más, con un 48% de alucinaciones. «Es un retroceso inesperado», admite el informe técnico de la compañía.

Hallazgos preocupantes

El laboratorio independiente Transluce detectó que o3 inventa acciones falsas, como afirmar que ejecutó código en un MacBook externo, capacidad que no posee. Neil Chowdhury, investigador de Transluce, sugiere que «el aprendizaje por refuerzo en estos modelos amplifica errores que otros sistemas mitigaban».

Luces y sombras

Aunque los modelos mejoran en tareas de programación y matemáticas, su mayor volumen de afirmaciones incrementa también los errores. Kian Katanforoosh, CEO de Workera, confirma que o3 destaca en flujos de codificación, pero «genera enlaces rotos con frecuencia», un problema para usos profesionales.

El dilema de la precisión frente a la creatividad

Las alucinaciones, aunque útiles para ideas innovadoras, limitan su aplicación en sectores como el legal o médico. OpenAI explora integrar búsqueda web para mejorar la exactitud, como ya hace GPT-4o, que alcanza un 90% de precisión en SimpleQA.

La carrera por dominar el razonamiento

La industria prioriza los modelos de razonamiento ante el estancamiento de las IA tradicionales. Estos requieren menos recursos de entrenamiento y mejoran múltiples tareas, pero el avance en o3 y o4-mini revela un efecto secundario: más invenciones falsas.

Un problema que no espera

OpenAI afirma trabajar en soluciones, pero el retroceso en sus últimos lanzamientos complica la adopción empresarial. La eficacia de futuros modelos dependerá de equilibrar razonamiento y fiabilidad, un desafío técnico aún sin respuesta.

La Justicia cierra definitivamente el ‘Caso Decretazo’ contra el gobernador Camacho

La Sala Penal Tercera cerró el ‘caso Decretazo’ contra el gobernador Luis Fernando Camacho. Declaró inadmisible la apelación de
Luis Fernando Camacho, gobernador de Santa Cruz

Ex pareja mata al novio actual e hiere de gravedad a una mujer en Montero

Un hombre asesinó al nuevo novio de su expareja y la hirió gravemente en Montero. El agresor, en estado
Imagen sin título

Senamhi declara alerta naranja por riesgo de desbordes en ríos de tres departamentos

El SENAMHI declara alerta naranja por posible desborde de ríos en tres departamentos. Los caudales de los ríos Yapacaní,
Río Piraí en Santa Cruz durante la temporada de lluvias

ONU y periodistas bolivianos exigen frenar la impunidad de crímenes contra la prensa

La ONU denuncia que casi el 90% de los asesinatos de periodistas a nivel global quedan impunes. En Bolivia,
Imagen sin título

Viceministro vincula asesinato en Cochabamba al narcotráfico

El viceministro de Régimen Interior confirmó que la víctima de un asesinato en el Trópico de Cochabamba pertenecía a
Captura del video del asesinato

Policía identifica a acribillado en Entre Ríos como miembro de red criminal

La Policía identificó a la víctima de un homicidio en Entre Ríos como integrante de la banda de Ariel
Imagen sin título

Pescadores venezolanos afectados por despliegue naval de EEUU en el Caribe

Los ataques navales de EE.UU. en el Caribe han paralizado la economía en Güiria, donde el comercio con Trinidad
Botes navegando en Cumaná, Venezuela

Hamas entrega tres cuerpos de rehenes a la Cruz Roja en Gaza

La Cruz Roja ha transferido tres cuerpos de rehenes de Hamas al ejército israelí, encontrados en un túnel de
La Cruz Roja transporta el cuerpo de un rehén fallecido retenido en Gaza

Candidato chileno propone minar la frontera con Bolivia contra migración ilegal

El candidato a diputado Sebastián Huerta propone minar la frontera con Bolivia para frenar migración ilegal. La medida viola
Imagen sin título

Lluvias y vientos causan caída de árboles y daños en Santa Cruz

Intensas lluvias y vientos superiores a 80 km/h derribaron cinco árboles en Santa Cruz, causando una herida leve y
Imagen sin título

Expareja ataca a mujer y mata a su novio en mercado de Montero

Un hombre asesinó a su expareja y apuñaló a su nueva pareja en un mercado de Montero, Santa Cruz.
La mujer herida en su cama de hospital

Gabinete de Arce presenta renuncia colectiva antes de traspaso de poder

El gabinete de Luis Arce presenta su renuncia colectiva el 5 de noviembre, facilitando la transición al gobierno de
Rodrigo Paz saludando a Luis Arce