OpenAI implementa sistema de seguridad contra riesgos biológicos

OpenAI ha desarrollado un sistema para bloquear consultas peligrosas en sus modelos O3 y O4-mini, con un 98.7% de efectividad en pruebas.
TechCrunch
Un teléfono móvil colocado sobre un teclado de ordenador con una pantalla que muestra un logotipo circular.
Una imagen de un teléfono móvil con pantalla encendida y colocada sobre un teclado portátil iluminado.

OpenAI implementa un sistema de seguridad para evitar riesgos biológicos en sus nuevos modelos

La compañía monitoriza los modelos O3 y O4-mini para bloquear consultas sobre amenazas biológicas o químicas. El sistema, probado durante 1.000 horas, rechaza el 98.7% de solicitudes peligrosas. OpenAI reconoce que el riesgo aumenta con las capacidades mejoradas de sus últimas IA.

«Un monitor de seguridad para razonar sobre políticas de contenido»

OpenAI detalla que el nuevo sistema funciona como una capa adicional sobre O3 y O4-mini, entrenada específicamente para identificar y bloquear consultas relacionadas con la creación de armas biológicas o químicas. «Estos modelos tienen mayor capacidad que sus predecesores, lo que exige medidas más robustas», explica la empresa en su informe de seguridad.

Pruebas y limitaciones

Durante las pruebas, equipos especializados («red teamers») simularon conversaciones de riesgo, logrando que los modelos rechazaran respuestas peligrosas en el 98.7% de los casos. Sin embargo, OpenAI admite que el sistema no prevé intentos reiterados con nuevas consultas, por lo que mantendrá supervisión humana.

De GPT-4 a O3: un salto en capacidades (y riesgos)

Según OpenAI, las versiones iniciales de O3 mostraron mayor habilidad para responder preguntas sobre armas biológicas en comparación con GPT-4. Aunque no superan el umbral de «alto riesgo», la compañía actualizó su «Marco de Preparación» para rastrear posibles usos malintencionados.

Críticas y omisiones

Algunos investigadores, como el equipo de Metr, critican la falta de tiempo para evaluar completamente O3 en pruebas de comportamiento engañoso. Además, OpenAI no publicó un informe de seguridad para GPT-4.1, lanzado esta misma semana.

Automatización vs. supervisión humana

OpenAI está priorizando sistemas automatizados para mitigar riesgos, como el monitor que evita la generación de material de abuso infantil en GPT-4o. No obstante, la compañía insiste en combinar estas herramientas con intervención humana, especialmente en áreas sensibles.

IA más potente, controles más estrictos

El avance de los modelos de OpenAI exige medidas de seguridad proporcionales. Aunque el nuevo monitor reduce riesgos, su eficacia a largo plazo dependerá de la evolución de las IA y las tácticas de usuarios malintencionados.

Arturo Murillo recibe cuarta detención preventiva en cárcel de San Pedro

El exministro de Jeanine Añez recibe su cuarta detención preventiva sin plazo definido por legitimación de ganancias ilícitas.
Arturo Murillo, tras su aprehensión en el aeropuerto de Viru Viru. / Información de autor no disponible / ERBOL

desesperanza en cuba por apagones, falta de agua y acumulación de basura

Más de 248.000 personas en La Habana sufren cortes prolongados de agua y electricidad, con grave acumulación de basura
Un grupo de personas recolectando agua en La Habana (Cuba). / EFE Laura Becquer / EFE

Comités cívicos exigen nuevo Pacto Fiscal con reparto 50% para regiones

Comités cívicos de siete regiones exigen un nuevo Pacto Fiscal con distribución equitativa del 50% de recursos para gobiernos
Encuentro nacional de Comités Cívicos / RRSS / Diario Correo del Sur

Alexander Mendoza es posesionado como nuevo fiscal de Beni

El fiscal general Roger Mariaca designa a Alexander Mendoza como nuevo fiscal de Beni, tras las amenazas de muerte
Imagen sin título / Información de autor no disponible / URGENTE.BO

Protestas en Machu Picchu dejan 17 heridos y 1.500 turistas varados

Bloqueo ferroviario por protestas en Machu Picchu deja 17 heridos y afecta a 1.500 turistas, interrumpiendo el acceso al
Turistas esperan en la estación de tren debido al bloqueo de las vías. / EFE / Clarín

Gobierno atribuye al Legislativo retraso en actualizar lista de sustancias controladas

El Gobierno boliviano atribuye al Legislativo el retraso en la lista de sustancias controladas, respondiendo al informe de EEUU.
El viceministro Jhonny Aguilera durante una conferencia de prensa. / APG / Diario Correo del Sur

TSE muestra papeleta electoral para el balotaje del 19 de octubre

El TSE presenta la nueva papeleta para el balotaje del 19 de octubre, más pequeña y fácil de manejar,
Papeleta electoral que se utilizará en el Balotaje, el 19 de octubre. / Información de autor no disponible / URGENTE.BO

voluntarios extraen una tonelada de basura de la laguna guapilo en santa cruz

Más de cien voluntarios extrajeron una tonelada de residuos de este humedal urbano crucial para la biodiversidad y prevención
trabajo de voluntarios en la laguna guapilo / Información de autor no disponible / EL DEBER

asambleísta cruceño apela al tcp por disputa territorial de piso firme

El asambleísta Hugo Valverde recurre al Tribunal Constitucional para resolver la disputa de la comunidad Piso Firme entre Santa
Imagen sin título / Miguel Surubí / EL DEBER

Trump inicia segunda visita de Estado a Gran Bretaña entre protestas y máxima seguridad

Trump viaja al Reino Unido para tratar aranceles comerciales y el apoyo a Ucrania en una visita de Estado
El presidente Donald Trump y la primera dama Melania Trump salen del Air Force One en el aeropuerto de Stansted. / AP / Clarín

Bolsonaro internado de urgencia durante su prisión domiciliaria

El expresidente brasileño fue trasladado de urgencia al hospital desde su prisión domiciliaria por una crisis de hipo, vómitos
Jair Bolsonaro en arresto domiciliario / Reuters/ Adriano Machado / Clarín

trabajadores de salud de santa cruz levantan paro y normalizan atencion

El sistema público de salud de Santa Cruz reanuda la atención tras un paro de 24 horas por impago
pacientes de salud / Juan Carlos Torrejon / EL DEBER