| Inteligencia Artificial | Privacidad y seguridad |

OpenAI implementa sistema de seguridad contra riesgos biológicos

TechCrunch

OpenAI's latest AI models have a new safeguard to prevent biorisks | TechCrunch
Maxwell Zeff
TechCrunch
inglés
Estados Unidos
en-US
Publicado el: 1744878187
1744878187
2025-04-17T08:23:07Z
2025-04-16T21:12:28Z
2025-04-16T21:52:14Z
https://techcrunch.com/2025/04/16/openais-latest-ai-models-have-a-new-safeguard-to-prevent-biorisks

OpenAI ha desarrollado un sistema para bloquear consultas peligrosas en sus modelos O3 y O4-mini, con un 98.7% de efectividad en pruebas.

OpenAI implementa un sistema de seguridad para evitar riesgos biológicos en sus nuevos modelos

La compañía monitoriza los modelos O3 y O4-mini para bloquear consultas sobre amenazas biológicas o químicas. El sistema, probado durante 1.000 horas, rechaza el 98.7% de solicitudes peligrosas. OpenAI reconoce que el riesgo aumenta con las capacidades mejoradas de sus últimas IA.

«Un monitor de seguridad para razonar sobre políticas de contenido»

OpenAI detalla que el nuevo sistema funciona como una capa adicional sobre O3 y O4-mini, entrenada específicamente para identificar y bloquear consultas relacionadas con la creación de armas biológicas o químicas. «Estos modelos tienen mayor capacidad que sus predecesores, lo que exige medidas más robustas», explica la empresa en su informe de seguridad.

Pruebas y limitaciones

Durante las pruebas, equipos especializados («red teamers») simularon conversaciones de riesgo, logrando que los modelos rechazaran respuestas peligrosas en el 98.7% de los casos. Sin embargo, OpenAI admite que el sistema no prevé intentos reiterados con nuevas consultas, por lo que mantendrá supervisión humana.

De GPT-4 a O3: un salto en capacidades (y riesgos)

Según OpenAI, las versiones iniciales de O3 mostraron mayor habilidad para responder preguntas sobre armas biológicas en comparación con GPT-4. Aunque no superan el umbral de «alto riesgo», la compañía actualizó su «Marco de Preparación» para rastrear posibles usos malintencionados.

Críticas y omisiones

Algunos investigadores, como el equipo de Metr, critican la falta de tiempo para evaluar completamente O3 en pruebas de comportamiento engañoso. Además, OpenAI no publicó un informe de seguridad para GPT-4.1, lanzado esta misma semana.

Automatización vs. supervisión humana

OpenAI está priorizando sistemas automatizados para mitigar riesgos, como el monitor que evita la generación de material de abuso infantil en GPT-4o. No obstante, la compañía insiste en combinar estas herramientas con intervención humana, especialmente en áreas sensibles.

IA más potente, controles más estrictos

El avance de los modelos de OpenAI exige medidas de seguridad proporcionales. Aunque el nuevo monitor reduce riesgos, su eficacia a largo plazo dependerá de la evolución de las IA y las tácticas de usuarios malintencionados.

Post Views: 44

|Inteligencia Artificial| OpenAI| Seguridad en IA|

| Corrupción y Ética |

septiembre 16, 2025

Arturo Murillo recibe cuarta detención preventiva en cárcel de San Pedro

El exministro de Jeanine Añez recibe su cuarta detención preventiva sin plazo definido por legitimación de ganancias ilícitas.

| Mundo |

septiembre 16, 2025

desesperanza en cuba por apagones, falta de agua y acumulación de basura

Más de 248.000 personas en La Habana sufren cortes prolongados de agua y electricidad, con grave acumulación de basura

| Economía |

septiembre 16, 2025

Comités cívicos exigen nuevo Pacto Fiscal con reparto 50% para regiones

Comités cívicos de siete regiones exigen un nuevo Pacto Fiscal con distribución equitativa del 50% de recursos para gobiernos

| Política |

septiembre 16, 2025

Alexander Mendoza es posesionado como nuevo fiscal de Beni

El fiscal general Roger Mariaca designa a Alexander Mendoza como nuevo fiscal de Beni, tras las amenazas de muerte

| Mundo |

septiembre 16, 2025

Protestas en Machu Picchu dejan 17 heridos y 1.500 turistas varados

Bloqueo ferroviario por protestas en Machu Picchu deja 17 heridos y afecta a 1.500 turistas, interrumpiendo el acceso al

| Política |

septiembre 16, 2025

Gobierno atribuye al Legislativo retraso en actualizar lista de sustancias controladas

El Gobierno boliviano atribuye al Legislativo el retraso en la lista de sustancias controladas, respondiendo al informe de EEUU.

| Política |

septiembre 16, 2025

TSE muestra papeleta electoral para el balotaje del 19 de octubre

El TSE presenta la nueva papeleta para el balotaje del 19 de octubre, más pequeña y fácil de manejar,

| Medio ambiente |

septiembre 16, 2025

voluntarios extraen una tonelada de basura de la laguna guapilo en santa cruz

Más de cien voluntarios extrajeron una tonelada de residuos de este humedal urbano crucial para la biodiversidad y prevención

| Política |

septiembre 16, 2025

asambleísta cruceño apela al tcp por disputa territorial de piso firme

El asambleísta Hugo Valverde recurre al Tribunal Constitucional para resolver la disputa de la comunidad Piso Firme entre Santa

| Mundo |

septiembre 16, 2025

Trump inicia segunda visita de Estado a Gran Bretaña entre protestas y máxima seguridad

Trump viaja al Reino Unido para tratar aranceles comerciales y el apoyo a Ucrania en una visita de Estado

| Mundo |

septiembre 16, 2025

Bolsonaro internado de urgencia durante su prisión domiciliaria

El expresidente brasileño fue trasladado de urgencia al hospital desde su prisión domiciliaria por una crisis de hipo, vómitos

| Salud |

septiembre 16, 2025

trabajadores de salud de santa cruz levantan paro y normalizan atencion

El sistema público de salud de Santa Cruz reanuda la atención tras un paro de 24 horas por impago