OpenAI memorizó contenido con derechos de autor, según estudio

Investigación revela que GPT-4 reproduce fragmentos de libros y artículos protegidos, reforzando demandas por uso no autorizado de obras en entrenamiento de IA.
TechCrunch
Manos robóticas escribiendo en una máquina de escribir con hojas de papel alrededor.
Ilustración que muestra un par de manos robóticas tecleando en una máquina de escribir azul bajo un fondo amarillo.

Estudio sugiere que modelos de OpenAI «memorizaron» contenido con derechos de autor

GPT-4 mostró signos de haber memorizado fragmentos de libros y artículos protegidos. Una investigación de tres universidades analizó cómo los modelos de IA reproducen datos de entrenamiento. El hallazgo refuerza las demandas contra OpenAI por uso no autorizado de obras.

«Palabras improbables» delatan la memorización

Investigadores de la Universidad de Washington, Copenhague y Stanford desarrollaron un método para detectar contenido memorizado. Se basan en términos estadísticamente improbables («alta sorpresa») dentro de un contexto, como «radar» en una frase cotidiana. Al enmascarar estas palabras, pidieron a los modelos de OpenAI que las completaran. Si acertaban, indicaría que los memorizaron durante su entrenamiento.

Resultados concretos

Las pruebas mostraron que GPT-4 reprodujo fragmentos de libros de ficción populares, incluidos algunos del conjunto de datos BookMIA (muestras de ebooks protegidos). También identificaron memorización de artículos de The New York Times, aunque en menor medida. «Esto revela datos polémicos en el entrenamiento», señaló Abhilasha Ravichander, coautora del estudio.

OpenAI entre demandas y lobby

La compañía enfrenta demandas de autores y programadores por usar sus obras sin permiso. OpenAI alega «uso legítimo», pero los demandantes argumentan que la ley estadounidense no contempla excepciones para datos de entrenamiento. Paralelamente, la empresa presiona para que se flexibilicen las normas sobre copyright en IA, aunque ofrece mecanismos para que los titulares excluyan sus contenidos.

Un debate que viene de lejos

Los modelos de IA generativa aprenden patrones de grandes volúmenes de datos, lo que en ocasiones deriva en réplicas literales. Casos previos incluyen imágenes basadas en fotogramas de películas o textos plagiados de noticias. La industria discute cómo equilibrar innovación y derechos de propiedad intelectual.

Transparencia, la asignatura pendiente

El estudio subraya la necesidad de auditar los modelos para garantizar su fiabilidad. Los investigadores reclaman mayor claridad sobre los datos de entrenamiento, mientras OpenAI mantiene su postura de limitar el acceso a esa información. El impacto legal de estos hallazgos podría definir el futuro del desarrollo de IA.

Candidatos bolivianos proponen reformar la Constitución en debate electoral

Cinco frentes políticos plantean cambios constitucionales durante el debate presidencial, desde reformas parciales hasta una nueva Asamblea Constituyente.
Debate presidencial organizado por el TSE APG Noticias / Unitel Digital

Nintendo Switch 2: rendimiento mejorado y diseño renovado

Nintendo presenta la Switch 2, una evolución de su consola híbrida con hardware potenciado y diseño actualizado, manteniendo su
Zuhause oder unterwegs: Mit der Switch 2 lässt sich überall daddeln. Información de autor no disponible / Frankfurter Allgemeine Zeitung (FAZ)

Rodrigo Paz propone flota aérea y bonos de carbono contra incendios

El candidato del PDC plantea generar $15.000 millones en 25 años con bonos verdes y una flota aérea antiincendios
Imagen sin título Información de autor no disponible / Unitel Digital

Falta de dólares paraliza helicópteros contra incendios en Tarija

El gobierno admite que los helicópteros para combatir incendios en Tarija están inoperativos por falta de repuestos, atribuyendo la
Imagen sin título Información de autor no disponible / Unitel Digital

Tuto Quiroga busca pacto de dos tercios para reformas en Bolivia

Jorge ‘Tuto’ Quiroga propone acuerdos parlamentarios con dos tercios para reformas constitucionales, buscando apoyo de Rodrigo Paz Pereira en
El candidato Jorge Tuto Quiroga durante su llegada al debate del TSE. APG / Unitel Digital

Arce admite que no entregará todas las obras antes de finalizar su mandato

El presidente boliviano Luis Arce reconoce que solo entregará 200 obras diarias hasta noviembre, en medio de una crisis
Luis Arce. Foto: Unitel Información de autor no disponible / ANF

Samuel y Tuto lideran encuesta electoral a 15 días de comicios

Doria Medina (24,5%) y Quiroga (22,9%) encabezan la intención de voto según encuesta de Spie Consulting, con un 25%
Samuel, Tuto y Rodrigo se encuentran en los tres primeros lugares Información de autor no disponible / ANF

Debate presidencial en Santa Cruz a dos semanas de elecciones

Ocho candidatos presidenciales debatieron propuestas sobre democracia, medioambiente y derechos humanos en un evento organizado por el TSE para
Debate presidencial organizado por el TSE Alianza Unidad / Unitel Digital

Candidatos intercambian apodos en debate presidencial boliviano

Eduardo Del Castillo (MAS) y Samuel Doria Medina (Unidad) protagonizaron un cruce de apodos y acusaciones durante el debate
Imagen sin título Información de autor no disponible / Unitel Digital

Tuto cuestiona a Andrónico por casos sin justicia en debate presidencial

Tuto Quiroga interpeló a Andrónico Rodríguez sobre casos emblemáticos sin resolver, como el Hotel Las Américas y los esposos
Imagen sin título Información de autor no disponible / Unitel Digital

Juez ordena prisión para Ramiro Cucho por conflicto en Llallagua

El líder evista Ramiro Cucho fue enviado a prisión preventiva por incumplir su arresto domiciliario y estar vinculado a
Dirigente evista, Ramiro Cucho. ARCHIVO-APG / ERBOL

Doria Medina acusa a Del Castillo de secuestrar a Camacho en debate

Samuel Doria Medina acusó a Eduardo Del Castillo de secuestrar a Luis Fernando Camacho durante el debate presidencial organizado
Eduardo Del Castillo (izquierda) y Samuel Doria Medina durante el debate Información de autor no disponible / Unitel Digital