OpenAI memorizó contenido con derechos de autor, según estudio

Investigación revela que GPT-4 reproduce fragmentos de libros y artículos protegidos, reforzando demandas por uso no autorizado de obras en entrenamiento de IA.
TechCrunch
Manos robóticas escribiendo en una máquina de escribir con hojas de papel alrededor.
Ilustración que muestra un par de manos robóticas tecleando en una máquina de escribir azul bajo un fondo amarillo.

Estudio sugiere que modelos de OpenAI «memorizaron» contenido con derechos de autor

GPT-4 mostró signos de haber memorizado fragmentos de libros y artículos protegidos. Una investigación de tres universidades analizó cómo los modelos de IA reproducen datos de entrenamiento. El hallazgo refuerza las demandas contra OpenAI por uso no autorizado de obras.

«Palabras improbables» delatan la memorización

Investigadores de la Universidad de Washington, Copenhague y Stanford desarrollaron un método para detectar contenido memorizado. Se basan en términos estadísticamente improbables («alta sorpresa») dentro de un contexto, como «radar» en una frase cotidiana. Al enmascarar estas palabras, pidieron a los modelos de OpenAI que las completaran. Si acertaban, indicaría que los memorizaron durante su entrenamiento.

Resultados concretos

Las pruebas mostraron que GPT-4 reprodujo fragmentos de libros de ficción populares, incluidos algunos del conjunto de datos BookMIA (muestras de ebooks protegidos). También identificaron memorización de artículos de The New York Times, aunque en menor medida. «Esto revela datos polémicos en el entrenamiento», señaló Abhilasha Ravichander, coautora del estudio.

OpenAI entre demandas y lobby

La compañía enfrenta demandas de autores y programadores por usar sus obras sin permiso. OpenAI alega «uso legítimo», pero los demandantes argumentan que la ley estadounidense no contempla excepciones para datos de entrenamiento. Paralelamente, la empresa presiona para que se flexibilicen las normas sobre copyright en IA, aunque ofrece mecanismos para que los titulares excluyan sus contenidos.

Un debate que viene de lejos

Los modelos de IA generativa aprenden patrones de grandes volúmenes de datos, lo que en ocasiones deriva en réplicas literales. Casos previos incluyen imágenes basadas en fotogramas de películas o textos plagiados de noticias. La industria discute cómo equilibrar innovación y derechos de propiedad intelectual.

Transparencia, la asignatura pendiente

El estudio subraya la necesidad de auditar los modelos para garantizar su fiabilidad. Los investigadores reclaman mayor claridad sobre los datos de entrenamiento, mientras OpenAI mantiene su postura de limitar el acceso a esa información. El impacto legal de estos hallazgos podría definir el futuro del desarrollo de IA.

Lara convoca una concentración en La Paz que genera críticas políticas

El vicepresidente electo David Lara convoca una concentración separada de Rodrigo Paz el 8 de noviembre. Tres diputados interpretan
Rodrigo Paz (i) y Edmand Lara durante la campaña electoral.

Boric asistirá a la toma de posesión de Paz para impulsar relaciones Chile-Bolivia

El presidente chileno Gabriel Boric asistirá a la toma de posesión de Rodrigo Paz en Bolivia. Analistas interpretan este
El presidente electo de Bolivia, Rodrigo Paz, y el mandatario de Chile, Gabriel Boric

Presidente electo boliviano se reúne con mandatario panameño

El presidente electo de Bolivia, Rodrigo Paz, se reunió con el mandatario panameño José Raúl Mulino. El encuentro, en
El presidente electo de Bolivia, Rodrigo Paz (d),se reunió con el mandatario panameño José Raúl Mulino (i).

Hallan mujer estrangulada en Santa Cruz; su pareja es el principal sospechoso

Eleuteria José fue hallada sin vida estrangulada en su domicilio del barrio Comarapa, Santa Cruz. La Fiscalía aprehendió a
Imagen sin título

Trump suspende programa alimentario SNAP afectando a millones

La parálisis presupuestaria suspende el programa SNAP, dejando sin ayuda alimentaria a 40 millones de personas. Beneficiarios y bancos
Eric Dunham, padre de dos adolescentes y con una discapacidad, necesita de la ayuda alimenticia federal.

Presidente electo boliviano se reúne con Mulino en Panamá para fortalecer lazos

Los presidentes Rodrigo Paz de Bolivia y José Raúl Mulino de Panamá acordaron iniciar una nueva etapa de entendimiento
El encuentro de José Raúl Mulino y Rodrigo Paz

Arce dirige su último gabinete y Paz recibe credencial en Sucre

El presidente Luis Arce celebra su última sesión de gabinete mientras el presidente electo Rodrigo Paz recibe su credencial
Frontis del Museo Casa de la Libertad en Sucre.

Perú rompe relaciones diplomáticas con México por asilo a exministra

Perú rompe relaciones diplomáticas con México tras conceder asilo a la ex primera ministra Betssy Chávez, procesada por el
Mirtha Esther Vásquez, Pedro Castillo y Betsy Chávez en octubre de 2021.

Mujer es estrangulada por su pareja en Santa Cruz de la Sierra

El cuerpo sin vida de Elouteria José fue hallado en su domicilio del barrio Comarapa, zona sur de Santa
Imagen sin título

Diputado Zegarra niega transfugio político y reafirma lealtad a Alianza Libre

El diputado electo Edgar Zegarra desmiente rotundamente su salida de Alianza Libre. Aclara que sus críticas internas son ejercicio
El diputado Edgar Zegarra junto a Tuto Quiroga.

Dunn insta a declarar al narcotráfico como actividad «terrorista» en Bolivia

El excandidato presidencial Jaime Dunn insta a declarar el narcotráfico como «terrorismo de Estado» en Bolivia. Argumenta que es
Imagen sin título

Senamhi emite alerta naranja por vientos fuertes en Santa Cruz

El Senamhi activó una alerta naranja por vientos de 60 a 90 km/h desde el 4 hasta la mañana
Imagen sin título