OpenAI memorizó contenido con derechos de autor, según estudio

Investigación revela que GPT-4 reproduce fragmentos de libros y artículos protegidos, reforzando demandas por uso no autorizado de obras en entrenamiento de IA.
TechCrunch
Manos robóticas escribiendo en una máquina de escribir con hojas de papel alrededor.
Ilustración que muestra un par de manos robóticas tecleando en una máquina de escribir azul bajo un fondo amarillo.

Estudio sugiere que modelos de OpenAI «memorizaron» contenido con derechos de autor

GPT-4 mostró signos de haber memorizado fragmentos de libros y artículos protegidos. Una investigación de tres universidades analizó cómo los modelos de IA reproducen datos de entrenamiento. El hallazgo refuerza las demandas contra OpenAI por uso no autorizado de obras.

«Palabras improbables» delatan la memorización

Investigadores de la Universidad de Washington, Copenhague y Stanford desarrollaron un método para detectar contenido memorizado. Se basan en términos estadísticamente improbables («alta sorpresa») dentro de un contexto, como «radar» en una frase cotidiana. Al enmascarar estas palabras, pidieron a los modelos de OpenAI que las completaran. Si acertaban, indicaría que los memorizaron durante su entrenamiento.

Resultados concretos

Las pruebas mostraron que GPT-4 reprodujo fragmentos de libros de ficción populares, incluidos algunos del conjunto de datos BookMIA (muestras de ebooks protegidos). También identificaron memorización de artículos de The New York Times, aunque en menor medida. «Esto revela datos polémicos en el entrenamiento», señaló Abhilasha Ravichander, coautora del estudio.

OpenAI entre demandas y lobby

La compañía enfrenta demandas de autores y programadores por usar sus obras sin permiso. OpenAI alega «uso legítimo», pero los demandantes argumentan que la ley estadounidense no contempla excepciones para datos de entrenamiento. Paralelamente, la empresa presiona para que se flexibilicen las normas sobre copyright en IA, aunque ofrece mecanismos para que los titulares excluyan sus contenidos.

Un debate que viene de lejos

Los modelos de IA generativa aprenden patrones de grandes volúmenes de datos, lo que en ocasiones deriva en réplicas literales. Casos previos incluyen imágenes basadas en fotogramas de películas o textos plagiados de noticias. La industria discute cómo equilibrar innovación y derechos de propiedad intelectual.

Transparencia, la asignatura pendiente

El estudio subraya la necesidad de auditar los modelos para garantizar su fiabilidad. Los investigadores reclaman mayor claridad sobre los datos de entrenamiento, mientras OpenAI mantiene su postura de limitar el acceso a esa información. El impacto legal de estos hallazgos podría definir el futuro del desarrollo de IA.

Muere obrero rumano rescatado tras derrumbe de torre medieval en Roma

Octay Stroici, obrero rumano de 66 años, ha muerto en el hospital tras ser rescatado de los escombros de
Bomberos rescatan al trabajador atrapado en la Torre dei Conti derrumbada

Comunidad Ayorea Degüi resiste en Santa Cruz conservando su cultura ancestral

La comunidad ayorea Degüi habita desde 1999 en un terreno de 7.000 m² en Santa Cruz. 105 familias mantienen
Mujeres ayoreas trabajando los hilos de garabatá para sus tejidos artesanales

Presidente electo Paz se reunirá con productores de El Alto este miércoles

El presidente electo Rodrigo Paz se reunirá este miércoles con productores de El Alto para construir políticas de producción,
Imagen sin título

Evo Morales afirma que Rodrigo Paz ganó gracias a Edmand Lara

Evo Morales afirma que Rodrigo Paz ganó las elecciones gracias a su vicepresidente Edmundo Lara. El expresidente boliviano asegura
Imagen sin título

El PDC no define candidatos para presidir las cámaras legislativas

El Partido Demócrata Cristiano no ha definido a sus candidatos para presidir las cámaras de Senadores y Diputados. Su
El hemiciclo de la Cámara Baja espera por los nuevos legisladores.

Paz acuerda con la CAF un programa de apoyo por 3.100 millones de dólares

CAF acuerda con el presidente electo Rodrigo Paz un programa de apoyo de 3.100 millones de dólares para Bolivia.
Paz con Díaz-Granados, ayer.

Lara convoca concentración en plaza prohibida de La Paz tras juramento

El vicepresidente electo Edmand Lara convocó una concentración en la plaza San Francisco de La Paz tras su juramento.
El vicepresidente electo Edmand Lara en un acto de campaña con sus seguidores.

Bolivia culmina transición con investidura de Paz y Lara ante 45 delegaciones

El binomio electo Rodrigo Paz y Edmand Lara inicia la transición con dos actos. Recibirá credenciales en Sucre y
El presidente electo, Rodrigo Paz, y el vicepresidente electo, Edmand Lara.

Rodrigo Paz y Edmand Lara asumen la presidencia de Bolivia este sábado

Rodrigo Paz y Edmand Lara recibirán sus credenciales del TSE en Sucre este miércoles. La juramentación oficial será el
El presidente electo Rodrigo Paz y el vicepresidente electo Edmand Lara.

Añez acusa a Evo Morales de pedofilia y lo responsabiliza de la crisis boliviana

La expresidenta transitoria Jeanine Añez declaró que Evo Morales es el responsable de la crisis económica y social de
Jeanine Añez y Evo Morales

Director del CRC advierte sobre riesgos para la sostenibilidad cultural en Bolivia

El director del Centro de la Revolución Cultural afirma que los proyectos culturales requieren nuevas estrategias ante retos económicos
El director del Centro de la Revolución Cultural (CRC), David Aruquipa.

Presidente electo Rodrigo Paz anuncia acuerdos tras reuniones en Washington

El presidente electo boliviano Rodrigo Paz confirmó acuerdos con el Gobierno de EEUU, Banco Mundial, BID y FMI durante
El presidente electo Rodrigo Paz.