OpenAI acusado de usar libros de pago para entrenar GPT-4o

Un estudio revela que GPT-4o reconoce contenido bajo suscripción de O'Reilly sin licencia, según el AI Disclosures Project. OpenAI no ha respondido a las acusaciones.
TechCrunch
Pantalla con líneas de código binario y un logotipo en color azul.
Imagen que presenta una pantalla llena de líneas de código binario en azul y un logotipo prominente.

Investigadores acusan a OpenAI de entrenar sus modelos con libros de pago de O’Reilly

Un estudio sugiere que GPT-4o reconoce contenido bajo suscripción sin licencia previa. La organización AI Disclosures Project analizó 34 libros técnicos y detectó patrones de uso en el modelo más avanzado de la compañía. OpenAI no se ha pronunciado al respecto.

«Reconocimiento elevado de contenido no público»

El informe del AI Disclosures Project, cofundado por Tim O’Reilly, señala que GPT-4o identifica fragmentos de libros con paywall mejor que sus predecesores. La técnica DE-COP, empleada en el estudio, sugiere que el modelo tuvo acceso previo a este material. «No es una prueba irrefutable, pero los indicios son claros», admiten los autores.

Método y hallazgos clave

Analizaron 13.962 extractos de 34 libros técnicos publicados antes y después de las fechas límite de entrenamiento. GPT-4o mostró «mayor probabilidad de reconocimiento» en textos bajo suscripción, frente a versiones públicas o modelos antiguos como GPT-3.5 Turbo. Los investigadores descartaron que la mejora se deba solo a capacidades avanzadas de inferencia.

OpenAI y la polémica de los datos

La compañía carece de acuerdos con O’Reilly Media, según el estudio. Aunque OpenAI tiene licencias con otras editoriales y permite opciones de exclusión, el informe alimenta las críticas por el uso de material protegido. Actualmente, la empresa enfrenta demandas en EE.UU. por prácticas similares.

Búsqueda de datos de calidad

OpenAI ha contratado a periodistas y expertos para refinar sus modelos, reflejando una tendencia en la industria de la IA. El agotamiento de fuentes públicas y los riesgos de usar datos sintéticos explicarían la posible dependencia de contenido restringido.

Un escenario legal enrevesado

El texto recuerda que OpenAI aboga por regulaciones más flexibles sobre derechos de autor. Sin embargo, casos como este complican su posición jurídica, pese a que el estudio no evaluó sus modelos más recientes (GPT-4.5 u o3-mini).

¿Hacia dónde va el debate?

La investigación refuerza las dudas sobre el origen de los datos de entrenamiento en IA. Aunque el método tiene limitaciones, el patrón detectado en GPT-4o podría influir en futuras regulaciones y demandas contra la compañía.

Lara convoca una concentración en La Paz que genera críticas políticas

El vicepresidente electo David Lara convoca una concentración separada de Rodrigo Paz el 8 de noviembre. Tres diputados interpretan
Rodrigo Paz (i) y Edmand Lara durante la campaña electoral.

Boric asistirá a la toma de posesión de Paz para impulsar relaciones Chile-Bolivia

El presidente chileno Gabriel Boric asistirá a la toma de posesión de Rodrigo Paz en Bolivia. Analistas interpretan este
El presidente electo de Bolivia, Rodrigo Paz, y el mandatario de Chile, Gabriel Boric

Presidente electo boliviano se reúne con mandatario panameño

El presidente electo de Bolivia, Rodrigo Paz, se reunió con el mandatario panameño José Raúl Mulino. El encuentro, en
El presidente electo de Bolivia, Rodrigo Paz (d),se reunió con el mandatario panameño José Raúl Mulino (i).

Hallan mujer estrangulada en Santa Cruz; su pareja es el principal sospechoso

Eleuteria José fue hallada sin vida estrangulada en su domicilio del barrio Comarapa, Santa Cruz. La Fiscalía aprehendió a
Imagen sin título

Trump suspende programa alimentario SNAP afectando a millones

La parálisis presupuestaria suspende el programa SNAP, dejando sin ayuda alimentaria a 40 millones de personas. Beneficiarios y bancos
Eric Dunham, padre de dos adolescentes y con una discapacidad, necesita de la ayuda alimenticia federal.

Presidente electo boliviano se reúne con Mulino en Panamá para fortalecer lazos

Los presidentes Rodrigo Paz de Bolivia y José Raúl Mulino de Panamá acordaron iniciar una nueva etapa de entendimiento
El encuentro de José Raúl Mulino y Rodrigo Paz

Arce dirige su último gabinete y Paz recibe credencial en Sucre

El presidente Luis Arce celebra su última sesión de gabinete mientras el presidente electo Rodrigo Paz recibe su credencial
Frontis del Museo Casa de la Libertad en Sucre.

Perú rompe relaciones diplomáticas con México por asilo a exministra

Perú rompe relaciones diplomáticas con México tras conceder asilo a la ex primera ministra Betssy Chávez, procesada por el
Mirtha Esther Vásquez, Pedro Castillo y Betsy Chávez en octubre de 2021.

Mujer es estrangulada por su pareja en Santa Cruz de la Sierra

El cuerpo sin vida de Elouteria José fue hallado en su domicilio del barrio Comarapa, zona sur de Santa
Imagen sin título

Diputado Zegarra niega transfugio político y reafirma lealtad a Alianza Libre

El diputado electo Edgar Zegarra desmiente rotundamente su salida de Alianza Libre. Aclara que sus críticas internas son ejercicio
El diputado Edgar Zegarra junto a Tuto Quiroga.

Dunn insta a declarar al narcotráfico como actividad «terrorista» en Bolivia

El excandidato presidencial Jaime Dunn insta a declarar el narcotráfico como «terrorismo de Estado» en Bolivia. Argumenta que es
Imagen sin título

Senamhi emite alerta naranja por vientos fuertes en Santa Cruz

El Senamhi activó una alerta naranja por vientos de 60 a 90 km/h desde el 4 hasta la mañana
Imagen sin título