Reddit demanda a Anthropic por usar datos sin permiso

Reddit acusa a Anthropic de entrenar sus modelos de IA con contenido de usuarios sin licencia, en un caso que podría marcar un precedente legal en la industria.
TechCrunch

Reddit demanda a Anthropic por usar sus datos sin permiso

La plataforma denuncia que la startup de IA entrenó sus modelos con contenido de usuarios sin licencia. El caso, presentado en California, marca el primer litigio de una gran tecnológica contra un proveedor de IA por uso de datos. Reddit ya tiene acuerdos con OpenAI y Google para este fin.

«No toleramos que exploten nuestro contenido sin compensación»

Reddit alega en la demanda que Anthropic violó su política de usuario al usar datos con fines comerciales sin autorización. Según el documento, los bots de Anthropic ignoraron los archivos «robots.txt» y rastrearon la plataforma más de 100.000 veces en 2024, pese a haber prometido bloquear el scraping. «Exigimos daños compensatorios y que cesen el uso ilegítimo», declaró Ben Lee, director legal de Reddit.

Acuerdos con otros gigantes de IA

La plataforma contrasta el caso con sus pactos con OpenAI y Google, donde estableció cláusulas para proteger la privacidad de los usuarios. Sam Altman, CEO de OpenAI, es accionista de Reddit (8.7%), lo que añade complejidad a la relación entre las empresas.

Anthropic se defiende

La startup niega las acusaciones: «Discrepamos y nos defenderemos con firmeza», afirmó su portavoz Danielle Ghighlieri. Reddit sostiene que intentó negociar, pero Anthropic «se negó a dialogar».

Un precedente en la industria

El caso se suma a demandas de The New York Times contra OpenAI y Microsoft, y de autores como Sarah Silverman contra Meta, todas por uso no autorizado de contenido para entrenar IA. Editores musicales también han denunciado prácticas similares en startups de generación multimedia.

El futuro de los datos en la IA

El resultado del litigio podría definir cómo las tecnológicas negocian el acceso a datos para entrenar modelos. Reddit busca sentar un precedente: el contenido generado por usuarios debe compensarse si se usa comercialmente.