Creative Commons lanza CC Signals para regular el uso de datos en IA
La organización propone un marco legal y técnico para gestionar el acceso a datos por parte de modelos de IA. El proyecto, presentado el 25 de junio de 2025, busca equilibrar la demanda de datos con la protección de la propiedad intelectual en internet.
«Sostener el bien común en la era de la IA»
Creative Commons (CC), conocida por sus licencias de contenido abierto, anunció CC Signals, un sistema que permite a los titulares de datos especificar cómo pueden ser usados por máquinas. «Los CC Signals están diseñados para sostener el bien común en la era de la IA», declaró Anna Tumadóttir, CEO de CC. La iniciativa responde al creciente conflicto entre empresas que restringen el scraping (extracción automatizada de datos) y la necesidad de entrenar modelos de IA.
Herramientas frente al caos actual
Plataformas como X (antes Twitter) y Reddit han cambiado sus políticas repetidamente para limitar el entrenamiento de IA con sus datos. Mientras, Cloudflare explora cobrar a los bots por scraping, y desarrolladores crean herramientas para bloquear rastreadores no autorizados. CC Signals ofrece una alternativa estandarizada, con opciones de cumplimiento legal y ético, inspirada en sus licencias tradicionales.
Un ecosistema abierto, pero con reglas
El proyecto, en fase inicial, publicó diseños preliminares en su web y GitHub. Busca feedback público antes de su lanzamiento alpha en noviembre de 2025, incluyendo foros de discusión. Su éxito dependerá de la adopción por parte de titulares de datos y empresas de IA.
Internet en la encrucijada
CC advierte que la extracción masiva de datos por parte de la IA podría llevar a más sitios a cerrar su acceso con paywalls o restricciones, erosionando la naturaleza abierta de la web. Las licencias actuales, usadas en millones de obras, no cubren específicamente el uso por máquinas.
¿Un nuevo estándar para la IA?
CC Signals aspira a replicar el impacto de sus licencias tradicionales, pero en el ámbito de los datos para IA. Su implementación podría definir cómo se comparte información en la próxima década, evitando batallas legales fragmentadas.