Bots de IA aumentan 50% el tráfico en Wikimedia Commons

Los bots de IA consumen el 65% del ancho de banda en Wikimedia Commons, generando costes operativos y riesgos para la infraestructura.
TechCrunch
Un teléfono muestra una imagen de un logo blanco y negro con letras y símbolos, mientras que al fondo hay un mapa estelar y líneas conectadas.
La pantalla de un teléfono móvil presenta un logo conocido que contiene piezas de puzzle con letras diversas, colocada sobre una imagen de fondo que representa un mapa estelar con líneas de conexión.

Los bots de IA disparan un 50% el ancho de banda de Wikimedia Commons

El tráfico de «scrapers» automatizados supera ya el 65% del consumo de recursos. La Fundación Wikimedia alerta de riesgos operativos y costes crecientes. Los bots acceden masivamente a contenidos menos populares, saturando servidores.

«Una carga sin precedentes para nuestra infraestructura»

La Fundación Wikimedia reveló que el ancho de banda para descargas multimedia en Wikimedia Commons aumentó un 50% desde enero de 2024. El motivo: «los ‘bots’ que entrenan modelos de IA consumen más recursos que los usuarios humanos», según su blog oficial. Estos sistemas automatizados generan tráfico en servidores centrales, más costosos de mantener.

Desequilibrio en el consumo

Mientras los humanos acceden a contenidos frecuentes (almacenados en caché), los crawlers buscan archivos menos populares, ubicados en centros de datos principales. Esto explica que representen el 65% del tráfico «caro», pese a ser solo el 35% de las visitas totales. «Los bots leen en masa páginas poco visitadas», detalla la organización.

La batalla por el internet abierto

El equipo técnico de Wikimedia dedica recursos extra a bloquear crawlers para evitar interrupciones a usuarios reales. El problema se extiende: desarrolladores como Drew DeVault denuncian que los bots ignoran archivos «robots.txt». Empresas como Cloudflare han lanzado herramientas para ralentizarlos, pero «es un juego del gato y el ratón».

Cuando la tecnología se vuelve en su contra

Wikimedia Commons alberga millones de archivos multimedia bajo licencias abiertas, clave para proyectos colaborativos. El auge de la IA ha convertido esta biblioteca digital en objetivo prioritario para empresas que entrenan algoritmos, amenazando su sostenibilidad económica y técnica.

¿Hacia un internet con muros?

La presión de los scrapers podría forzar a plataformas a implementar paywalls o registros obligatorios, según advierte el texto. La Fundación Wikimedia sigue buscando soluciones, pero el escenario actual prioriza proteger el acceso humano frente al consumo masivo de máquinas.