El gigante web Cloudflare bloqueará por defecto a los bots de IA que extraen contenido
La empresa de tecnología de Internet Cloudflare ha anunciado que, a partir de este martes, comenzará a bloquear automáticamente los rastreadores de inteligencia artificial (IA) que acceden a contenido sin el permiso o compensación de los propietarios de sitios web. Esta medida tiene el potencial de afectar significativamente la capacidad de los desarrolladores de IA para entrenar sus modelos.

Una nueva política para los rastreadores de IA
Con esta nueva política, todos los nuevos dominios web que se inscriban en Cloudflare serán consultados sobre si desean permitir el acceso a los rastreadores de IA. Esto otorga a los propietarios de sitios web la capacidad de prevenir que los bots extraigan datos de sus plataformas. Además, Cloudflare introducirá un modelo de "pago por rastreo", permitiendo a los editores cobrar a los rastreadores de IA por el acceso a su contenido.
Según un informe de 2023, aproximadamente el 16% del tráfico global de Internet pasa directamente a través de la red de entrega de contenido (CDN) de Cloudflare, lo que destaca la importancia de esta compañía en la infraestructura digital actual.
Matthew Prince, cofundador y CEO de Cloudflare, afirmó: “Los rastreadores de IA han estado extrayendo contenido sin límites. Nuestro objetivo es devolver el poder a los creadores, al tiempo que ayudamos a las empresas de IA a innovar”.

Impacto en el ecosistema digital
Los rastreadores de IA son bots automatizados diseñados para extraer grandes cantidades de datos de sitios web y bases de datos con el fin de entrenar modelos de lenguaje de grandes dimensiones. Cloudflare sostiene que, en comparación con el modelo anterior, que recompensaba a los creadores al dirigir a los usuarios a los sitios originales, los rastreadores actuales están socavando este sistema al recopilar texto, artículos e imágenes, lo que evita que los usuarios visiten las fuentes originales. Esto ha llevado a que los editores pierdan tráfico vital y, por ende, ingresos por publicidad en línea.
El movimiento de Cloudflare complementa una herramienta que la compañía lanzó en septiembre del año pasado, que permitía a los editores bloquear a los rastreadores de IA con un solo clic. Ahora, esta opción se convierte en el estándar para todos los sitios web que utilizan sus servicios.

Reacciones y perspectivas futuras
OpenAI, la empresa detrás de ChatGPT, decidió no participar en la presentación del plan de Cloudflare, argumentando que esto introduce un intermediario en el sistema. OpenAI destacó su papel como pionero en el uso de robots.txt, un conjunto de códigos que previene la extracción automatizada de datos web, y aseguró que sus rastreadores respetan las preferencias de los editores.
Matthew Holman, socio del bufete de abogados británico Cripps, añadió que “los rastreadores de IA suelen ser considerados más invasivos y selectivos en lo que respecta a los datos que consumen. Si se implementa de manera efectiva, este desarrollo obstaculizaría la capacidad de los chatbots de IA para recolectar datos para entrenar y realizar búsquedas”.
Conclusión
La decisión de Cloudflare de bloquear por defecto a los rastreadores de IA marca un cambio significativo en la forma en que se gestiona el acceso a contenido en línea. Esta medida podría tener repercusiones importantes para el ecosistema digital en Europa y España, donde los editores podrían recuperar parte del tráfico y los ingresos perdidos. A medida que la tecnología de IA continúa evolucionando, será crucial encontrar un equilibrio que permita la innovación sin sacrificar los derechos de los creadores de contenido.
Fuentes
- [1] Download and install Google Chrome
- [2] Download Chrome - Google Help
- [3] Erweiterungen installieren und verwalten - Chrome Web Store-Hilfe
- [4] Microsoft edge浏览器登录web of science 自动跳转到学校登录 ...
- [5] Install and manage extensions - Chrome Web Store Help
- [6] Get started with Google Earth in your web browser - Google Earth …
- [7] Sign in to the Gemini web app
- [8] Iniciar sesión en la aplicación web de Gemini
Información del autor
El autor de este artículo es Martina Torres, una reportera sénior de noticias internacionales para ElPulsoGlobal especializada en asuntos globales y política internacional.