- OpenAI realiza 1,700 rastreos por cada visita que deriva a un sitio.
- El 79% de los usuarios de entre 18 y 44 años ya usan IA generativa para buscar productos.
- Google perdió 22% de participación en tráfico de búsqueda impactado por los bots de IA.
Hasta ahora, los bots de IA han navegado libremente por los sitios web de marcas y medios, recolectando información sin dejar beneficios tangibles a cambio. Pero esa dinámica podría cambiar con una propuesta de Cloudflare.
Como te anticipamos la semana pasada en Merca2.0, Cloudflare presentó un sistema que permite bloquear a estos rastreadores automatizados hasta que acepten pagar por cada acceso.
La iniciativa, llamada “pay per crawl”, busca restablecer un equilibrio en la relación entre generadores de contenido y plataformas de inteligencia artificial.
La tecnología está dirigida principalmente a bots de entrenamiento, como los que alimentan modelos de OpenAI, Anthropic o Meta, que ingresan a los sitios de los medios y las marcas para recolectar textos, descripciones y otros recursos que luego son utilizados para responder preguntas o construir experiencias en plataformas como ChatGPT, Gemini o Claude.
Cuál es el problema de los bots de IA
El problema es simple (y grave): el tráfico que estos bots aportan a los sitios es mínimo en comparación con la información que extraen.
Según Cloudflare, los bots de OpenAI realizaron mil 700 rastreos por cada visita derivada, mientras que en el caso de Anthropic esa proporción fue de 73 mil a uno.
Este desfase impacta en una de las métricas más valoradas por el marketing digital: los datos de primera mano.
Cuando un usuario accede a un sitio web, la marca puede observar su comportamiento, preferencias y rutas de navegación. Pero si ese mismo usuario obtiene toda la información que necesita desde una herramienta de IA, nunca llega al sitio, y por tanto, esos datos se pierden.
La IA ya no solo consume contenido, ahora también lo reemplaza
Lo que hasta hace poco era solo un dilema para medios y editores de contenido, ahora también alcanza a marcas de consumo.
Cloudflare considera que las empresas deben actuar en conjunto, como ya lo han hecho editores como Gannett, Condé Nast y Dotdash Meredith, que bloquearon el acceso a sus contenidos hasta lograr acuerdos o compensaciones por parte de las plataformas de IA, publica este martes AdAge.
La principal preocupación es que los bots entrenadores están capturando material que no solo incluye fichas de productos, sino también blogs, análisis y comunicados de prensa. Toda esa información es mostrada a los usuarios dentro de un entorno controlado por terceros, como ChatGPT, sin necesidad de visitar el sitio original.
Este modelo representa una pérdida de control sobre la estrategia de marca, y también el riesgo de que la información mostrada esté desactualizada o mal interpretada.
Las marcas temen que permitir el acceso sin restricciones puede llevar a que los bots destaquen productos que ya no se ofrecen, o que interpreten erróneamente ciertas políticas comerciales.
Controlar no es desaparecer: visibilidad en motores de IA sigue siendo posible
Una de las preocupaciones entre los responsables de marketing es que bloquear bots afecte su visibilidad en buscadores basados en IA.
Cloudflare asegura que hay que distinguir entre bots de entrenamiento y bots de búsqueda. Los primeros se dedican a alimentar modelos con información general, mientras que los segundos ayudan a que un sitio sea visible en motores como Gemini o ChatGPT Search.
Por eso, el sistema de bloqueo no se aplica por defecto a los bots de búsqueda, sino a aquellos que realizan rastreos masivos con fines de entrenamiento.
Esto permite a las marcas mantener su presencia en las búsquedas realizadas por usuarios en entornos de IA, sin tener que regalar todos sus contenidos a plataformas externas.
Además de Cloudflare, hay otras empresas que están desarrollando marcos similares. La startup Tollbit ya ofrece una especie de “muro de pago” para bots, y el IAB Tech Lab está trabajando en un estándar técnico que permita negociar de forma transparente cómo y cuándo un bot puede acceder a determinado contenido.
En paralelo, algunos medios están cerrando acuerdos de licenciamiento con empresas de IA. Un ejemplo es el del New York Times con Amazon, mientras que otras compañías ya están en litigio con desarrolladores de modelos por uso no autorizado de su contenido.
Una oportunidad para cambiar las reglas
Para las marcas, esta puede ser una oportunidad de recuperar protagonismo en el ecosistema digital. Ya no se trata solo de optimizar para motores de búsqueda tradicionales, sino también de diseñar estrategias de “answer engine optimization” (AEO), que definan cómo la IA debe mostrar sus productos y mensajes.
Pero también se trata de decidir si esa información se entrega gratis, o si se establece una nueva economía de contenido donde cada acceso tiene un precio.
El futuro inmediato del marketing digital no solo se juega en Google, sino en los laboratorios de entrenamiento de IA. Y controlar el acceso es el primer paso para negociar en mejores términos. Tanto para los medios como para las marcas.
Ahora lee:
Cloudflare lanza “pay-per-crawl” para cobrar por contenido usado por el “modo IA” de Google
Así conquista Corea el streaming y el marketing mundial según Netflix
Quién es Cheol en El Juego del Calamar 3: la verdad detrás del inesperado personaje