Bots de IA coletando seus dados? Esta ferramenta gratuita confunde esses incômodos rastreadores.

Eugene Mymrin/Getty ImagesA ascensão do conteúdo gerado por IA, conhecido como mídia sintética, tem causado principalmente problemas: ajuda a espalhar desinformação, rouba de artistas e erode a confiança no que vemos online. Contudo, a Cloudflare pode ter encontrado uma aplicação onde a inteligência artificial poderia auxiliar na proteção do conteúdo original contra as garras de empresas de IA.

Na quarta-feira, a empresa lançou o AI Labyrinth, uma ferramenta que utiliza conteúdo gerado por IA para "atrapalhar, confundir e desperdiçar recursos" de crawlers de IA não autorizados. Além disso, diversos estudos apontaram que chatbots como ChatGPT e Perplexity ainda acessam conteúdo de sites que bloqueiam seus crawlers. A Cloudflare observou no anúncio que esses crawlers "geram mais de 50 bilhões de solicitações à rede Cloudflare todos os dias, ou seja, quase 1% de todas as solicitações da web que observamos" — e como você os bloqueia é importante.

"A Cloudflare possui várias ferramentas para identificar e bloquear crawlers de IA não autorizados, mas constatamos que bloquear bots maliciosos pode alertar o atacante de que você está ciente da situação, levando a uma mudança de abordagem e a uma corrida armamentista sem fim", explicou a empresa. "Queríamos criar uma nova forma de frustrar esses bots indesejados, sem deixá-los saber que foram impedidos." Quando a Cloudflare detecta uma solicitação de crawling não autorizada, o AI Labyrinth — em vez de simplesmente bloquear o crawler — liga a várias páginas da web geradas por IA que aparentam ser reais o suficiente para convencer o crawler de que são legítimas. Assim, o crawler acredita que extraiu com sucesso o conteúdo que procurava, enquanto os dados reais do site permanecem protegidos de olhares curiosos. O crawler também desperdiça recursos computacionais, algo que a Cloudflare considera uma vitória.

"A Cloudflare automaticamente irá implantar um conjunto de páginas vinculadas geradas por IA ao detectar atividade inadequada de bots, sem que os clientes precisem criar regras personalizadas", explica o anúncio. A empresa utilizou Workers AI e um modelo de código aberto para criar, previamente, páginas sintéticas únicas e com aparência humana sobre diversos tópicos, uma vez que criá-las sob demanda poderia resultar em atrasos de desempenho. Esse "pipeline de pré-geração […] higieniza o conteúdo para prevenir quaisquer vulnerabilidades de XSS e o armazena no R2 para recuperação mais rápida", afirmou a empresa.

O AI Labyrinth apresenta apenas links de conteúdo gerado por IA para scrapers de IA; o conteúdo está oculto de visitantes humanos nas páginas existentes do site e não altera a estrutura, a aparência ou o SEO do site. A Cloudflare também destacou que não deseja que a ferramenta adicione mais "lixo" gerado por IA à internet de modo geral. "É importante para nós que não geremos conteúdo impreciso que contribua para a disseminação de desinformação na internet, então o conteúdo que geramos é real e relacionado a fatos científicos, apenas não é relevante ou proprietário do site que está sendo rastreado", acrescentou o anúncio.

Além disso, a Cloudflare acredita que a ferramenta pode funcionar como um "honeypot" para ajudar a identificar crawlers ilícitos. A empresa destacou que visitantes humanos reais provavelmente não "irão a quatro links de profundidade em um labirinto de bobagens geradas por IA", e que a ferramenta saberá, portanto, com base na atividade de cliques, onde novos bots estão surgindo. Isso, por sua vez, ajudará o AI Labyrinth a identificar melhor os maus atores. Bots evoluíram para detectar técnicas tradicionais de honeypot. Para se manter à frente, a Cloudflare pretende que a IA do AI Labyrinth "eventualmente crie redes inteiras de URLs vinculadas que sejam muito mais realistas e não triviais para programas automatizados detectarem."

O AI Labyrinth pode ser uma ferramenta útil para editores ou indivíduos que não desejam que seu trabalho seja utilizado para treinar IA (ou mal interpretado por chatbots). Todos os clientes da Cloudflare, incluindo aqueles no plano gratuito, podem optar pelo AI Labyrinth hoje mesmo. Basta acessar o painel da Cloudflare, navegar até a seção de gerenciamento de bots e ativar o botão do AI Labyrinth.

Link de referência: Cloudflare

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Rolar para cima