Le 1er juillet 2026, Cloudflare a annoncé une nouvelle solution de gestion du trafic IA sur son blog officiel, « Votre site, vos règles : nouvelles options de trafic IA pour tous les clients. » Les administrateurs de sites web peuvent désormais gérer séparément les robots de recherche, d’agent et de formation, ne se limitant plus à « laisser tous » ou « intercepter tous ».
La nouvelle option est désormais disponible pour tous les clients Cloudflare, y compris un forfait gratuit. Les sites web peuvent désormais gérer séparément l’indexation des recherches, les visites en temps réel représentant les utilisateurs, et l’entraînement des modèles.
La valeur des trois types de rampes est complètement différente
La recherche consiste à un crawling pour créer des index pour les requêtes suivantes, et les sites web s’attendent généralement à obtenir des impressions et à retourner du trafic grâce à cela. Un agent fait référence à un comportement automatisé représentant de réels utilisateurs accédant aux pages pour accomplir la tâche en cours ; Ses différences avec les chatbots ordinaires peuvent être comprises en comparant les agents IA, chatbots et flux de travail du site. L’entraînement consiste à utiliser du contenu pour l’entraînement ou l’ajustement fin des modèles, avec des données entrant dans les capacités du modèle sur une période plus longue.
Cette classification est plus proche des véritables intérêts des webmasters que de « savoir s’il s’agit d’un bot IA ». Un site web peut conserver la visibilité dans la recherche tout en rejetant l’entraînement du modèle ; Il est également possible de permettre aux agents d’effectuer des tâches pour les utilisateurs sans ouvrir la porte à tout trafic automatisé.
Après le 15 septembre, les règles par défaut pour les nouveaux noms de domaine changeront
Cloudflare prévoit d’activer de nouvelles valeurs par défaut pour les nouveaux domaines intégrés à partir du 15 septembre 2026 : sur les annonces affichant des pages, Training et Agent sont bloqués par défaut, tandis que la recherche est autorisée par défaut. Les clients existants peuvent confirmer ou modifier leurs choix à l’avance dans les paramètres de sécurité.
Une attention particulière doit être portée aux rampants polyvalents. Si le même crawler est utilisé à la fois pour la recherche et la formation, le système le gérera selon des règles plus strictes. Si le webmaster bloque directement la formation, cela peut affecter l’exposition à la recherche de ces robots, il n’est donc pas conseillé de les activer en masse avant de vérifier les détails de la catégorie.
Quelles sont les trois choses que le webmaster devrait faire en premier ?
- Vérifiez quelles pages reposent sur la recherche de trafic et lesquelles contiennent du contenu payant, publicitaire ou original de grande valeur.
- Définissez Recherche, Agent et Entraînement séparément ; évitez de vous en tenir à l’ancienne approche d’interception unifiée.
- Après ajustements, continuez à observer l’indexation des recherches, le trafic recommandé et les visites du crawler, puis resserrez les règles en fonction de l’impact réel.
Cloudflare étend également BotBase et les signaux d’utilisation du contenu, permettant aux sites web de distinguer entre « interaction en temps réel », « indexation et référence » et « résumés complets ou copies ». Cela fait suite au même fil principal que précédemment présenté sur le site concernant le contrôle de contenu de Cloudflare AI Index : savoir si le contenu peut être utilisé par l’IA, en passant d’un défaut vague à des décisions catégorisables, expressives et ajustables du propriétaire du site.