Content Signals

Qu’est-ce que Content Signals ?

Content Signals est un cadre ouvert (annoncé par Cloudflare en septembre 2025) qui permet à tout éditeur de contenu d’exprimer ses préférences sur l’usage de son contenu une fois qu’il a été accédé par un système IA.

La spécification officielle est maintenue sur contentsignals.org.

Elle répond à un problème fondamental : robots.txt contrôle l’accès (peut-on crawler ?), mais n’a pas de mécanisme pour exprimer ce qui peut être fait avec le contenu après accès. Content Signals comble cette lacune.

Les trois dimensions de permission

Dimension	Clé	Description
Entraînement IA	`ai-train`	Ce contenu peut-il servir à entraîner des modèles IA ?
Recherche IA	`search`	Ce contenu peut-il apparaître dans les résultats de recherche générés par l’IA ?
Entrée IA	`ai-input`	Ce contenu peut-il être inclus dans les contextes LLM (usage agentique) ?

Chaque dimension peut être yes, no, ou omise (non spécifiée).

Déclarer Content Signals

Via l’en-tête HTTP

L’en-tête Content-Signal est la méthode principale :

Content-Signal: ai-train=yes, search=yes, ai-input=yes

Exemples : autoriser uniquement la recherche (ai-train=no, search=yes, ai-input=no), tout interdire, ou tout autoriser. Vous pouvez aussi utiliser des balises <meta> pour les pages où vous ne contrôlez pas les en-têtes. Voir la spécification pour les détails.