Content Signals
Le cadre Content Signals : comment déclarer vos préférences d'usage du contenu aux agents IA via les en-têtes HTTP et les balises meta HTML.
2026-02-01
Qu’est-ce que Content Signals ?
Content Signals est un cadre ouvert (annoncé par Cloudflare en septembre 2025) qui permet à tout éditeur de contenu d’exprimer ses préférences sur l’usage de son contenu une fois qu’il a été accédé par un système IA.
La spécification officielle est maintenue sur contentsignals.org.
Elle répond à un problème fondamental : robots.txt contrôle l’accès (peut-on crawler ?), mais n’a pas de mécanisme pour exprimer ce qui peut être fait avec le contenu après accès. Content Signals comble cette lacune.
Les trois dimensions de permission
| Dimension | Clé | Description |
|---|---|---|
| Entraînement IA | ai-train |
Ce contenu peut-il servir à entraîner des modèles IA ? |
| Recherche IA | search |
Ce contenu peut-il apparaître dans les résultats de recherche générés par l’IA ? |
| Entrée IA | ai-input |
Ce contenu peut-il être inclus dans les contextes LLM (usage agentique) ? |
Chaque dimension peut être yes, no, ou omise (non spécifiée).
Déclarer Content Signals
Via l’en-tête HTTP
L’en-tête Content-Signal est la méthode principale :
Content-Signal: ai-train=yes, search=yes, ai-input=yes
Exemples : autoriser uniquement la recherche (ai-train=no, search=yes, ai-input=no), tout interdire, ou tout autoriser. Vous pouvez aussi utiliser des balises <meta> pour les pages où vous ne contrôlez pas les en-têtes. Voir la spécification pour les détails.