Fraîcheur du contenu
Comment signaler la fraîcheur du contenu aux crawlers IA et aux moteurs, et pourquoi l'actualité compte pour les réponses générées par l'IA.
2026-02-01 · Updated 2026-02-23
Pourquoi la fraîcheur compte pour les agents IA
Les systèmes IA — tant les crawlers qui construisent des datasets d'entraînement que les agents en temps réel qui répondent à des requêtes — ont une forte préférence pour le contenu récent et mis à jour. Deux raisons :
- Exactitude : Les informations obsolètes conduisent à de mauvaises réponses. Les systèmes IA en sont conscients et déclassent le contenu périmé pour les requêtes sensibles au temps.
- Coupures de connaissance : Les LLM sont entraînés sur des données jusqu'à une date de coupure. Le contenu publié après cette coupure peut être récupéré via des pipelines RAG qui récupèrent des données en direct — mais seulement si le contenu est indexé et clairement daté.
La pile de signaux de fraîcheur
| Signal | Où | Consommé par |
|---|---|---|
datePublished en JSON-LD |
<script type="application/ld+json"> |
Googlebot, crawlers IA, systèmes RAG |
dateModified en JSON-LD |
Idem | Idem |
En-tête HTTP Last-Modified |
Réponse serveur | Caches HTTP, crawlers |
<lastmod> dans sitemap.xml |
/sitemap.xml |
Tous les grands crawlers |
| Date visible sur la page | Contenu de la page | Confiance utilisateur, E-E-A-T |
Champs de date en JSON-LD
La façon la plus fiable de signaler la fraîcheur :
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Titre de votre article",
"datePublished": "2026-02-01T09:00:00+00:00",
"dateModified": "2026-02-15T14:30:00+00:00",
"author": {
"@type": "Person",
"name": "Nom de l'auteur"
}
}
Règles clés :
- Toujours utiliser le format ISO 8601 avec fuseau horaire (
T09:00:00+00:00) dateModifieddoit refléter des mises à jour de contenu substantielles, pas des corrections de formatage- Ne jamais antidater le contenu — cela signale aux systèmes IA que vous manipulez la fraîcheur
<lastmod> dans sitemap.xml
La balise <lastmod> dans votre sitemap est un signal de fraîcheur primaire pour les crawlers qui décident quelles pages re-indexer :
<url>
<loc>https://example.com/docs/json-ld</loc>
<lastmod>2026-02-15</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
En Next.js, générez le sitemap dynamiquement pour que lastmod reflète le vrai updatedAt de votre frontmatter de contenu :
// app/sitemap.ts
export default async function sitemap(): Promise<MetadataRoute.Sitemap> {
const docs = await getDocEntries("fr");
return docs.map((doc) => ({
url: `${baseUrl}/docs/${doc.slug}`,
lastModified: new Date(doc.updatedAt ?? doc.publishedAt),
changeFrequency: "monthly",
priority: 0.8,
}));
}
En-tête HTTP Last-Modified
Pour les serveurs et CDN, définissez l'en-tête Last-Modified pour signaler la fraîcheur au niveau HTTP :
HTTP/1.1 200 OK
Last-Modified: Thu, 15 Feb 2026 14:30:00 GMT
Cache-Control: public, max-age=3600
Stratégie de rafraîchissement du contenu
Contenu evergreen (docs, guides)
- Réviser et mettre à jour tous les 6–12 mois
- Ajouter une mention visible « Mis à jour le » en haut de page
- Mettre à jour
dateModifieden JSON-LD et<lastmod>dans le sitemap - Signaler les mises à jour dans le contenu : « Mis à jour en février 2026 : la section X a été révisée pour… »
Contenu d'actualité et sensible au temps
- Publier avec un
datePublishedprécis - Ne pas mettre à jour après publication (pour préserver l'intégrité de la date)
- Si une correction est nécessaire, ajouter une notice de correction explicite et mettre à jour
dateModified
Signaux de date visibles sur la page
En plus des signaux lisibles par les machines, affichez la date visiblement sur la page :
<time datetime="2026-02-01T09:00:00+00:00">1er février 2026</time>
L'attribut datetime donne aux machines la valeur précise ; le texte à l'intérieur donne aux humains un format lisible. Les deux comptent.
À éviter
- Cacher la date de publication : réduit la confiance utilisateur et supprime un signal de fraîcheur clé
- Gonfler
dateModifiedsur des modifications triviales : manipuler ce signal nuit à la crédibilité auprès des systèmes IA - Contenu obsolète sans
dateModified: les systèmes IA supposent que le contenu est aussi ancien quedatePublished
Impact sur les réponses générées par l'IA
Les systèmes IA générant des réponses préfèrent la source la plus récente et faisant autorité. La combinaison qui fonctionne le mieux :
datePublishedetdateModifieden ISO 8601 dans le JSON-LD<lastmod>dans le sitemap.xml maintenu à jour<time datetime="...">visible sur la page- Mises à jour substantielles signalées dans le contenu lui-même
Voir Schema.org, Sitemap et Écrire pour les agents.