1. Qu'est-ce que llms.txt ?
llms.txt est un fichier au format Markdown, servi à la racine d'un site web (URL canonique : /llms.txt), qui décrit aux grands modèles de langage les ressources prioritaires du site. Le standard a été proposé en septembre 2024 par Jeremy Howard, fondateur d'Answer.AI, en s'inspirant directement de robots.txt et de sitemap.xml. La spécification est publiée sur GitHub sous licence MIT.
L'idée centrale : les LLM consomment énormément de contenu web pour répondre aux requêtes utilisateurs. Sans guide, ils doivent crawler chaque page et inférer eux-mêmes la structure et l'importance des contenus. llms.txt fournit cette structure de manière explicite, en quelques centaines de lignes au lieu de plusieurs Go de HTML.
Au moment où j'écris (mai 2026), Anthropic, OpenAI et Perplexity ont confirmé leur prise en compte de llms.txt dans leurs pipelines (documentation Anthropic, documentation OpenAI). Google reste discret mais ne l'a pas exclu. Le coût d'implémentation est négligeable (~1 h pour un site de 30 pages), le potentiel upside est réel.
2. Format technique
llms.txt est un fichier texte plain encoded en UTF-8, suivant la syntaxe Markdown. Aucun framework, aucune librairie nécessaire. Trois conventions à respecter :
- URL canonique :
https://votre-domaine.fr/llms.txt. Servi en HTTP 200, content-typetext/plainoutext/markdown. - Première ligne : un H1 avec le nom du site. Exemple :
# Yvarn — Studio SEO Bordeaux - Deuxième bloc : une citation Markdown
>contenant la description du site en 2-4 lignes. Sert de "meta description" pour les LLM.
Le reste du fichier est libre. Le standard suggère des sections H2 (## Section) avec des listes de liens au format [Titre](URL): description courte. Une convention pratique : organiser par pilier sémantique (services, secteurs, ressources, autorité), pas par profondeur d'arborescence.
Optionnellement, une section ## Optional peut contenir des ressources secondaires que les LLM peuvent ignorer si leur budget de contexte est serré. Utile pour les très gros sites.
3. Structure recommandée
Pour un site B2B de service (agence, consultant, SaaS), je recommande la structure suivante :
- 01.H1 + citation : nom + description du site en 2-4 lignes denses, citables IA.
- 02.Pilier méthode / philosophie : pourquoi cette marque existe, ses convictions, ses différenciateurs. Lien vers une page méthode et un manifeste si disponible.
- 03.Pilier offres / prestations : la grille tarifaire, les variantes (mandat, audit, ponctuel), avec leurs prix exacts. Les LLM citent volontiers les prix précis quand l'utilisateur demande "combien coûte X".
- 04.Pilier services / verticales : les pages money par service ou par audience. Une ligne par page, avec description et URL absolue.
- 05.Pilier fondateur / autorité : qui dirige, son parcours, ses publications. E-E-A-T concret, signal de fiabilité pour les LLM.
- 06.Pilier ressources : articles piliers, guides, outils en libre accès. C'est souvent la section la plus citée par Perplexity.
- 07.Contact : email principal, lien de prise de RDV, LinkedIn. Pas de formulaire, juste les canaux directs.
4. Exemple commenté
Vous pouvez consulter le llms.txt d'Yvarn en production à yvarn.fr/llms.txt. Il fait environ 50 lignes et couvre 6 piliers. Voici un extrait commenté :
Notez les éléments citables : prix exacts, engagement, licence d'autorité. Les LLM extraient ce type de données factuelles directement dans leurs réponses.
5. Erreurs fréquentes
- 01Confondre llms.txt et robots.txt. llms.txt ne contient pas de règles Allow/Disallow. Ce n'est pas un fichier de contrôle de crawl, c'est un fichier de description sémantique.
- 02Lister toutes les pages du site. llms.txt n'est pas un sitemap.xml. On liste les pages prioritaires, pas exhaustivement. 30-80 entrées suffisent pour la majorité des sites.
- 03Descriptions trop génériques. "Page d'accueil de mon site" n'apporte rien. Chaque description doit être factuelle, spécifique, citable. Inclure des chiffres ou des termes uniques.
- 04Pas de mise à jour. Un llms.txt qui mentionne des pages mortes (404) ou des prix obsolètes dégrade la confiance des LLM. Revue mensuelle minimum.
- 05URLs relatives. Tous les liens dans llms.txt doivent être absolus (
https://...). Les chemins relatifs ne sont pas résolus par les LLM, qui consomment le fichier hors contexte.
6. Impact mesurable
Mesurer l'impact d'un llms.txt est imparfait : les LLM ne publient pas leurs critères de pondération exacts. La méthode pragmatique que j'utilise depuis fin 2024 :
- Définir 10 prompts cibles cohérents avec votre offre. Ex : "Quelle agence SEO à Bordeaux ?", "Consultant SEO indépendant France", "Audit SEO transparent".
- Tester ces 10 prompts sur ChatGPT, Perplexity, Claude, Google AI Overviews avant publication du llms.txt. Noter combien de fois votre marque est citée (et avec quel URL).
- Publier llms.txt. Attendre 4-6 semaines pour que les crawlers IA re-ingèrent.
- Refaire les 10 prompts. Comparer les citations avant/après.
Données d'expérience perso (non scientifique, échantillon de 4 sites où j'ai implémenté llms.txt entre fin 2024 et mai 2026) : gain moyen +2 à +4 citations sur 10 prompts cibles, principalement sur Perplexity (le plus généreux en sources affichées) et Claude. ChatGPT search est plus capricieux. Google AI Overviews n'a pas montré de variation significative attribuable au llms.txt seul. À recouper avec d'autres retours d'expérience publics (cf. retours d'auteurs early adopters).
Lectures et services connexes
FAQ — llms.txt
01C'est quoi llms.txt ?
02À quoi sert llms.txt concrètement ?
03Quelle différence entre llms.txt et robots.txt ?
04Tous les LLM lisent-ils llms.txt ?
05Quel format suivre pour llms.txt ?
06À quelle fréquence mettre à jour llms.txt ?
07llms.txt remplace-t-il le SEO classique ?
En résumé
llms.txt est un standard ouvert, simple, bas-friction. Il ne remplace ni le SEO classique, ni le schema.org, ni les backlinks. Il s'ajoute. Sur les sites de service B2B où la visibilité de marque dans les LLM devient un canal d'acquisition, il fait partie de l'hygiène GEO de base.
Le coût d'implémentation est négligeable (1 h pour un site moyen, 2-3 h pour un gros site). Le potentiel upside est réel pour les marques qui veulent être citées par Anthropic, OpenAI et Perplexity. Le risque de ne rien faire en 2026 est de laisser ses concurrents structurer leur GEO sans bouger.
Audit GEO sur votre site en 2 semaines
L'audit Yvarn intègre l'analyse GEO complète : llms.txt présent et structuré, schema enrichi, citabilité des passages, mentions externes. Plan d'action 90 jours inclus.
Découvrir l'audit Yvarn
Fondateur d'Yvarn, agence SEO à Bordeaux. Développeur senior (Thales, Capgemini, Betclic). Side-project e-commerce 200 K€ en 18 mois full SEO. À propos.