Comment auditer sa présence dans les LLMs

Auditer sa présence dans les LLMs, c'est interroger les modèles directement avec les bonnes questions, vérifier ses fichiers robots.txt et llms.txt, contrôler ses données structurées Schema.org, tracer les citations de sa marque — et itérer régulièrement. Sans cet audit, vous optimisez à l'aveugle dans le canal qui croît le plus vite.

90 % des entreprises n'existent pas pour les LLMs — et elles ne le savent même pas. Pendant que leurs équipes marketing peaufinent leur SEO, optimisent leurs méta-descriptions et suivent leurs positions Google, ChatGPT, Perplexity et Google AI Overviews répondent à des millions de questions sans les citer une seule fois. Ce n'est pas une question de taille ou de budget. C'est une question de méthode. Les LLMs ont leurs propres critères pour choisir leurs sources — et ils sont différents des moteurs de recherche classiques. Depuis que j'accompagne des startups sur leur stratégie de visibilité IA, j'ai mis en place un processus d'audit reproductible. Ce n'est pas sorcier, mais ça demande de la rigueur et de la régularité. Voici exactement ce que je fais pour mes clients — étape par étape.

Interroger les LLMs directement — avec les bonnes questions

La première étape est la plus sous-estimée : ouvrir ChatGPT, Claude et Perplexity et taper les requêtes que vos clients potentiels tapent vraiment. Pas « parle-moi de mon entreprise » — personne ne fait ça. Les vraies requêtes sont comparatives, sectorielles, géolocalisées. Pour un client qui propose un logiciel RH à Paris, je vais tester : « Quel est le meilleur outil RH pour une startup de 50 personnes ? », « Comparatif logiciels de gestion des congés en France », « Qui recommander pour un SIRH à Paris ? ». L'objectif est double : vérifier si la marque est mentionnée, et analyser comment elle est présentée quand elle l'est. Est-ce un nom parmi dix autres ? La première recommandation ? Une mention avec des attributs positifs ou neutres ? Documentez tout dans un tableau. La fréquence de citation, le rang dans la liste, les attributs associés, les concurrents cités à la place. C'est votre baseline — sans elle, impossible de mesurer les progrès. Un autre type de requêtes souvent négligé : les questions de fond de parcours d'achat. « Comment choisir un outil RH ? », « Quels critères pour un SIRH en 2026 ? ». Si vous n'êtes pas cité là, vous ratez des opportunités de visibilité en haut de funnel. Testez sur les trois LLMs principaux — les résultats divergent énormément. D'après mes observations, moins de 15 % des sources sont communes entre ChatGPT, Perplexity et Google AI. Une marque peut être bien citée sur l'un et totalement absente des deux autres.

Analyser son llms.txt et robots.txt — contrôler ce que les IA voient

Avant même de penser contenu, il y a une question préalable : les bots IA peuvent-ils accéder à votre site ? C'est la vérification la plus rapide à faire — et la plus souvent ratée. Commencez par votre robots.txt (/robots.txt). Cherchez si GPTBot, ClaudeBot, PerplexityBot, Google-Extended sont mentionnés. S'ils ne le sont pas, regardez votre règle par défaut (User-agent: *). Si votre site est derrière Cloudflare, vérifiez dans le dashboard Security > Bots si l'option « AI Bot Block » est activée — depuis juillet 2025, elle l'est par défaut sur tous les plans, y compris le gratuit. Si vous êtes bloqué, peu importe la qualité de votre contenu : les LLMs ne vous voient pas. J'ai réglé ce problème chez plusieurs clients qui se demandaient pourquoi leur présence IA était nulle. La solution prenait cinq minutes. Ensuite, le llms.txt. Ce fichier, placé à la racine de votre site, présente votre organisation directement aux LLMs dans un format Markdown qu'ils comprennent nativement. Vérifiez s'il existe (/llms.txt). S'il est absent, c'est une opportunité immédiate. S'il est présent, lisez-le avec un œil critique : est-ce qu'il décrit clairement ce que vous faites, pour qui, avec quels résultats ? Est-ce qu'il pointe vers vos pages stratégiques ? Un llms.txt générique qui dit « nous sommes une entreprise innovante » est presque aussi inutile qu'un llms.txt absent.

Vérifier ses données structurées — Schema.org et JSON-LD

Les données structurées sont l'interface entre votre contenu et la compréhension des LLMs. Elles ne sont pas réservées au SEO technique — elles sont un signal direct de contexte pour les modèles IA. Les études montrent que l'ajout de schema.org JSON-LD fait passer la précision des réponses GPT-4 de 16 % à 54 % sur des contenus structurés. C'est un facteur trois. Pour auditer vos données structurées, l'outil le plus simple est le Rich Results Test de Google ou l'onglet Sources > Inspecter dans la Search Console. Vérifiez d'abord les schemas prioritaires : Organization ou LocalBusiness sur votre page d'accueil (nom, description, adresse, contact, logo, liens réseaux sociaux), Person sur les pages auteur, Article sur vos contenus de blog, FAQPage sur vos pages questions-réponses, et Product ou Service sur vos pages offre. Ce qui m'intéresse particulièrement dans un audit GEO, c'est la complétude des champs. Un schema Organization qui ne contient que le nom et l'URL est insuffisant. Les LLMs ont besoin de description, de foundingDate, de areaServed, de knowsAbout. Plus vous êtes précis dans vos schemas, plus les LLMs ont de contexte pour vous citer correctement. Un dernier point souvent négligé : la cohérence entre vos données structurées et votre contenu visible. Si votre schema dit « agence web à Lyon » mais que votre page dit « nous intervenons partout en France », les LLMs peuvent avoir du mal à vous associer à des requêtes locales précises.

Tracer les citations et attributions — dans quels contextes votre marque est mentionnée

Savoir si vous êtes cité, c'est bien. Savoir comment vous êtes cité et dans quel contexte, c'est ce qui permet d'agir. Dans mon audit, je creuse trois dimensions. Le contexte de citation : votre marque est-elle mentionnée spontanément dans des réponses générales, ou seulement quand on la demande explicitement ? La citation spontanée a beaucoup plus de valeur — elle signifie que le modèle vous associe à une catégorie, une expertise, un territoire. Les attributs associés : quels adjectifs, quelles caractéristiques les LLMs accrochent-ils à votre marque ? « Adapté aux startups », « solution technique robuste », « bon rapport qualité-prix » — ou au contraire des formulations vagues ou incorrectes ? Ces attributs sont souvent le reflet de ce que les sources tierces disent de vous. Si votre presse et vos avis clients soulignent la simplicité de votre outil, les LLMs la répercutent. Si personne n'en parle, les LLMs font du flou. Les sources indirectes : les LLMs ne citent pas que votre site — ils synthétisent aussi les articles qui vous mentionnent, les comparatifs, les avis G2 ou Capterra, les threads Reddit. Cherchez votre marque sur ces plateformes. Si vous n'y existez pas, c'est un levier d'action prioritaire. Les mentions tierces ont un poids disproportionné dans les citations LLM par rapport à votre site propre. Pour tracer tout ça dans la durée, je crée un document de suivi mensuel avec captures d'écran horodatées des réponses LLMs sur les requêtes clés. C'est rudimentaire, mais c'est fiable — et ça permet de voir l'évolution au fil des mois.

Mesurer et itérer — la cadence d'un audit GEO qui fonctionne

Un audit GEO n'est pas un one-shot. Les LLMs sont mis à jour régulièrement, les sources qu'ils indexent évoluent, et votre contenu change. La cadence que je recommande : un audit complet tous les trimestres, avec un suivi mensuel léger des requêtes clés. Pour le suivi mensuel, cinq à dix requêtes prioritaires testées sur ChatGPT et Perplexity, avec note de la présence et du positionnement. Ça prend 30 minutes et ça permet de détecter les régressions tôt. Pour l'audit trimestriel, c'est le travail complet : robots.txt et llms.txt, données structurées, citation tracking, analyse des sources tierces. C'est ce qu'on fait avec nos clients sur notre outil d'audit GEO — en quelques secondes, vous obtenez un score sur 40+ critères : accès des bots IA, présence et qualité du llms.txt, schemas JSON-LD, meta-données, HTML sémantique. C'est le point de départ objectif dont vous avez besoin pour prioriser vos actions. Sur les projets que j'accompagne, les gains les plus rapides viennent toujours dans cet ordre : débloquer les bots IA (robots.txt / Cloudflare), créer ou améliorer le llms.txt, compléter les schemas Organization et Article, puis travailler les citations tierces sur les plateformes d'avis et la presse spécialisée. Ce dernier levier est le plus lent mais celui qui a le plus d'impact sur le long terme — parce que les LLMs accordent un crédit énorme aux sources éditoriales indépendantes.