Le 10 avril 2026, direction Paris avec Valentin Charrier, notre développeur, pour une journée de formation avec Sylvain et Guillaume Peyronnet, fondateurs d’IBOU, le moteur de recherche français. Au programme : « SEO LLM ».
Dans cet article, je vous partage ce qu’il faut retenir : comment fonctionnent vraiment les moteurs génératifs (ChatGPT, Gemini, Perplexity, Claude), les 4 leviers qui comptent aujourd’hui pour être visible (E-E-A-T, fan-out, content gap, site focus), ce que Valentin retient côté dev, ce que j’en retire côté rédaction web, et surtout ce que nous mettons en place dès maintenant pour les entreprises que nous accompagnons.
Sommaire
Pourquoi cette formation, pourquoi maintenant
Le GEO (Generative Engine Optimization) n’est pas un sujet de veille chez Maison Graciet : c’est un axe de travail quotidien. Nous sommes certifiés par les frères Peyronnet en SEO et GEO, et cette journée prolonge cet engagement.
La raison est simple : les règles du jeu changent. Un contenu bien positionné sur Google peut être totalement absent des réponses génératives s’il n’est pas structuré pour être compris, découpé et sélectionné par un modèle de langage. Se former aux mécanismes exacts de ces moteurs, c’est anticiper, pas subir.
Comment fonctionnent vraiment les moteurs génératifs
L’architecture d’un moteur génératif (GES)
Un moteur de recherche génératif suit un pipeline précis que les frères Peyronnet nous ont détaillé : retrieval hybride (recherche de documents), reranking (classement des résultats), fusion multi-requêtes par RRF (Reciprocal Rank Fusion), puis synthèse par le modèle de langage.
Comprendre ce pipeline change tout.
Être cité dans une réponse IA ne relève pas du hasard : c’est le résultat d’une série de filtrages où chaque étape peut éliminer votre contenu.
Sparse vs dense retrieval : la fin du mot-clé roi
Deux types de recherche cohabitent. Le sparse retrieval cherche des mots exacts (la mécanique historique du SEO). Le dense retrieval comprend le sens d’un document dans son contexte. Les LLM privilégient massivement le second.
Conclusion : structurer ses contenus autour du sens, pas que des mots-clés.
Chunking, Lost in the Distance, Lost in the Middle
Les LLM découpent chaque page en blocs sémantiques appelés chunks. Chaque chunk doit être compréhensible sans avoir à lire le reste de l’article.
Règle associée : ne pas commencer un paragraphe par un pronom vague (« Il… », « Cela… », « C’est… »).
Deux phénomènes aggravent les mauvais choix de structure : Lost in the Distance (si la réponse est trop éloignée de la question dans le texte, le LLM ne fait plus le lien) et Lost in the Middle (les informations placées au milieu d’un long texte sont moins bien retenues que celles du début et de la fin).
Les 4 leviers fondamentaux du GEO
Toute la formation s’articule autour de quatre leviers à passer systématiquement en revue avant de publier :
Deux techniques avancées complètent ces leviers : la construction de cocons via le brevet Google US 20240289407 (5 intentions × 2 questions × 2 requêtes) et les STS (Seed Text Sequences), des séquences de 12 à 15 mots.

Ce que l’équipe dev retient – par Valentin
« Côté développement, trois chantiers prennent une importance immédiate.
D’abord, les micro-données structurées Schema.org : elles bénéficient au SEO classique ET à la visibilité LLM, nous les ajoutons systématiquement sur les fiches produits de nos clients.
Ensuite, l’analyse des logs serveur pour détecter le comportement des bots IA (training, instant), sans cette mesure, impossible de corréler nos optimisations aux citations dans les réponses génératives.
Enfin, l’authorship WordPress : biographies auteurs complètes, balises schema Person, liens croisés avec LinkedIn. C’est un signal E-E-A-T fort, avec un coût de mise en œuvre faible.
Point technique à retenir :
Actuellement, les fichiers LLMs.txt et LLM-full.txt ne semblent pas être utilisés par les robots. Cependant, il est préférable de les héberger sur votre serveur, car ils n’impactent ni les performances ni le stockage. Si un jour les LLM se mettent à les exploiter, vous serez parmi les premiers à en bénéficier. »
Ce que l’équipe rédaction retient – par moi-même
Côté rédaction, la formation m’a confirmé une conviction : la qualité d’écriture est désormais indissociable de l’architecture technique du contenu. Plusieurs règles structurent maintenant nos productions.
- Chaque article commence par un bloc résumé et se termine par un bloc « À retenir », deux zones de forte récupération LLM, anti-Lost in the Middle.
- Chaque paragraphe est auto-porté : pas de « Il », « Cela », « C’est » en ouverture.
- Chaque article intègre 2 à 3 statistiques sourcées et 1 à 2 citations d’experts nommés.
- Chaque contenu est signé par un auteur identifié, avec biographie reliée.
La règle que je me répète avant chaque publication : un paragraphe copié-collé hors contexte doit rester compréhensible seul. Si ce n’est pas le cas, le chunking est à retravailler.
Ce que nous mettons en place pour les entreprises que nous accompagnons
Cette formation nourrit un plan d’action concret, priorisé, que nous déployons avec vous :
- Audit E-E-A-T de vos pages clés : cartographie des manques (sources, statistiques, authorship, images originales).
- Baseline GEO : test de vos requêtes stratégiques sur ChatGPT, Perplexity et Gemini pour mesurer votre visibilité actuelle comme point de départ.
- Restructuration de contenu : résumé en début, « À retenir » en fin, chunks auto-portés, enrichissement par citations et statistiques sourcées.
- Cocon sémantique SEO/GEO construit selon la méthode du brevet Google pour maximiser votre couverture fan-out.
- Déploiement Schema.org sur les pages à enjeu, pour consolider la récupération par les modèles.
- Audit site focus : identification des pages hors thématique, décision de désindexation ou de repositionnement.


Un mot aux frères Peyronnet
Sylvain, Guillaume, merci. Merci pour votre rigueur scientifique, merci pour la pédagogie qui transforme des sujets arides (transformers, vecteurs de contexte, RRF, brevets) en méthodes directement actionnables.
Votre capacité à articuler recherche académique, pratique opérationnelle et regard critique sur le marché fait de vos formations une référence. Nous portons vos enseignements chaque jour dans nos missions, et ils nourrissent ce que nous construisons pour les entreprises que nous accompagnons.

À retenir
La recherche générative (ChatGPT, Gemini, Claude, Perplexity) suit un pipeline en quatre étapes : retrieval hybride, reranking, fusion multi-requêtes par RRF, puis synthèse LLM.
Sélectionner vos contenus comme sources citées exige quatre leviers combinés : E-E-A-T (expérience, expertise, autorité, confiance), fan-out (une page par intention de recherche), content gap (angles uniques) et site focus (cohérence thématique).
Les gains mesurés sur les citations dans les moteurs génératifs sont significatifs : +37 % avec des statistiques sourcées, +30 % avec des citations d’experts, +23 % avec des sources citées.
Chez Maison Graciet, agence web et de conseil numérique, nous appliquons ces méthodes au patrimoine numérique des entreprises que nous accompagnons. Parce qu’un numérique utile, c’est un numérique visible là où vos clients cherchent vraiment.
Bienvenue dans le numérique utile.
