Présentation des outils WP Search Console, Mitambo et SEO Serp qui permettent, via une utilisation conjuguée, de mieux optimiser le contenu des pages d'un site web dans une optique de prise en compte de thématiques diverses.

Par François Lamotte


Depuis 2013/2014 et les déclarations de Matt Cutt sur le Topical PageRank, on sait que l’optimisation SEO ne se fait plus uniquement « par mot-clé »  mais aussi par « thématiques ».


Fig. 1. Video de Matt Cutts (https://youtu.be/PfLaC325S6M).

Dans cette vidéo, Matt Cutt explique que le PageRank n'est pas qu'une mesure de la popularité d’un site et que l’arrivée du Topical PageRank aide à mieux comprendre la candidature potentielle d’un site pour une requête spécifique. Certains ont appelé cette mise à jour l’algorithme du “bon gars” (good guy algorithm) ou encore celui de l’autorité de l’auteur (author authority algorithm) visant à récompenser les bons auteurs et décourager les tricheurs.

Le but des changements apportés par l’algorithme de Google visait à améliorer la compréhension de l’autorité d’un site sur un thème donné. Matt Cutt expose ainsi que les sites pornos sont plus populaires que les sites gouvernementaux en termes de trafic et d’usage. Mais personne ne fait des liens vers les sites pornos. Leur PageRank n’est donc pas comparable à celui des sites gouvernementaux, que tout le monde relie plus facilement.

L’approche du Topical PageRank est pensée pour apporter une meilleure compréhension du contenu d’un site web.

Première conclusion : On n’optimise plus une page pour 1 mot-clé ou 1 recherche ! Il faut développer une thématique sur son site qui va répondre à une variété de requêtes sur le sujet traité. L’idée ici est d’optimiser une page sur une “intention de recherche”. L’objectif étant d’être perçu par Google comme une autorité en la matière.

La littérature anglophone parle de Topical SEO et Topical authority. Voir deux exemples avec SearchEngineLand qui nous explique la “Topical Optimization” et Searchmetrics qui définit la “Topical Relevance".


En français, il n’existe pas vraiment de mot utilisé en équivalence.  On devrait parler de SEO thématique ou Thématisation SEO si on suit la définition linguistique sur Wikipedia. L’optimisation thématique ne signifie pas que vous devez couvrir un sujet en une seule page. Cela n’aiderait pas les différentes catégories de visiteurs obligés à parcourir un long document pour trouver la réponse pertinente à leur recherche. Ce qui semble en effet plus logique, en se mettant dans la perspective du surfeur, où des points d’entrées distincts répondront mieux à ses multiples intentions de recherche.

Au lieu d’optimiser un site pour des mots-clés, en espérant être classé ici ou là, on se concentre alors sur la domination d’un sujet avec des pages et des articles multiples. Chaque page cible un groupe de mots-clés corrélés concentré sur une intention spécifique d’un visiteur. L’ensemble des pages va ensuite couvrir la thématique de façon plus large.


Fig. 2. Exemple de thématiques couvertes au travers de plusieurs contenus.

Pour parler du SEO Thématique en français,on peut utiliser l’expression popularisée par Laurent Bourrelly « le cocon sémantique »  (voir ici la définition) : “Le cocon sémantique est basé sur une architecture de site web (de type siloing) alliant une structure arborescente, un maillage interne et une optimisation des contenus, conçus sur la base d'une analyse sémantique des besoins du visiteur.”

Au final, on peut trouver quatre aspects importants à cette évolution : 

  1. Développer une ligne éditoriale qui réponde aux intentions de recherches des visiteurs ciblés ;
  2. Mieux comprendre les intentions de recherches des visiteurs et la façon dont Google cherche à leur répondre ;
  3. Adapter le format des pages pour leur permettre de supporter une variété d’expressions ;
  4. Adopter une architecture interne au site web capable de structurer un thème.

Comment optimiser une page pour la rendre compatible avec une variété d’expressions ? 

Puisque désormais on travaille les pages en grappe thématique (on parle de cluster en anglais), l’optimisation “On-Page” classique n’est plus forcément garante d’une réponse claire pour gérer l’attente de Google. Comment s’assurer donc qu’il puisse associer (potentiellement) une variété d’expressions de recherche ?

On peut toujours préparer une seule requête sur une page avec un champ lexical bien choisi à chaque fois. Mais Google décidera des possibilités de variations.

Sachant qu’un groupe de pages influence la perception d’une autorité thématique, comment mesurer clairement cette influence (pour l’adapter à nos objectifs stratégiques) ?

Comment être certain que nos pages ne vont pas se faire une concurrence interne car optimisées sur des mots-clés trop proches ?

Chez Web Igniter, nous avons mis au point Mitambo, un crawler SEO Sémantique qui évalue les mots-clés dans cette perspective de SEO Thématique. Un plugin dédié au CMS WordPress (WP SearchConsole) est le compagnon qui permet de gérer le processus d’optimisation directement depuis le back-office.

Avant de vous montrer comment le processus fonctionne en pratique, il est nécessaire de présenter 3 concepts utilisés pour l’optimisation d’une page dans une perspective thématique :

  1. Le sujet
  2. La réputation
  3. La perception

Le sujet de la page

C’est un résumé des mots et des k-grammes (expressions à 2, +3 termes) optimisées pour le SEO sur une page.
Un service comme Alyze.info vous donnera gratuitement d’excellents rapports sur ces analyses pondérées par page.


Fig. 3. Un schéma représentant ce processus d’extraction et de pondération SEO
des termes principaux avec une analyse venant de Alyze.info.
.

La réputation des liens

Chaque lien renvoie plusieurs informations vers la page ciblée :

  1. Le signal sémantique principal est contenu dans le libellé de l’ancre.
  2. Un second signal sémantique vient de la proximité des sujets de chaque page (des mots optimisés sur ces pages ou des phrases dans le champs lexical).
  3. Un transfert d’autorité via le LinkJuice.

Dans la logique du PageRank classique, le lien transfère le célèbre jus de lien (link juice). Celui-ci est hérité de la popularité de la page portant le lien.  La fonction de popularité est toujours construite par l’influence des liens même à l’intérieur d’un site (notion souvent mal comprise).

La réputation des liens entrants


Fig. 4. Ce schéma représente l’influence des liens entrants sur une page qui créent la réputation des liens. Dans notre travail, nous mesurons actuellement uniquement la perception des liens entrants internes au site. A la différence des backlinks externes, Google nous laisse encore toute latitude pour jouer avec les libellés des ancres de liens..


Fig. 5. Le schéma représente l’indexation basée sur une proximité sémantique (le “phrase based-indexing” pour lequel Google a déposé un brevet). C’est certainement par cette logique d’analyse qu’il qualifie le lien entrant d’un “bonus” de pertinence sémantique..

La perception sémantique

La rencontre de la réputation des liens et du sujet de la page va déterminer un espace que nous appelons la “perception sémantique”.


Fig. 6. Couverture des espaces sémantiques. Au plus la convergence est forte, au plus grand le nombre d’expressions qui sera porté par la page..

Elle représente la liste de mots communs/proches/partagés par les deux ensembles de mots : celui des mots optimisés sur la page (le sujet) et celui de l’ensemble des liens entrants sur la page (la réputation).

Ces mots communs deviennent littéralement les “pivots” des différentes combinaisons de recherches sur lesquelles la page apparaîtra. Quand on dit “pivots”, ils peuvent apparaître parfois seul dans une expression et arriver à la porter dans les classements.

Plus de mots seront listés dans la perception, plus de possibilités de porter les variations d’expressions seront offertes.

Dans l’exemple d’une page citée plus bas voici un exemple de ces listes de mots :

Perception de la page comment, infographie, privés, seo
Sujet de la page seo, pbn, infographie, comment, privés
Réputation des liens entrants blogs, comment, privés, cela, seo, réseaux, infographie

Tout le travail de l’optimisation va ensuite se passer en trois étapes :

  1. Optimiser la page pour faire ressortir les mots centraux
    ;
  2. Travailler la réputation des liens pour venir renforcer les mots centraux qui doivent ressortir
    ;
  3. Enrichir l’apparition de variations d’expressions pour répondre à différentes intentions de recherches qui pourraient être portées par la page.

Comment fonctionne la méthode d’optimisation d’une page pour le SEO Thématique ?

Nous utilisons deux sources d’informations qui sont injectées directement dans le back-office du CMS WordPress via le plugin WP Search Console. Ces deux sources d’information sont : la Google Search Console et un outil que nous avons nommé Mitambo Search Console. Google Search Console fournit en effet une série d’informations pour un nombre important des pages de votre site. Pour compléter la partie externe à la page (réputation de liens), et parfois la partie sujet manquante (quand votre page n’est pas proprement optimisée), nous avons recours au crawler SEO Mitambo.


Fig. 7. Illustration des sources de données qui sont rassemblées pour faciliter l’optimisation des pages..

Au delà des informations sur les problématiques de crawl, Google fournit des informations précieuses sur les requêtes des internautes. Nous allons donc passer par l’API du service pour obtenir le détail des informations disponibles pour chaque URL du site ( page, article, catégorie, tag, …).


Fig. 8. Illustration des informations proposées par Google Search Console sur des requêtes..

Dans le back-office de WordPress, le plugin WP Search Console (WPSC) vient ajouter une série d’onglets dans l’édition d’une page pour simplifier la lecture des données.

Dans chaque page, article, catégorie, tags ou custom-post, vous retrouvez une structure multi-onglets qui sépare différents ensembles de données entre les mots-clés, les liens et la duplication.


Fig. 9. Illustration d’un formulaire d’édition standard dans WordPress avec la zone multi-onglets permettant d’accéder aux informations de Google et Mitambo Search Console..

Les données Google Search Console sont alors remontées dans une vue spécifique. Un bouton permet de rafraîchir les données pour toujours obtenir les informations les plus fraîches sur vos pages. L’appel passe par une connexion sur l’API que vous autorisez via votre compte WGS (connexion oAuth).


Fig 10. Exemple de requêtes avec leurs indicateurs clés..

Il n’est pas rare d’obtenir de longues listes de requêtes quand l’optimisation commence à porter ses fruits, comme sur la figure 11.


Fig 11. Illustration d’une page supportant des expressions multiples autour d’une thématique.

Les analyses de mots-clés par Mitambo

En vis-à-vis des informations remontées par Google Search Console (ou même en l’absence d’information quand une page n’est pas optimisée ou qu'elle ne dispose pas d’une autorité suffisante), une liste d’informations produites par Mitambo vous apporte un résumé des mots-clés identifiés sur les différents niveaux d’analyse : sujet de la page, réputation des liens et perception sémantique.


Fig 12. La boîte représente les différents niveaux d’informations analysés. Une évaluation de la perception, la liste des mots de la perception, du sujet et de la réputation des liens. Trois onglets apportent une vue complémentaire sur les listes de mots optimisés (mots simple, double et triple).


Fig 13. Illustration d’une liste d’expressions à 2 termes optimisés sur une page. On y retrouve la fréquence d’apparition, une densité brute et une densité pondérée sur base de l’apparition du mot dans les tags HTML.

Dans le panneau résumé, on retrouve en parallèle les 3 listes de mots-clés qui vont permettre d’orienter l’optimisation du document.


Fig 14. La ligne Sujet (topic en anglais).


Fig 15. La ligne Réputation qui vient des liens entrants (internes au site).


Fig 16. La ligne Perception qui reprend les mots pivots qui seront utilisés dans les variations de recherche. Au plus la perception propose des mots, au plus riche les variations seront possibles.

En comparant les données Google Search Console et les mots proposés par Mitambo, il est possible de jouer avec eux pour construire des variations d’expressions de recherche. Nous proposons en parallèle d’utiliser l’extension chrome SEO SERP qui va scraper la position de la page. L’intérêt de cette extension est de pouvoir réaliser ces recherches de positions tout en restant sur la page d’édition de contenu pour rester concentré sur son optimisation.


Fig 17. L’extension Chrome SEO SERP permet de travailler directement dans le contexte de la page d’édition de votre article dans le CMS WordPress.

En travaillant sur l’intention du visiteur, on peut construire des requêtes variées et vérifier les éléments manquants ou à écarter.


Fig 18. En utilisant l'extension chrome SEO SERP, on peut directement copier-coller les suggestions de mots-clés, pour valider la position de la page sans la quitter. Ici sur base des mots “Comment, Infographie, PBN, Privés, Réseaux” on peut tester une recherche comme “ Comment fonctionnent les réseaux de blogs privés infographie?”. L’extension montre que la page est N°1.

C’est dans cette phase de travail que la clé de l’optimisation au niveau de la page va se jouer.  Les 3 listes de mots peuvent être utilisées pour composer différentes recherches et valider les positions de la page.

Voici huit exemples de recherches possibles issues des 3 listes de mots suggérées par les analyses du robot Mitambo :

Perception de la page comment, infographie, privés, seo
Sujet de la page seo, pbn, infographie, comment, privés
Réputation des liens entrants blogs, comment, privés, cela, seo, réseaux, infographie


Fig. 19 et 20. Screenshots de l’extension SEO SERP avec différentes recherches basées sur les mots identifiés par le service Mitambo pour comprendre les forces / faiblesses de la page et éventuellement celles de ses principales concurrentes.

On remarquera sur les résultats de ces différentes recherches la présence du site abondance.com avec au minimum 3 URLs différentes. Avec un carton plein sur la requête #6 avec 6 URLs classées dans le top 10.

En jouant sur les différents paramètres, il est possible d’aller classer la même URL sur une variété de requêtes alors que l’on voit sur différentes SERPs certaines listes des domaines qui sont radicalement différentes.

Les positions obtenues (voire parfois une absence de position dans une SERP) permettent de chercher une optimisation supplémentaire. Exemple sur la recherche numéro 5, les termes “blog” et “privé” ne sont pas optimisés au singulier sur la page. Une amélioration de leur présence pourrait sans doute remédier à améliorer quelques positions.

Sur la recherche numéro 4, “PBN” se trouve bien optimisé sur le sujet de la page mais pas dans la réputation des liens. Un meilleur travail dans les libellés des ancres de liens permettrait aussi de venir renforcer sa position.

En quelques minutes de travail, il est ainsi possible :

  • D’évaluer différentes requêtes ;
  • De réfléchir sur l’intention du visiteur que l’on souhaite cibler pour trouver des pistes d’amélioration soit pour du contenu sur la page, soit pour le libellé des liens, soit encore pour de phrases de contenus sur les pages reliantes.

La bonne nouvelle est que vous pouvez modifier rapidement des contenus déjà classés pour étendre la couverture de leur variété d’expressions de recherches. La prise en compte des effets est très rapide.

L’autre bonne nouvelle est liée à votre thématique : si vous reliez correctement les pages par thématique avec la condition qu’elles soient toutes optimisées, alors votre effet de levier est encore plus grand.


Fig. 21. Un exemple d’impact sur le trafic d’un site après avoir restructuré plusieurs
groupes de pages sur un volume total de 472 pages indexées par Google.


Fig. 22. La vue Semrush sur l’impact du maillage thématique du même site de 474 pages.
Ici, on a multiplié par 3 le nombre de requêtes trouvées par le service semrush sans créer de nouveaux contenus.

Un résumé rapide des liens sur une page permet également de percevoir son niveau d’autorité dans le graphe du site.


Fig. 23. Résumé des liens : total des liens entrants, liens sortants et une valeur du PageRank interne au site.

Avec l’exemple montré plus haut sur l’infographie parlant des réseaux de blogs privés (PBN), nous avons une page qui ne reçoit que 5 liens internes et en génère 66.

La valeur calculée du PageRank interne est relative au site. Elle permet de travailler sur le graphe interne pour identifier ses points clés.

Dans le cadre de notre exemple, nous avons une page qui n’a pas réellement une autorité particulière. Son pageRank interne est faible, ce qui ne l’empêche pas d’aller se classer sur une variété d’une petite dizaine de recherches. Sur une zone plus compétitive, la construction de son autorité serait indispensable.

L’intérêt de cet exemple permet d’illustrer que le SEO THÉMATIQUE est vraiment indépendant de la mesure de l'AUTORITÉ de la page.

Liens entrants

Comme on l’a vu plus haut, les liens sont importants pour transférer autant l’autorité que la pertinence du contenu (réputation des liens). Nous avons donc besoin de différentes informations pour obtenir des informations sur les optimisations ultérieures à produire sur ces pages “liantes”. Toutes les pages liées à la thématique auront une priorité d’attention.


Fig. 24. Détails de la liste des liens entrants reprenant l’ancre des liens, le type de liens, et des informations de la page d’origine : le titre,  sa perception et son sujet ainsi que l’état no-follow du lien.

Les données fournies dans cette vue permettent de comprendre la pertinence thématique des liens envoyés vers la page.

Conclusion

Avec l’obtention d’informations sur les trois zones-clés de l’optimisation du contenu (le sujet, la réputation et la perception) et les détails sur les liens entrants (libellés + contexte des pages), vous disposez d’une vue très précise sur l’état de chaque page.

Les exemples de recherche de requêtes, avec l’extension chrome SEO SERP, vous ont montré qu’il était possible d’obtenir rapidement des suggestions sur les variations de recherche à intégrer sur votre page.

Le travail pour identifier ces recherches ne s’arrête évidemment pas à une improvisation de quelques minutes. L’analyse détaillée des SERPs permet d’observer ce que Google propose (le type et la longueur de contenu - images, vidéos, … - et les données structurées utilisées)).

Différents services gratuits comme AnswerThePublic,  SearchIntent ou payants comme SemRush, Ahrefs, Majestic … vous apporteront des moissons d’idées sur les expressions à travailler.


Fig. 25. Analyse visuelle proposée par le site AnswerThePublic sur la requête Chaussure Homme. Le site fournit des variations de requêtes structurées par petits groupes.

En surveillant l’évolution des requêtes sur Google via un service comme semRush, vous découvrirez rapidement la progression du nombre de nouveaux mots-clés des classements et le nombre de clics obtenus dans les SERPS (pages de résultats). Bon travail !

Voulez-vous aller plus loin?

Actuellement le service décrit dans cet article existe pour le CMS WordPress via l’installation d’un plugin dédié.

N’hésitez pas à nous contacter si vous avez une demande particulière sur d'autres plateformes.

Liens de téléchargement :


François Lamotte, directeur de la société Web Igniter, éditrice des solutions Mitambo, WP SearchConsole et Decisive Metrics (https://www.mitambo.com/)