Il va de soi qu'une stratégie de contenus cohérente et de qualité est indispensable dans le cadre d'un projet SEO. Mais ce contenu intervient à plusieurs niveaux au sein d'un algorithme de moteurs de recherche, depuis la détermination de l'intention de recherche jusqu'à l'écriture, bien sûr, mais aussi la lutte contre le spam, le maillage interne ou la popularité (PageRank). Il faut donc donner aux moteur (et à l'internaute) ce dont il a besoin pour apprécier vos textes. Et ce n'est pas obligatoirement si évident...

 

Il y a environ un mois nous avons présenté avec Guillaume (Peyronnet) un exposé lors de la conférence SMX Paris sur le sujet de la stratégie de contenu « parfaite » pour le SEO. Au-delà de la promesse un peu survendue de son titre, le sujet à été apprécié et c’est tout naturellement qu’est venue l’idée d’en parler au profit des abonnées de la lettre Réacteur.

Pourquoi est-il nécessaire de travailler ses contenus pour le SEO ?

Quand on ne travaille pas dans le domaine du SEO, on ne comprend pas forcément pourquoi tout le monde parle de contenu SEO et pas de contenu tout court. Bien entendu un bon contenu, pensé par et pour l’humain, est ce que l’on voudrait voir se positionner dans l’idéal dans les premiers résultats des moteurs de recherche. Mais on s'aperçoit parfois que ce n’est pas tout à fait le cas, et il y a des raisons à cela.

Où sont utilisés les contenus dans le moteur ?

 

La figure reprend le schéma - bien connu - du fonctionnement d’un moteur de recherche. Sur ce schéma, sont mis en évidence les endroits où les contenus sont utilisés d’une manière directe ou indirecte par l'algorithme pour contribuer au calcul des signaux de classement.

Pour la pertinence, c’est évident. Mais pour les autres briques du moteur, c’est peut-être moins intuitif.

Ainsi, les contenus sont utilisés pour le calcul de la popularité : plus les contenus de la page source d’un lien et ceux de la page cible sont compatibles entre eux, plus le transfert de popularité est important. C’est l’idée qui se cache derrière la notion de pagerank thématique (voir la référence [1] par exemple). Les contenus sont également très importants dans le cadre de l’analyse qui en est faite par les algorithmes anti-spam.

Enfin, et c’est sans doute ce qui est le moins connu, les contenus (une partie au moins) sont importants pour l’algorithme de learning-to-rank, qui est celui qui “fabrique” le classement tel qu’on le voit. Cet algorithme utilise l’interaction entre les utilisateurs et la SERP, celle-ci contenant des parties du contenu des pages web.

Par ailleurs, nous avons montré dans une étude, réalisée il y a quelques temps pour l'événement Seo Garden Party, qu’en ce qui concerne les contenus, il existe quatre signaux qui ne sont pas corrélés entre eux : la qualité des textes (grosso modo la diversité du vocabulaire), l’intention portée par les contenus (mesurée avec BERT par exemple) et le niveau d’optimisation et le risque de suroptimisation (mesurés avec yourtext.guru dans le cadre de cette étude). Cela implique qu’il faut travailler indépendamment ces quatre aspects dans le cadre d’une stratégie de contenu sérieuse.

Qu’est-ce que le contenu sur le web ?

Une autre subtilité en matière de contenu pour le SEO est le périmétrage de ce que l’on va appeler contenu. Pour le dire rapidement, le contenu d'une page web pour le moteur est un entre-deux entre le contenu que l’être humain a envie de lire (par exemple l’article dans le cas d’une page d’un site de presse) et la totalité de la page visible. Cet entre-deux est à la fois involontaire (déterminer ce qui est important à l’aide d’un algorithme n’est pas une tâche facile) et volontaire (il existe de l’information en dehors du contenu que l’être humain regarde).

Le rédacteur humain occulte souvent cet aspect et se concentre uniquement sur le texte au cœur de la page, tandis que le SEO a lui bien conscience que les à-côtés sont importants.

Le SEO n’oubliera pas non plus que les textes d’ancres des liens qui sont faits vers une page sont importants et contribuent au contenu de cette dernière.

Une fois fixé tout cela, nous pouvons définir ce qu’est une stratégie de contenu efficace.

Schéma de principe de la stratégie de contenu “idéale” pour le SEO

La stratégie de contenu et ses leviers

 

Commençons par décrire à gros grains ce schéma de principe :

  1. Tout d’abord il faut, une fois fixée la thématique que l’on va adresser, déterminer les intentions exactes que l’on vise. En effet, Google est maintenant capable, via des algorithmes comme BERT, de mieux comprendre les intentions exprimées par les internautes via une requête, il est donc important de viser la bonne intention lors de l’écriture d’un contenu.
  2. Ensuite, nous vous proposons de réfléchir à l’avance à l’insertion de votre contenu dans son écosystème, il s’agit donc de bien réfléchir au maillage interne. Cela impose soit de trouver les pages de votre site qui sont les plus à même d’être mise en avant dans votre contenu, soit de créer des contenus connexes en même temps que vous rédigez votre contenu principal.
  3. La troisième étape est beaucoup plus balisée : il s’agit d’écrire votre contenu, en s’assurant qu’il est suffisamment optimisé pour le moteur de recherche.
  4. Ensuite, il faut s’assurer de la qualité au sens algorithmique du terme. Cela veut dire vérifier que vous n’avez pas de duplication à l’interne de votre site à cause de vos contenus (pour cela vous pouvez utiliser des outils comme Babbar.tech, Oncrawl ou Screaming frog, par exemple), mais aussi s’assurer de la bonne tenue statistique de votre prose. Il n’existe pas d’outils publics pour cela à notre connaissance, mais il s’agit essentiellement de s’assurer de ne pas faire de keyword stuffing, d’avoir des phrases qui soient contextuellement cohérentes entre elles et d’avoir une bonne diversité de vocabulaire.
  5. Il faut s’assurer d’avoir des backlinks avec des ancres optimisées, et en proportion raisonnable. C’est un critère déterminant pour les pages qui ont vocation à être dans les trois premières de la SERP. Le placement des liens dans les pages n’est pas toujours évident, vous pouvez maintenant vous faire aider par des briques logicielles open-source comme RAKE ou Textrank par exemple (voir la référence [2])
  6. Le dernier point est lié à ce que l’on appelle au learning-to-rank. Il s’agit ici de créer une belle attractivité vers ses contenus au niveau de la SERP, et donc pour cela faire un travail de qualité sur la rédaction des balises Title et de la meta "description" pour avoir un snippet le plus attractif possible. Il s’agit également d’avoir une UX qui crée de la rétention : il faut faire en sorte que les visiteurs restent sur votre site.

Maintenant que nous avons vu le schéma, voyons quelques uns des points plus en détail (nous ne les passerons pas tous en revue).

Trouver la bonne intention

Avec l’arrivée d’algorithmes comme BERT, la notion d’intention de la requête et d’un contenu est devenue très à la mode. La plupart du temps les SEOs vont s’arrêter à considérer un sujet et une intention primaire assez large (généralement on en décrit quatre : informationnelle, navigationnelle, transactionnelle et commerciale). On dira ainsi qu’une requête parle de machine à café et d’achat, ou de barbecue et d’information sur les recettes qu’on peut faire sur cet ustensile de cuisson, etc.

Mais en pratique il y a beaucoup d’intentions différentes qui peuvent être mises en avant. La référence [3] présente de nombreuses informations sur ce sujet. Les auteurs de cet article évoquent ainsi la thématique, le type de ressource recherchée, l’aspect informationnel, transactionnel ou commercial, la spécificité de la requête, sa sensibilité spatiale et temporelle, etc. Autant d’aspects qui permettent de créer des intentions de recherche de plus en plus fines.

En matière de SEO, il n'est pas nécessaire d’aller si loin. Mais on peut néanmoins conseiller une approche pragmatique, dans laquelle on verbalise une question à laquelle on va répondre dans le contenu, assurant ainsi que chaque texte répondra à une ou plusieurs intentions très claires. Pour cela on va formuler une question à l’aide d’une phrase interrogative dans l’action, avec un mot porteur d’une intention claire. Cela donnera des phrases comme « où acheter une machine à café pas chère » ou encore « comment allumer son barbecue ».

Il est important de noter que le choix d’une telle intention aura toujours un impact sur le vocabulaire à utiliser. Il n’y a par exemple que très peu de proximité de vocabulaire entre un texte qui explique comment détartrer une machine à café et un autre qui dévoile les meilleures adresses des magasins de café.

Si vous voulez vous assurer que vos textes sont bien compris, il y a une astuce : il suffit de créer des paragraphes qui correspondent à des PAA, les fameuses People Also Ask (questions connexes) proposées par Google lorsqu'on tape une requête.

Réfléchir au maillage interne

 La réflexion sur le maillage interne est à la fois intuitive et complexe. L’idée est de faire des liens en plein texte entre des pages qui sont proches sémantiquement. C’est une tâche que l’on peut réaliser facilement en tant qu’être humain lorsqu’un site web est de petite taille. Mais dès que l’on a des milliers de pages c’est quasiment impossible, et l’automatisation rentre alors en jeu.

Calcul de proximité sémantique par l'outil YourTextGuru

 

Il existe plusieurs manières de faire. La figure ci-dessus illustre une première méthode : on calcule la proximité en terme de vocabulaire attendu pour plusieurs requêtes, et on fait des liens entre les pages qui concernent les requêtes les plus proches. Dans le cas présenté ici, si on a une page sur le mélange de whisky (avec du coca par exemple, snif), alors le meilleur lien interne qu’on puisse faire va pointer vers un page parlant de cocktails à base de whisky.

Mais cette méthode n’est pas la seule, on peut également utiliser des outils logiciels comme Word2vec, FastText ou BERT pour calculer la distance sémantique entre les requêtes et ainsi trouver les meilleurs liens. Les résultats seront du même type, mais nécessitent un peu de programmation pour les automatiser soi-même (pour en savoir plus, la référence [4] est très adaptée).

Une fois qu’on a choisi son sujet, l’intention fine et le maillage à réaliser, il s’agit d’écrire le texte, c’est au final la tâche la plus simple de toutes.

Ecrire le texte

On peut trouver une abondante littérature sur le sujet de l’écriture de textes de bonne tenue, percutants et pertinents, pour le Web. D’un pur point de vue SEO, dès qu’on répond suffisamment à l’intention de la requête, au besoin informationnel comme on dit, il s’agit d’optimiser le texte pour être le plus dans l’attendu du moteur. Pour cela, il existe de nombreux outils qui peuvent vous aider.

Étant co-créateur de l’un d’entre eux (je vous laisse deviner lequel), j’ai bien entendu une préférence. Mais il en existe d’autres et l’objectif de cet article n’est pas de se lancer dans un comparatif.

Gardez cependant à l’esprit un point crucial : les outils sont là pour aider l’humain. Ils ont un avantage, c’est leur largeur et leur profondeur de vue : ils ont la capacité à calculer des relations entre les mots, les concepts, que les humains ne peuvent pas appréhender. Mais in fine, la décision de mettre un mot, de rajouter du contexte, bref les choix d’écriture, est vôtre. Pour faire une analogie, l’outil sémantique est au rédacteur web ce qu’est une visseuse-dévisseuse à un cuisiniste : on peut faire sans, mais c’est vraiment plus compliqué !

Nous n’allons pas aborder ici le sujet de la qualité particulièrement, mais soyez attentifs à faire des textes qui sont suffisamment qualitatifs pour que le moteur ne les pénalise pas. Évitez les répétitions de mots abusives, évitez les phrases creuses, ne meublez pas avec des contenus empruntés ailleurs.

Concernant les liens qui vont être faits vers d’autres pages du site, choisissez bien vos ancres pour qu’elles renforcent les contenus des pages liées. Mais n’abusez pas trop, il faut éviter d’avoir uniquement des ancres exactes optimisées qui pointent toutes vers une même page. C’est un signal de manipulation pour le moteur. Dans une opération de netlinking externe, on donne généralement des bonnes pratiques en termes de pourcentages à ne pas dépasser, mais à l’interne cette notion n’a pas trop de sens et il s’agit surtout de rester raisonnable.

Optimiser finement le snippet

Enfin, la dernière étape sur les contenus d’une page web est d’optimiser ce que va donner le snippet au niveau de la SERP. Nous n'allons pas nous lancer dans un article sur comment faire techniquement un bon snippet, c’est un sujet déjà très bien abordé par de multiples articles d’Olivier avec à chaque fois de très bons conseils (par exemple la référence [5] avec une conclusion intéressante sur la taille de la meta description pour le snippet).

Il faut simplement garder à l’esprit que l’objectif est de faire cliquer, il faut donc être très attractif, et mettre des CTA (Call To Action) les plus percutants possible.

Ce n’est pas toujours facile, en premier parce qu’il est souvent difficile de comprendre ce qu'attend le visiteur, et aussi parce qu’écrire des textes très courts et attractifs est un métier à part entière (un peu comme l’écriture de slogans publicitaires). Une solution pour pallier ce problème est de s’inspirer largement des publicités affichées par Google. Ce dernier prenant en compte la performance des publicités en compte pour l’affichage, il y a fort à parier qu’un snippet qui s’inspire d’une publicité Google Ads sera lui aussi performant.

Conclusion

Voilà, vous savez tout ou presque maintenant du principe d’une stratégie de contenu pour le SEO. Bien entendu il faut vous approprier la démarche, l’adapter à votre thématique et à vous et vos équipes, dans le but de produire facilement du contenu performant en termes de SEO.

Et n’oubliez pas, un bon contenu ne fait pas tout, mais est toujours nécessaire !

Références

[1] https://www.reacteur.com/2015/09/le-pagerank-thematique-a-lorigine-du-cocon-semantique.html

 

[2] http://www.tiernok.com/posts/automated-keyword-extraction-tf-idf-rake-and-textrank.html

 

[3] Calderón-Benavides, L., González-Caro, C., & Baeza-Yates, R. (2010). Towards a deeper understanding of the user’s query intent. In SIGIR 2010 workshop on query representation and understanding (pp. 21-24).

 

[4] https://openclassrooms.com/en/courses/6532301-introduction-to-natural-language-processing/6980911-discover-the-power-of-word-embeddings

 

[5] https://www.abondance.com/20210916-46243-google-ne-rallonge-plus-ses-snippets.html

 

 

 

Sylvain Peyronnet, concepteur de l'outil SEO Babbar.