Une bonne stratégie SEO passe, on le sait, par un contenu de qualité écrit pour l'internaute mais également compréhensible par une machine et, donc, un moteur de recherche comme Google. Pour cela, la mise en place de corpus lexicaux est une phase indispensable et de plus en plus utilisée par de nombreux référenceurs. Mais comment ces corpus sont-ils créés et à quoi servent-ils ? Voici un article, en deux parties, qui a pour ambition de répondre à ces questions. Après les bases le mois dernier, voici ce mois-ci une plongée dans les différents types de corpus avec l'exemple concret de l'un d'entre eux...

Début de l'article :

Nous reprenons ce mois-ci la suite de notre article sur les corpus et leur utilisation en référencement. Après les définitions et l'explication des grands concepts dans la première partie, le mois dernier, intéressons-nous ce mois-ci aux différents types de corpus utilisés dans le cadre d'une stratégie SEO.

Les différents types de corpus pour le SEO

Pour fabriquer un guide d’aide à la rédaction, tout commence, vous l’aurez compris maintenant, par la création d’un corpus. Mais, quels documents va-t-on récupérer pour fabriquer ce corpus ?
Il existe deux principaux cas d’usage :
• Si vous souhaitez faire en sorte que vos textes soient reconnus comme appartenant à une thématique très précise, alors le corpus à fabriquer doit intégrer des sites de référence de la thématique.

Vous les connaissez certainement, il s’agit de sites particulièrement reconnus pour leurs qualités et leur popularité.

Il s’agit alors de récupérer le contenu de ces sites, ce qui, de fait, créera un corpus thématisé.

Une machine lisant des articles respectant les « règles » de ce corpus pourra sans difficulté en comprendre la thématique.
• Si vous souhaitez rédiger un texte sur une problématique précise, ou optimisé pour une requête particulière, il s’agira alors plutôt de récupérer des pages web qui évoquent cette même problématique ou des pages déjà optimisées pour la requête.

Pour trouver de tels textes, l’utilisation d’un moteur de recherche est satisfaisante : on tape la requête ou la problématique dans la boite de recherche, tout simplement.

L’essentiel est ensuite d’extraire des pages de résultats des URL et d’ajouter les pages liées à votre corpus.

Un corpus de requête est beaucoup plus simple à fabriquer qu’un corpus thématique complet car on ne va, dans le premier cas, récupérer qu’une poignée de documents, et dans le second cas analyser des sites complets.
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).