Dans cette lettre, nous avons déjà parlé de 2 CMS majeurs (WordPress et Joomla!) et de leurs interactions avec le monde du SEO. Assez logiquement, nous allons traiter, dans cette série de deux articles, d'un autre CMS très utilisé sur le Web, à savoir Drupal. Le mois dernier, nous avons décrit la meilleure façon de configurer l'installation de base afin de le rendre réactif aux moteurs de recherche ? Ce mois-ci, la seconde partie de cet article vous explique comment améliorer les performances du site, créer un maillage interne optimal entre ses pages, mais aussi comment choisir et construire un modèle de page "SEO inside", tout en finissant avec la description de deux modules indispensables au bon référencement de votre source d'information...

Cet article fait partie de la Lettre Réacteur #131 du mois de novembre 2011

Début de l'article :

Dans l'article du mois dernier, nous avons fait le tour des paramétrages et des modules nécessaires pour rendre Drupal compatible SEO. Mais il reste encore du travail à faire pour :
- Optimiser les performances ;
- Créer un maillage interne optimal ;
- Choisir ou construire un modèle de page (template) compatible SEO.

Aujourd'hui, nous allons donc développer ces trois sujets, et nous terminerons en examinant un problème spécifique à la version 7 de Drupal, ainsi que les possibilités apportées par deux extensions extrêmement puissantes : Open Calais et SolR.

Mais avant d'aller plus loin, il faut s'attarder sur un point qui peut s'avérer fâcheux pour un site qui peut espérer du trafic en provenance de Google Images.

Débloquer le référencement des images dans Drupal 6

Ceux qui ont conçu le robots.txt par défaut dans Drupal 6 sont partis du principe que les webmasters ne souhaitent pas que leur contenu (y compris les images) soient "scrapé" ou copié.

Le répertoire /sites/ est donc placé dans une ligne « disallow: » du fichier robots.txt.
Le répertoire « images » par défaut se situe dans le répertoire /sites/, ce qui signifie qu'aucun crawler n'aura accès aux images, a fortiori le crawler spécialisé « images » de Google.

Ce problème a été corrigé dans les versions les plus récentes de Drupal 6 et Drupal 7 (versions postérieures à la 6.20), en débloquant le crawl de /sites/. Mais si vous disposez d'une version plus ancienne de Drupal, et si vous voulez permettre aux crawlers d'accéder à vos images, il faut ajouter les lignes suivantes au robots.txt :

...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).