La problématique des lettres accentuées est souvent oubliée par les concepteurs de sites web en termes de référencement. Or la plupart des moteurs ne prennent pas en compte de la même façon un mot avec des lettres accentuées ou non. Quels sont les différents types d'encodage ? Lequel utiliser : Iso-8859-1 ou UTF-8 ? Que veulent dire ces termes ? Comment faire en sorte que les spiders comprennent parfaitement vos mots accentués ? Voici quelques pistes de réponse...

Préambule

Dans une stratégie de référencement naturel, le choix de la sémantique reste très important et peut déterminer la réussite d'une campagne de promotion. Faut-il utiliser les mots clés avec accents ou non dans le cadre de cette stratégie ?

L'utilisation des accents n'est, en effet, pas sans poser de problèmes. A la lecture des forums de discussion spécialisés, les questions concernant des « caractères qui s'affichent mal » reviennent très souvent. Les solutions résident  dans la compréhension de termes spécifiques comme ASCII, ISO 8859-15 ou encore UTF-8. Quelles sont les difficultés liées à l'encodage ? Comment faire pour connaitre l'encodage d'un site ? Quels sont les différents types d'encodage existant sur le marché ? Quel encodage vaut-il mieux choisir dans le cadre d'une stratégie de référencement ? Cet article tente d'éclaircir la notion d'encodage et de jeux de caractères.

Les moteurs de recherche prennent-ils en compte les accents ?

Lors d'une recherche dans un moteur de recherche, les résultats sur une requête dépendent de nombreux paramètres comme la localisation géographique (basée notamment sur l'adresse IP…), mais aussi de la personnalisation de l'interface de recherche.

Les accents prennent de plus en plus d'importance aux yeux des moteurs de recherche, afin de rendre exhaustifs les résultats issus de la recherche. L'intention de l'usager peut être différente s'il cherche avec ou sans accent.

Lors d'une recherche avec et sans accent sur Google, les requêtes « séjour » et « sejour » donnent un nombre de résultats identique (plus de 40 millions). Cependant, l'organisation des résultats, leur ranking, est différent. Que faut-il choisir entre l'un et l'autre ? Il est difficile de donner une réponse ferme. Varier la forme des mots en utilisant des requêtes avec accent et sans accent peut être, au final, la meilleure solution. En effet, les internautes peuvent, invariablement, taper les mots clés de façon accentuées ou non (il semblerait cependant que, selon certaines études, ils aient une prédilection pour les saisir non accentués). Petite astuce en passant : si vous désirez afficher une version non accentuée d'un mot dans vos pages tout en ne désirant pas montrer ce qui pourrait ressembler à une faute de frappe, affichez le terme en majuscules. Un mot non accentué en capitales passe toujours mieux que sa forme en minuscules... Et la casse (minuscules/majuscules) n'a pas d'importance pour un moteur de recherche...

En prenant en compte ces considérations, le choix d'un mot clé accentué ou non prend toute son importance. Quelles répercussions cela aura–t–il pour un site web ?

Quelles sont les contraintes liées à  l'encodage ?

Voici l'exemple d'un texte présent sur une page web :

Un grand choix de séjours
Découvrez tous les séjours en Corse
Partez dès à présent en Corse, nous vous proposons des séjours à Bastia, des séjours à Calvi, toute l'île de beauté à découvrir.

Afin de pallier à tout problème d'affichage entre les navigateurs, il n'est pas rare de voir une page contenant les accents codés en HTML (cf le tableau ci-dessous) :


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).