Le 3 juin 2011, Google/Bing/Yahoo! rendaient public schema.org, un format commun de balisage de données ("Rich Snippets"/"Contenus enrichis"), à intégrer dans les pages HTML. Trois jours plus tard, la plate-forme e-commerce Raynette intégrait ce balisage dans les boutiques en ligne de ses e-commerçants. Pourquoi ? Comment ? Voici le détai et la chronologie de cette mise en place, qui contitue un bon exemple des atouts de de format sémantique pour obtenir un meilleur référencement à l'avenir...

Cet article fait partie de la Lettre Réacteur #128 des mois de juillet-août 2011

Début de l'article :

Rappel sur schema.org

Les moteurs de recherche, dans leur quête d'une meilleure compréhension du contenu des pages web qu'ils indexent, et d'un affichage des résultats plus pointus, se sont accordés sur un format pour baliser les informations des pages web, avec le format décrit sur http://www.schema.org/. Schema.org est l'héritier des "rich snippets" de Google, dont il a été souvent question dans cette lettre les mois précédents.

Ce format permet d'indiquer à un robot, à l'intérieur d'une page HTML, les caractéristiques d'un produit à vendre, d'une personne, d'avis clients, d'une recette de cuisine, etc. La liste des types de données balisables est indiquée sur http://www.schema.org/.

Pourquoi intégrer la balisage de schema.org sur les boutiques Raynette ?

Affutez vos sens et levez votre nez du côté du référencement... Ne sentez vous pas que le web se dirige lentement mais surement vers une structuration des données contenues dans les pages web (le web "sémantique") ?

- Google Panda veut favoriser les contenus originaux, et mettre en queue de peloton les fermes de contenus ou autres contenus dupliqués. Et pour faire le tri entre le bon grain et l'ivraie, de quoi a besoin Google ? Notamment de bien comprendre le contenu des pages web qu'il indexe. Le balisage du contenu des pages web lui est d'une aide précieuse, et est votre ami : il permet de vous faire bien comprendre de Google pour sortir du lot.

- HTML5, qui arrive à grands pas, comprend notamment de nouvelles balises permettant de distinguer les sections de haut et bas de page, de navigation, et la partie de contenu même des pages web. HTML5 permet de baliser les sections d'une page web pour décrire leur contenu. HTML5 a même prévu des attributs pour baliser le contenu des pages. (ex: telle section décrit -itemscope- quelque chose du type -itemtype- "artiste-en-herbe", et tel texte est sa propriété – itemprop- nom, tel autre est l'âge de son capitaine, etc).

...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).