Les données structurées permettent depuis de nombreuses années d’améliorer la compréhension du contenu des pages Web pour les machines (dont les crawlers). Elles jouent un rôle crucial dans le web sémantique, et permettent également l’apparition de résultats enrichis dans les pages de résultats de certains moteurs de recherche (dont Google, Bing, et d'autres moteurs).

Avec de nouveaux types de données structurées pris en compte ces derniers mois par Google, et avant d'aborder la façon dont elles se construisent (en mettant l'accent sur des aspects plus avancés comme les données imbriquées, et la compréhension des sous-types que nous verrons dans un prochain article), revenons sur la naissance des données structurées.

 

La naissance des données structurées

Rendre la donnée exploitable par les machines

Si l’on remonte un peu le temps, il faut aller chercher du côté des années 2000, quand Tim Berners-Lee (principal fondateur du web et du W3C) évoque le web sémantique, avec l’intention de rendre les données du web interprétables non seulement par les humains, mais aussi par les machines.

L'objectif est de permettre aux ordinateurs de traiter les informations de manière plus intelligente via le TAL (traitement automatique des langues), grâce à l'usage des ontologies qui jouent un rôle crucial, en établissant un modèle sémantique pour définir les relations entre différentes entités nommées (personnes, lieux, choses). Ces ontologies fournissent une structure qui permet de représenter des connaissances sous forme de concepts au sein d'un domaine, ainsi que les interactions entre ces concepts, tandis que les entités nommées sont des exemples concrets de cette connaissance dans des données réelles.

Par exemple, dans une ontologie dédiée à la géographie, les entités nommées comme "Paris" ou "France" peuvent être classées respectivement comme une "Ville" et un "Pays", avec des relations spécifiées par l'ontologie.

Ontologie de l'automobile

Fig. 1 - Ontologie de l'automobile - https://www.researchgate.net/figure/The-Example-of-Vehicle-Ontology_fig1_221194194

C'est dans ce contexte que l'initiative schema.org est née pour mieux structurer l'ensemble des ces concepts et des entités associées sur le web.

La suite de cet article est réservée aux abonnés.

 

Aymeric Bouillat
Consultant SEO senior & expert technique - Y'a pas de quoi !