En février 2012, plusieurs sites web ont repris les mots d'Amit Singhal, grand prêtre de l'algorithme de pertinence de Google, expliquant que le moteur de recherche allait fortement sémantiser ses résultats dès cette année et répondre directement, dès l'affichage de la SERP, aux questions posées par les internautes et comprises par Google. Mais comment Google a-t-il mis en place ces algorihmes sémantiques et quelle sera leur portée en termes de SEO ? Cet article, en deux parties, explique le concept d'un moteur de recherche sémantique et analyse la façon dont Google pourrait bien fonctionner dans les mois qui viennent. Une petite révolution semble bien se préparer dans le domaine du SEO...

Cet article fait partie de la Lettre Réacteur #137 du mois de mai 2012

Début de l'article :

Le mois dernier, nous avons initié cet article sur les projets à court terme de Google en tant que moteur de recherche sémantique. Nous avons passé en revue les objectifs d'un tel moteur, ses limites, les premières expériences disponibles en ligne avant d'explorer le fonctionnement de ces outils.

Nous continuons, donc, au travers de cette seconde partie, à explorer la façon dont Google pourrait intégrer la sémantique dans son moteur d'ici quelques semaines...

Le tournant : le rachat de Metaweb

Le rachat de la société Metaweb par Google en juillet 2010 (http://www.abondance.com/actualites/20100719-10404-google-acquiert-metaweb-et-freebase-base-de-donnees-dentites-nommees.html) a clairement accéléré le rythme avec lequel Google a pu préparer son évolution (même partielle) vers un moteur sémantique.

Metaweb est la société éditrice du site Freebase (http://www.freebase.org/), une initiative qui permet à des contributeurs d'enrichir une base de données publiques sur des entités diverses et variées. Lors du rachat de sa maison mère par Google, Freebase contenait déjà des informations sur 12 millions d'entités, soit quatre fois plus que la version anglophone de Wikipedia. Metaweb intéressait également Google pour son savoir-faire dans le domaine de l'indexation des faits, des concepts, et en particulier la découverte des entités nommées. Depuis lors, Google a réussi à augmenter la taille de son graphe de connaissances, pour atteindre un chiffre de 200 millions d'entités nommées. ...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).