semantique

Le Knowledge Graph, basée sur l'outil Freebase, a été lancé il y a deux ans par Google et permet au moteur de recherche, par détection d'entitées nommées, de fournir directement des réponses à certaines requêtes informationnelles. Mais un nouveau concept, imaginé pour combler les lacunes du Graph, est en train de se mettre en place dans les laboratoires de recherche de la firme de Mountain View. Ce Knowledge Vault n'en est encore qu'à ses balbutiements mais il n'en est pas moins prometteur...

Début de l'article :

Le 16 mai 2012, Google annonçait sur son blog le lancement d’une nouvelle fonctionnalité qui marquait un tournant dans l’histoire du moteur de recherche : le Knowledge Graph (http://www.abondance.com/actualites/20120521-11478-knowledge-graph-google-officialise-son-moteur-semantique.html). Ce « graphe des connaissances » était présenté comme une immense base de données de faits qui permettrait à Google d’afficher directement toute une série d’informations utiles sur sa page de résultats.

Deux ans plus tard, il semble que Google ait atteint les limites permises par les techniques utilisées par le Knowledge Graph. La base de faits couvrant une partie limitée des informations cherchées par les internautes, Google cherche donc à l’étendre en utilisant des techniques plus sophistiquées. Cette nouvelle approche, Google l’a baptisée « Knowledge Vault » (http://www.abondance.com/actualites/20140902-14231-knowledge-vault-futur-recherche-google.html), et elle risque de changer radicalement le fonctionnement du moteur sur de nombreuses requêtes et dans de nouveaux cas d’utilisation.

Mais commençons par rappeler ce qu’est le Knowledge Graph, et pourquoi il a vite atteint ses limites.

Le « Knowledge Graph » et la réponse instantanée sur les requêtes informationnelles

Traditionnellement, on sépare les requêtes des internautes en trois grands types :
- Les requêtes navigationnelles (trouver l’URL d’une page bien déterminée. Exemple un utilisateur qui cherche la page d’accueil du Monde.fr, ou un post particulier sur un blog).
- Les requêtes transactionnelles (télécharger un logiciel, acheter un produit…).
- Les requêtes informationnelles (rechercher une information sur le Web : ces requêtes sont les plus fréquentes).
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).