EntityCube est un moteur de recherche basé sur les entités nommées et créé par les équipes chinoises de Microsoft. Bien que certaines possibilités ne semblent pas fonctionner encore et que la langue française ne soit que partiellement prise en compte, l'outil est prometteur et permet de mettre en relation de nombreuses informations structurées pour mener à bien une veille de qualité. Un outil à tester absolument...

Début de l'article :

Après l'Egypte et Kngine le mois dernier, nous vous proposons de continuer ce tour du monde improvisé des moteurs innovants avec EntityCube (http://entitycube.research.microsoft.com), un moteur de recherche et d'exploitation des contenus web développé par les équipes chinoises de Microsoft et issu d'un projet en langue chinoise déjà opérationnel, baptisé Renlifang (http://renlifang.msra.cn/).

Comme son nom l'indique, EntityCube est un moteur qui travaille à partir des entités nommées. La version actuelle, qui est une bêta, exploite déjà (d'après ses créateurs) 3 milliards de pages web. Des créateurs qui s'expriment d'ailleurs assez peu. On saura juste grâce à la page "About" qu'"EntityCube génère des résumés de milliards de pages web publiques contenant des informations relatives à des personnes, des lieux et des organisations et permet d'en explorer les relations". Sans équivoque.

Pour tester l'outil et afin d'être certains d'avoir des résultats dans l'actualité, nous avons décidé d'utiliser le nom de "Leon Panetta", l'actuel directeur de la CIA.
Première constatation : en ne tapant que le nom propre de celui-ci, la page de résultats d'EntityCube propose de désambiguïser le nom. Normal pour un moteur sémantique mais toujours appréciable...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).