L'outil IBM Watson News Explorer permet, au travers d'un travail sur les entités nommées, de mettre en place une veille sur les noms de personnes, d'entreprises ou de lieux notamment, et d'en extraire les liens entre eux. Malgré un manque de mise à jour et d'évolution de ses principales caractéristiques, il reste un outil à tester dans une démarche de veille économique et technologique. En voici ses principales fonctionnalités...

Par Christophe Deschamps


Le service en ligne Watson News Explorer (http://news-explorer.mybluemix.net/) a été lancé par l'IBM Research Visual AI Lab en juillet 2015 mais est resté étonnamment discret malgré son intérêt évident en termes de fouille d'actualités.

Il ne s'agit pas d'un moteur de recherche au sens traditionnel, mais bien d'un outil qui va vous aider à trouver des connexions entre des milliers d'articles de presse grâce à la reconnaissance d'entités nommées. On  peut définir une "entité nommée" comme « une unité lexicale (un mot, ou un groupe de mots) qui fait référence à une entité (une chose, une personne, un lieu, une date, une mesure...) du monde concret. » (Philippe Yonnet, dans la lettre « Réacteur » du mois de mai 2009). Concrètement, l'outil va détecter dans les articles de presse qu'il indexe des noms de personnes, de thématiques, d'entreprises ou d'organisations et va ensuite faire émerger les autres entités nommées qui apparaissent dans ce corpus d'articles, cela dans le but de faire émerger les relations de la première entité avec d'autres potentiellement surprenantes (ce qu'en veille stratégique on nomme « signaux faibles »). Ce n'est pas le premier service de ce type à apparaître dans la Lettre Réacteur puisque nous avions par exemple évoqué Silobreaker en novembre 2007 (http://www.reacteur.com/abonnes/archives/2007-11/0711.html), Iseek en mars 2009 (https://www.reacteur.com/abonnes/archives/2009-03/iseek.pdf), ou encore EntityCube en janvier 2010 (http://www.reacteur.com/abonnes/archives/2010-01/2010-01.html).

Description et fonctionnement du service

La page d'accueil est divisée en quatre espaces :


Fig. 1. Page d'accueil du service.

  1. Le moteur d'interrogation : il permet de lancer une requête sur une entité nommée dont on devra préciser la nature (« People », « Organization » ou « Company ») dans le second menu déroulant. Attention, comme déjà évoqué plus haut, il ne s'agit pas d'un moteur de recherche au sens habituel. On ne peut y trouver que des entités déjà identifiées par l'outil ou encore des catégories d'entités (Business, Science, Sport,…).
  2. Les Trending queries : requêtes les plus lancées dans le moteur (période non indiquée).
  3. Les Trending connections : associations les plus « tendances » entre deux entités dans l'actualité (période non indiquée, probablement 24 heures).
  4. Les Breaking News : vous retrouvez ici les entités nommées qui font la tendance, classées par catégories.

Chacun des quatre espace permet de lancer une recherche dans le corpus documentaire, soit en recherchant directement le mot-clé qui nous intéresse dans le moteur d'interrogation (et à condition qu'il ait été créé au préalable par le service en tant qu'entité nommée). Soit en cliquant sur les propositions de Trending queries, Trending connections ou Breaking news. Vous obtenez alors une page de résultats divisée en six espaces que nous allons maintenant détailler :


Fig. 2. Page de résultats suite à une requête ou un clic sur l'entité nommée « Huawei ».

La suite de cet article est réservée aux abonnés.

Christophe Deschamps,  Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)