On a beaucoup parlé de la société RecordedFuture il y a quelques mois de cela, lorsque son double financement par Google et la CIA a été évoqué dans la presse. L'ambition de cette entreprise ? Rien de moins que prédire l'avenir gâce aux informations glanées sur le Web. Nous avons eu accès à la version payante de cet outil afin de l'évaluer en profondeur. Le résultat ? Un outil prometteur même s'il s'agit avant tout d'un système d'aide à la prise de décision plutôt qu'un devin numérique en bonne et dûe forme...

Cet article fait partie de la Lettre Réacteur #118 du mois de septembre 2010

Début de l'article :

Difficile de se payer une meilleure publicité que celle qu'a assurée à Recorded Future (http://www.recordedfuture.com/) l'annonce de son double financement par Google et la CIA (via son fameux fond d'investissement In-Q-Tel) en juin dernier. Il faut dire que cette petite société de 16 personnes ne propose pas moins que de vous aider à prédire l'avenir via l'information de sources ouvertes qu'elle indexe et analyse en permanence. Ce type de technologie de text-mining avancé ne peut évidemment qu'intéresser les agences de renseignements puisqu'elle porte la promesse de les aider à découvrir des liens cachés entre individus, sociétés, organisations, lieux... La société ne s'y est d'ailleurs pas trompé, qui propose un blog intitulé "Intelligence Analysis" sur lequel sont décortiqués des faits d'actualité avec la technologie maison (http://www.analysisintelligence.com/).

Pour Google ce n'est pas beaucoup plus étonnant. Le datamining et le text mining sont en effet au cœur de son business. L'article phare de Sergey Brin et Larry Page consacré au Pagerank d'un Google embryonnaire en 1998 (S. Brin and L. Page, "The Anatomy of a Large-Scale Hypertextual Web Search Engine") a en effet tendance à faire oublier ceux, beaucoup plus nombreux, qu'ils ont consacré au datamining, notamment "Dynamic data mining : exploring large rule spaces by sampling", écrit un an plus tard et dans lequel ils expliquent comment, dans le but de tester une méthode d'extraction de données à partir de paniers clients sur des sites commerciaux, ils ont utilisé "des documents comme des paniers et les mots dans ces documents comme des articles"...

Chez Google l'analyse prédictive sert, entre autres choses, à anticiper vos besoins et à vous proposer des publicités en conséquence.

La version gratuite de Related Future présente en fait assez peu d'intérêt puisqu'il s'agit d'un service d'alertes par mots-clés pas très différent d'un Google Alertes. Nous avons heureusement pu obtenir un mois de test gratuit du service et en mesurer ainsi le véritable potentiel.


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).