La recherche sur le Web ne se limite pas toujours à l'exploration des fichiers au formats HTML. D'autres possibilités (PDF, Word, Excel, Powerpoint, etc.) existent et les moteurs classiques les indexent et proposent même des syntaxes d'interrogation spécifiques. Nous les avons explorées le mois dernier. Ce mois-ci, nous allons comparer les différents outils de recherche qui utilisent le protocole FTP ainsi que les moteurs de partage de fichiers qui peuvent également, en dehors de leur image sulfureuse, nous aider dans nos investigations...

Par Christophe Deschamps


Le mois dernier nous avons passé en revue trois catégories de services permettant de récupérer des documents (PDF, PPT, DOC) et nous allons dans ce nouvel article continuer à explorer les familles d'outils utiles à ce type de recherche.

Les moteurs FTP

FTP est un protocole internet beaucoup plus ancien que le web puisque créé en 1971. C'est tout simplement l'acronyme de File Transfer Protocol (protocole de transfert de fichiers). Vérifier s'il peut encore nous être utile dans le cadre d'une recherche documentaire était donc une évidence.

L'accès à un serveur FTP se fait habituellement à partir d'un outil client spécifique comme Filezilla (https://filezilla-project.org/) ou Cyberduck (https://cyberduck.io/). Ainsi les résultats proposés doivent être copiés-collés dans ce logiciel afin de pouvoir être téléchargés.

Afin de tester ces services nous utiliserons les mêmes mots-clés que dans l'article précédent, à savoir « competitive intelligence » et « intelligence économique ». Seul problème, les expressions entre guillemets ne sont reconnues par quasiment aucun d'entre eux et les résultats peu évidents à apprécier en l'état.


Fig. 1. Différents outils de recherche FTP.


Fig. 2. Interface de recherche du moteur FTP Globalfilesearch.

Au vu de ces résultats décevants ,nous conseillons de n'utiliser les moteurs FTP qu'en fin de recherche, si aucun autres outil n'a donné de résultats et… avec des espérances limitées...

Des extensions pour rechercher sur les serveurs FTP

Est-ce tout ce que l'on peut attendre des antiques serveurs FTP ? Et bien non, des extensions pour Chrome et Firefox vont nous permettre d'aller plus loin, mais soyons clair, elles ne vont faire qu'un travail de traduction de requêtes pour interroger… Google.

La suite de cet article est réservée aux abonnés.

Christophe Deschamps,  Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)