La recherche sur le Web ne se limite pas toujours à l'exploration des fichiers au formats HTML. D'autres possibilités (PDF, Word, Excel, Powerpoint, etc.) existent et les moteurs classiques les indexent et proposent même des syntaxes d'interrogation spécifiques. Nous les avons explorées le mois dernier. Ce mois-ci, nous allons comparer les différents outils de recherche qui utilisent le protocole FTP ainsi que les moteurs de partage de fichiers qui peuvent également, en dehors de leur image sulfureuse, nous aider dans nos investigations...

Par Christophe Deschamps, Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/).

Le mois dernier nous avons passé en revue trois catégories de services permettant de récupérer des documents (PDF, PPT, DOC) et nous allons dans ce nouvel article continuer à explorer les familles d'outils utiles à ce type de recherche.

Les moteurs FTP

FTP est un protocole internet beaucoup plus ancien que le web puisque créé en 1971. C'est tout simplement l'acronyme de File Transfer Protocol (protocole de transfert de fichiers). Vérifier s'il peut encore nous être utile dans le cadre d'une recherche documentaire était donc une évidence.

L'accès à un serveur FTP se fait habituellement à partir d'un outil client spécifique comme Filezilla (https://filezilla-project.org/) ou Cyberduck (https://cyberduck.io/). Ainsi les résultats proposés doivent être copiés-collés dans ce logiciel afin de pouvoir être téléchargés.

Afin de tester ces services nous utiliserons les mêmes mots-clés que dans l'article précédent, à savoir « competitive intelligence » et « intelligence économique ». Seul problème, les expressions entre guillemets ne sont reconnues par quasiment aucun d'entre eux et les résultats peu évidents à apprécier en l'état.

L'article n'est disponible ici que sous la forme d'un extrait.
Il est accessible en lecture intégrale uniquement aux abonnés à la lettre professionnelle « Réacteur » du site Abondance...

Cliquez ici pour vous abonner à la lettre 'Réacteur' !

Vous êtes déjà abonné ? L'article complet est disponible dans la zone "Abonnés". Cliquez ici pour vous identifier.

Plus d'infos pour les abonnés :

Plus d'infos pour les non-abonnés :