Nous continuons notre sĂ©rie d’articles sur les outils de recherche spĂ©cialisĂ©s sur certains formats spĂ©cifiques de fichiers ou de donnĂ©es : image, actualitĂ©, fichiers PDF, etc. Au cours des mois prĂ©cĂ©dents, nous avons Ă©tudiĂ© les moteurs de recherche d’images avec les outils de recherche traditionnels (Google, Yahoo!, Lycos, etc.), les outils spĂ©cialisĂ©s (Ditto, PicSearch, Corbis) et les mĂ©tamoteurs (Ithaki, Mamma, Fazzle, Ixquick et Metahoo).
Ce mois-ci, nous Ă©tudierons les outils de recherche qui permettent d’effectuer des requĂŞtes spĂ©cifiquement sur les fichiers PDF.
Nous avons sélectionné les moteurs de recherche suivants :
– Google (http://www.google.fr/). Sa recherche avancĂ©e (http://www.google.fr/advanced_search?hl=fr) propose le filtre intitulĂ© « Limiter les rĂ©sultats au format de fichier », puis le choix « Adobe Acrobat PDF (.pdf) ». Il est Ă©galement possible d’utiliser la fonction filetype:pdf. Exemple : confidentiel filetype:pdf
– Fast/AllTheWeb (http://www.alltheweb.com/). Sa recherche avancĂ©e (http://www.alltheweb.com/advanced) propose le filtre intitulĂ© « File Format – Only find results that are », puis le choix « Adobe PDF (.pdf) ». Comme pour Google, il est Ă©galement possible d’utiliser la fonction filetype:pdf. Exemple : confidentiel filetype:pdf
– AltaVista (http://www.altavista.fr/). Sa recherche avancĂ©e (http://fr.altavista.com/web/adv) propose le filtre intitulĂ© « Type de fichier : », puis le choix « Seulement fichier PDF ». Comme pour Google et AllTheWeb, il est Ă©galement possible d’utiliser la fonction filetype:pdf. Exemple : confidentiel filetype:pdf
– Voila (http://www.voila.fr/). Pas de possibilitĂ© avec la recherche avancĂ©e, mais il est possible d’utiliser la fonction path:pdf pour restreindre sa recherche Ă ce type de fichier. Exemple : confidentiel path:pdf
– SearchPDF (http://searchpdf.adobe.com/). Moteur de recherche « officiel » d’Adobe.
La recherche avancĂ©e d’Inktomi, via HotBot (http://www.hotbot.com/adv.asp?prov=Inktomi&tab=web) propose le filtre intitulĂ© « Page content », puis le choix « PDF (Acrobat) ». Mais les rĂ©sultats retournĂ©s sont en fait les pages qui contiennent un lien vers un document PDF. Le filtre proposĂ© n’est donc pas spĂ©cifiquement sur le format PDF lui-mĂŞme, c’est pourquoi nous n’avons pas inclus ce moteur dans notre comparatif.
Fichier PDF tĂ©lĂ©chargeable ici (la lettre RĂ©acteur n’Ă©tait Ă cette Ă©poque-lĂ disponible que sous cette forme).