Google propose depuis quelques mois le service "Google Web API" (http://www.google.com/apis/). L'initiative est intéressante et assez innovante dans le domaine des moteurs de recherche : il s'agit de mettre à la disposition des développeurs informatiques une bibliothèque de fonctionnalités (API signifie "Application Programming Interface") utilisables, comme un "Web Service", et qui permettent d'utiliser l'index de Google pour bâtir de nouveaux programmes autour de la recherche d'information sur le Web. Il est techniquement possible d'écrire des applicatifs Java, Perl, PHP, C++ ou grâce à n'importe quel langage qui supporte les "Web Services". Pour savoir ce que sont ces "Web Services", voici un dossier du Journal du Net qui devrait vous en dire plus :

http://solutions.journaldunet.com/dossiers/webservices/sommaire.shtml

 

Principe du Google Web API

Le principe est ultra-simple : vous téléchargez tout d'abord un kit de développement, puis vous demandez une license (gratuite) en vous inscrivant auprès de Google. Cette license vous permettra d'effectuer, grâce au kit, jusqu'à 1 000 requêtes sur l'index de Google par l'intermédiaire des applicatifs que vous avez développés. Un forum de discussion (http://groups.google.com/groups?group=google.public.web-apis) a même été mis en ligne par Google pour discuter de cette nouvelle fonctionnalité spécifiquement "taillée" pour les programmeurs.

Le "Kit de développement" contient des fichiers d'aides, une bibliothèque de fonctions, des exemples, etc. Bref, tout le nécessaire pour laisser vagabonder sa créativité informatique...

Condition sine qua non : les applicatifs créés ne doivent pas être à objectif commercial sans l'autorisation écrite de Google. Ceci dit, la restriction à 1 000 requêtes par jour est assez limitative dans ce sens. Autre limite : il n'est pas possible d'accéder à plus de 10 liens par requête (en d'autres termes, on ne peut afficher 50 résultats pour un mot clé), et il n'est pas possible non plus d'aller au-delà du 1 000ème lien issu de l'index pour une requête donnée. La requête, de plus, ne doit pas contenir plus de 10 mots et  faire plus de 2048 caractères, ce qui laisse quand même une certaine marge...

Toujours au niveau des restrictions, notons également que les API ne donnent accès qu'à l'index "pages web" de Google (2 milliards de pages), pas aux forums de discussion (Google Groups), ni à l'Open Directory (Google Directory) ou aux images (Google Image Search). De plus, il est interdit d'utiliser ce service pour créer un concurrent à Google. Si, si, c'est écrit dans les conditions d'utilisations (http://www.google.com/apis/api_terms.html) !!

 

Les API nous en disent plus sur la syntaxe d'interrogation du moteur

Les bibliothèques de fonctionnalités fournies aux programmeurs sont assez complètes. Point très intéressant, les documents qui les décrivent nous permettent d'ailleurs d'en savoir plus sur la syntaxe d'interrogation du moteur :

* Un "ET" (qu'il est possible d'indiquer par le signe "+") est utilisé par défaut, ce qui ne surprendra personne, j'imagine (l'information est bien connue)... La requête moteur recherche et donc équivalente à +moteur +recherche.

* Google ignore les "stop words", mots anglais trop souvent utilisés comme "where", "to" ou "how". Si l'on veut effectuer une requête contenant de façon expresse de tels mots, il faut utiliser les guillemets : "to be or not to be". Dans ce cas, les termes to, not ou or seront pris en compte, ce qui n'aurait pas été le cas sans les guillemets.

* Tous les signes non-alphanumériques de la requête sont traités comme des séparateurs, à l'exception du signe +, du signe -, des guillemets (") et de l'esperluète (&).

* La syntaxe d'interrogation de Google est la suivante :

Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).