Les moteurs de recherche majeurs (Google, Yahoo, Live, Exalead, Voila) proposent tous une syntaxe d'interrogation plus ou moins avancée. mais reconnaissent-ils tous l'usage de parenthèses pour lancer des requêtes complexes, en conjonction avec des opérateurs booléens comme AND ou OR ? Enquête et réponse...

Nous avons, pour la plupart d'entre nous, l'habitude d'utiliser les moteurs de recherche sur le Web de façon finalement assez "basique", sous la forme de requêtes constituées de un ou plusieurs mots clés séparés par un espace. Parfois, l'utilisation d'opérateurs booléens comme le +, le - ou des syntaxes plus spécifiques (link:, site:, inurl:, etc.) nous font toucher du doigt  les possibilités plus "avancées" que nous fournissent les moteurs. Certains utilisateurs, ou parfois certaines requêtes, demandent cependant à aller plus loin dans l'élaboration d'expressions booléennes plus complexes comme : "je recherche les pages contenant contenant MOT1 ET MOT2 OU les pages contenant MOT1 ET MOT3". Dans ce cas, la prise en considération des parenthèses par les moteurs devient importante voire cruciale et indispensable. Mais ces derniers reconnaissent-ils ce mode de questionnement ? C'est ce que nous avons voulu savoir...

A tout seigneur tout honneur, Google (http://www.google.fr/) est le premier moteur testé avec une requête "caricaturale" portant sur deux thèmes totalement différents afin de bien vérifier si les deux domaines sont pris en compte : "(recette tarte fraise) OR (énergie nucléaire)". En d'autres termes : "je recherche les pages qui continnent 'recette' ET 'tarte' ET 'fraise' OU celles qui contiennent 'énergie' ET 'nucléaire'".

Les résultats sont loins d'être probants avec très peu de liens pertinents dans l'une ou l'autre des thématiques demandées. Il semblerait plutôt que Google tente de rechercher les pages qui contiennent TOUS les mots de la requête : recette, tarte, fraise, énergie, nucléaire. Résultat : moins de 35 000 liens proposés alors que la requête "recette tarte fraise" (sans les guillemets) en propose près de 400 000 et "énergie nucléaire" plus de 1,5 millions. La conjonction des deux requêtes avec un opérateur OR devraient donc donner près de 2 millions de réponses, ce qui est loin d'être le cas dans nos tests...

En revanche, les parenhèses associées à l'opérateur ET (l'espace chez Google) donnent un résultat qui semble convaincant. La requête "(ferrari OR porsche) (amortisseur OR démarreur)", soit "je recherche les pages qui contiennent 'ferrari' OU 'porsche' ET qui contiennent également 'amortisseur' OU 'démarreur'", renvoie 113 000 résultats qui semblent tout à fait plausibles, sachant que "(ferrari OR porsche)" donne 115 millions de résultats et "(amortisseur OR démarreur)", 1,2 millions. Les chiffres sont donc logiques... L'analyse des liens fournis par Google sur la requête complète indique que, dans ce cas, les parenthèses semblent bien comprises...

Notons pour finir que l'opérateur SAUF (signe "-") ne semble pas pris en compte par Google dans ce cas. La requête "(ferrari OR porsche) -(amortisseur OR démarreur)" donne exactement le même résultat que "(ferrari OR porsche) (amortisseur OR démarreur)"...

Prise en compte des parenthèses


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).