Toutes les requêtes saisies par les internautes ne sont pas traitées de la même façon par les moteurs de recherche comme Google ou Bing. En effet, plusieurs algorithmes de détection du type de demande effectuée ont été mis en place pour traiter de façon différente notamment les requêtes à caractère commercial, afin notamment d'optimiser leur monétisation. Cet article rappelle un historique des différentes classifications proposées depuis 20 ans et explique comment Google ou Bing testent et analysent ces différentes requêtes puis réagissent à leur caractère plus ou moins commercial...

Cet article fait partie de la Lettre Réacteur #134 du mois de février 2012

Début de l'article :

Les moteurs de recherche sont des entreprises commerciales qui cherchent à tirer profit de toutes les sources de monétisation auxquelles ils ont accès... Or une partie des requêtes tapées sur les moteurs sont effectuées par des internautes à la recherche d'un produit ou d'un service. Il est donc assez logique que les moteurs aient cherché très tôt à identifier ces requêtes, pour optimiser leur monétisation comme pour améliorer le service rendu aux internautes.

Nous allons essayer de révéler dans cet articles les méthodes utilisées pour identifier ces requêtes commerciales ou requêtes marchandes, quels sont les obstacles auxquels les moteurs sont confrontés, et comment ces informations sont utilisées pour modifier les réponses apportées lorsque des requêtes "à caractère commercial" sont tapés par les internautes.

Comment "classifier" les requêtes des internautes ?

L'idée de classer les requêtes en différentes catégories est née assez tardivement dans l'histoire des moteurs de recherche. Dans les années 90, curieusement, la plupart des analyses sur la typologie des requêtes semblaient partir du principe que la seule intention des utilisateurs de moteurs était de chercher de l'information. Mais Andrei Broder a tordu le cou à ce mythe dans un article fondateur datant de 2002 : "a taxonomy of web search" (http://www.sigir.org/forum/F2002/broder.pdf).

La classification de Broder a eu un grand succès dans le monde des moteurs de recherches, et est reprise dans de très nombreux travaux de recherche. Elle classe les requêtes des internautes en trois catégories, en fonction des intentions des internautes :
- les requêtes navigationnelles ;
- les requêtes informationnelles ;
- les requêtes transactionnelles.
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).