Le palmarès des outils de recherche 2001 (http://palmares.abondance.com/) l’a rĂ©vĂ©lĂ© : Kartoo (http://www.kartoo.com/), le mĂ©tamoteur Ă interface cartographique, sera certainement l’un des grands acteurs de l’annĂ©e 2002, puisqu’il a Ă©tĂ© Ă©lu « meilleur espoir 2002 », « meilleur mĂ©tamoteur web » et a terminĂ© deuxième (derrière Google, excusez du peu) dans la catĂ©gorie « outil de recherche le plus innovant ».
Une bonne occasion pour se pencher sur le berceau de cet outil, nĂ© en avril 2001 (voir http://actu.abondance.com/actu0117.html#mercredi), afin d’essayer de mieux comprendre comment il fonctionne (merci Ă Laurent Baleydier, son concepteur, pour avoir fourni puis vĂ©rifiĂ© toutes les infos ci-dessous) :
Analyse de la requĂŞte
~~~~~~~~~~~~~~~~
Sur KartOO, on distingue deux modes :
– Le mode automatique (http://www.kartoo.com/) dans lequel le programme choisit de lui-mĂŞme les moteurs Ă interroger en fonction du type de requĂŞte saisie par l’internaute.
– Le mode manuel (lien « moteurs » sur la page d’accueil) dans lequel l’utilisateur sĂ©lectionne lui-mĂŞme les sources, donc les outils de recherche Ă interroger en simultanĂ©.
En mode automatique, la requête est traitée en plusieurs étapes :
KartOO transforme les « + » en espaces, supprime les « \ » et les parenthèses, ainsi que tout caractère qu’il considère comme « parasite ». Bref, il « nettoie » la requĂŞte. Le programme vĂ©rifie ensuite s’il y a un « ? » Ă la fin de la requĂŞte. Si c’est le cas, il interroge les moteurs les plus douĂ©s pour le langage naturel (MSN et NorthernLight d’après les tests de Kartoo). Dans le cas de questions posĂ©es en langage naturel, on pourrait s’attendre Ă ce que le mĂ©tamoteur interroge des outils qui sont rĂ©ellement conçus pour cela, comme Ask Jeeves ou Infoclic. Mais ça n’a pas Ă©tĂ© mis en place parce que la prĂ©sentation des rĂ©sultats sur ces outils ne se prĂŞte pas bien Ă la cartographie : il est juste affichĂ© une question de quelques mots, souvent pas d’URL en clair ni de description de la page, ce qui ne correspond pas vraiment Ă la « charte de fonctionnement » de Kartoo.
S’il n’y a pas de « ? » Ă la fin de la question, la requĂŞte est dĂ©coupĂ©e en fonction des espaces et de la syntaxe utilisĂ©e : des « -« , des guillemets, des « OR », « NEAR », « url: », « site: », et autres opĂ©rateurs avancĂ©s (la syntaxe finale ressemble alors Ă celle d’Altavista).
KartOO corrige ensuite la requĂŞte pour qu’elle reste cohĂ©rente (par exemple, quand 2 opĂ©rateurs se suivent, il ne garde que le dernier : « NEAR OR » devient alors « OR »). En fonction des opĂ©rateurs rencontrĂ©s et de la langue choisie, le programme sĂ©lectionne les moteurs les plus pertinents. Par exemple, en francais, pour une requĂŞte simple (saisie sur un ou deux mots sans opĂ©rateur spĂ©cifique), il interroge actuellement Google, Voila, AlltheWeb et Yahoo! en simultanĂ©. Cette sĂ©lection automatique peut cependant changer parfois en fonction de la disponibilitĂ© des moteurs et des tests de pertinence effectuĂ©s par l’outil dans le cadre de sa veille continuelle. Kartoo utilise alors une « table de correspondance » qui associe le type de requĂŞte demandĂ©e avec les outils de recherche qui lui semblent les plus pertinents Ă chaque fois. Notons que cette fonctionnalitĂ© « transparente » qui fait en sorte que les outils interrogĂ©s sont diffĂ©rents en fonction de la requĂŞte demandĂ©e est assez unique dans le monde des mĂ©tamoteurs et est très innovante.
En mode manuel, la requĂŞte n’est, cette fois, pas modifiĂ©e avant d’ĂŞtre envoyĂ©e aux moteurs de recherche.
La requete est, dans ce cas, « simplement » traduite dans la syntaxe de chaque moteur grace, lĂ aussi, Ă des « tables de correspondance ». Si un moteur ne supporte pas la syntaxe, il n’est pas interrogĂ© lorsqu’on est en mode automatique. En mode manuel, KartOO renvoie Ă©galement un avertissement.
Si les mots demandĂ©s sont très communs, très courants, le rĂ©sultat est instantanĂ©ment renvoyĂ© par le « cache » (la mĂ©moire tampon) du mĂ©tamoteur et les moteurs eux-mĂŞmes ne sont pas interrogĂ©s une nouvelle fois. Ce système de tampon est mis Ă jour toutes les 24h, pour rester d’actualitĂ©.
Fichier PDF tĂ©lĂ©chargeable ici (la lettre RĂ©acteur n’Ă©tait Ă cette Ă©poque-lĂ disponible que sous cette forme).