Kartoo : meilleur espoir 2002

Le palmarès des outils de recherche 2001 (http://palmares.abondance.com/) l’a rĂ©vĂ©lĂ© : Kartoo (http://www.kartoo.com/), le mĂ©tamoteur Ă  interface cartographique, sera certainement l’un des grands acteurs de l’annĂ©e 2002, puisqu’il a Ă©tĂ© Ă©lu « meilleur espoir 2002 », « meilleur mĂ©tamoteur web » et a terminĂ© deuxième (derrière Google, excusez du peu) dans la catĂ©gorie « outil de recherche le plus innovant ».

Une bonne occasion pour se pencher sur le berceau de cet outil, nĂ© en avril 2001 (voir http://actu.abondance.com/actu0117.html#mercredi), afin d’essayer de mieux comprendre comment il fonctionne (merci Ă  Laurent Baleydier, son concepteur, pour avoir fourni puis vĂ©rifiĂ© toutes les infos ci-dessous) :

Analyse de la requĂŞte
~~~~~~~~~~~~~~~~

Sur KartOO, on distingue deux modes :
– Le mode automatique (http://www.kartoo.com/) dans lequel le programme choisit de lui-mĂŞme les moteurs Ă  interroger en fonction du type de requĂŞte saisie par l’internaute.
– Le mode manuel (lien « moteurs » sur la page d’accueil) dans lequel l’utilisateur sĂ©lectionne lui-mĂŞme les sources, donc les outils de recherche Ă  interroger en simultanĂ©.

En mode automatique, la requête est traitée en plusieurs étapes :

KartOO transforme les « + » en espaces, supprime les « \ » et les parenthèses, ainsi que tout caractère qu’il considère comme « parasite ». Bref, il « nettoie » la requĂŞte. Le programme vĂ©rifie ensuite s’il y a un « ? » Ă  la fin de la requĂŞte. Si c’est le cas, il interroge les moteurs les plus douĂ©s pour le langage naturel (MSN et NorthernLight d’après les tests de Kartoo). Dans le cas de questions posĂ©es en langage naturel, on pourrait s’attendre Ă  ce que le mĂ©tamoteur interroge des outils qui sont rĂ©ellement conçus pour cela, comme Ask Jeeves ou Infoclic. Mais ça n’a pas Ă©tĂ© mis en place parce que la prĂ©sentation des rĂ©sultats sur ces outils ne se prĂŞte pas bien Ă  la cartographie : il est juste affichĂ© une question de quelques mots, souvent pas d’URL en clair ni de description de la page, ce qui ne correspond pas vraiment Ă  la « charte de fonctionnement » de Kartoo.

S’il n’y a pas de « ? » Ă  la fin de la question, la requĂŞte est dĂ©coupĂ©e en fonction des espaces et de la syntaxe utilisĂ©e : des « -« , des guillemets, des « OR », « NEAR », « url: », « site: », et autres opĂ©rateurs avancĂ©s (la syntaxe finale ressemble alors Ă  celle d’Altavista).

KartOO corrige ensuite la requĂŞte pour qu’elle reste cohĂ©rente (par exemple, quand 2 opĂ©rateurs se suivent, il ne garde que le dernier : « NEAR OR » devient alors « OR »). En fonction des opĂ©rateurs rencontrĂ©s et de la langue choisie, le programme sĂ©lectionne les moteurs les plus pertinents. Par exemple, en francais, pour une requĂŞte simple (saisie sur un ou deux mots sans opĂ©rateur spĂ©cifique), il interroge actuellement Google, Voila, AlltheWeb et Yahoo! en simultanĂ©. Cette sĂ©lection automatique peut cependant changer parfois en fonction de la disponibilitĂ© des moteurs et des tests de pertinence effectuĂ©s par l’outil dans le cadre de sa veille continuelle. Kartoo utilise alors une « table de correspondance » qui associe le type de requĂŞte demandĂ©e avec les outils de recherche qui lui semblent les plus pertinents Ă  chaque fois. Notons que cette fonctionnalitĂ© « transparente » qui fait en sorte que les outils interrogĂ©s sont diffĂ©rents en fonction de la requĂŞte demandĂ©e est assez unique dans le monde des mĂ©tamoteurs et est très innovante.

En mode manuel, la requĂŞte n’est, cette fois, pas modifiĂ©e avant d’ĂŞtre envoyĂ©e aux moteurs de recherche.

La requete est, dans ce cas, « simplement » traduite dans la syntaxe de chaque moteur grace, lĂ  aussi, Ă  des « tables de correspondance ». Si un moteur ne supporte pas la syntaxe, il n’est pas interrogĂ© lorsqu’on est en mode automatique. En mode manuel, KartOO renvoie Ă©galement un avertissement.

Si les mots demandĂ©s sont très communs, très courants, le rĂ©sultat est instantanĂ©ment renvoyĂ© par le « cache » (la mĂ©moire tampon) du mĂ©tamoteur et les moteurs eux-mĂŞmes ne sont pas interrogĂ©s une nouvelle fois. Ce système de tampon est mis Ă  jour toutes les 24h, pour rester d’actualitĂ©.

Fichier PDF tĂ©lĂ©chargeable ici (la lettre RĂ©acteur n’Ă©tait Ă  cette Ă©poque-lĂ  disponible que sous cette forme).

Ajouter un commentaire Ajouter un commentaire

Article précédent

Bruits et chuchotements (décembre 2001)

Article suivant

Nomade.fr : un point sur le référencement payant