Si vous avez regardé vos logs (la mémoire des connexions de votre serveur) ces derniers mois, vous avez peut-être trouvé trace d'un robot appelé "Antibot", très actif depuis quelques temps. Il s'agit du "spider" de la société Antidot (groupe IXO, http://www.ixo.fr/, ex-Infosources), dont les agents de recherche de leur solution "Antisearch" équipent aujourd'hui les technologies "moteur" des sites Lokace (http://www.lokace.com/) et Francité (http://www.francite.com). Une bonne occasion pour tenter d'en savoir un peu plus sur ce nouvel acteur du domaine.

L'entreprise Antidot, créée en 1999 et qui compte aujourd'hui 4 personnes plus deux consultants travaillant à temps partiel pour la société, a, historiquement, travaillé sur la maintenance du moteur Lokace, dans sa première version (celle créée par l'équipe de Caramail). Puis, les services techniques de l'entreprise se sont vite rendu compte qu'il devenait nécessaire de mettre en place une nouvelle version, plus efficace, de l'outil en se basant sur l'expérience accumulée lors de la maintenance de la première version du logiciel. Le moteur de recherche a donc été entièrement réécrit,

selon un concept plus large : la solution "AntiSearch" qui a demandé plus d'une année et demi de développement de la part de l'équipe technique.

La solution Antisearch est basée sur un concept de "briques", d'agents spécialisés, à qui l'on peut demander d'effectuer un certain nombre de tâches pour aller rechercher de l'information sur des sources d'information très diverses : annuaire de site web, moteur de recherche, annuaire d'e-mail, encyclopédie, publicité, DNS (similaire à un outil de type "Realnames"), catalogue de commerce électronique, etc. La solution "Antibot" représente donc la partie strictement "moteur de recherche" d'une solution logicielle middleware beaucoup plus globale.

Une fois qu'un agent spécialisé est sollicité, le résultat de la recherche est renvoyé au site client au format XML qui peut, de son côté, l'intégrer dans une feuille de style pour affichage sous sa charte graphique. Le client peut donc choisir d'aggréger plusieurs agents pour son site, chacun d'entre eux s'adaptant à un type de donnée précis.

Par exemple, l'agent mis en place pour le site Top Achat (http://www.topachat.com/) travaille sur un export XML de sa base de données, remis à jour très fréquemment. Si vous tapez le mot clé "DVD" sur la page d'accueil du site, la page de résultats (http://www.topachat.com/micro/pages/produits.php?mc=dvd) sera fournie par les agents d'AntiSearch qui auront exploré les bases de données du site afin de retrouver l'information la plus pertinente. La technologie peut non seulement prendre en compte un site isolé, mais également des bases de données réparties sur plusieurs sites.

Si les agents d'Antisearch effectuent plusieurs requêtes, chaque agent étant spécialisé dans une tâche bien définie, les résultats proposés peuvent tout à fait être mixés, comme sur Lokace où les liens émanant de l'annuaire et du moteur sont "mélangés". Ce n'est, en revanche, pas encore le cas sur Francité (seuls les résultats "moteur" sont affichés), mais la situation pourrait évoluer prochainement.

Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).