La recherche d'images peut revêtir plusieurs formes : texte (requête) vers image, image vers image (similarité) ou image vers page web. Dans tous ces cas, des technologies existent aujourd'hui et sont appliquées, souvent avec un bonheur certain, par de nombreux moteurs de recherche. Sylvain Peyronnet, qui a créé le moteur de recherche d'images de Qwant, nous explique dans cette série d'articles ce qui se passe "sous la carrosserie du moteur" et les différents algorithmes utilisés, avec des explications les plus... imagées possible.

Par Sylvain Peyronnet, concepteur de l'outil d'analyse de backlinks Babbar.

Ce mois-ci et le mois prochain, je vais aborder un point qui n'est pas couramment évoqué lorsque l'on parle du fonctionnement des moteurs de recherche, il s'agit de la verticale "images". Vous remarquerez que je prends une précaution littéraire en parlant de "verticale images" et non pas de moteur de recherche image, car le sens que l'on peut donner à cette dernière expression est multiple.

En effet, on peut s'intéresser à :

  1. Un moteur de recherche qui prend en entrée un texte comme requête, et renvoie en sortie des images ;
  2. Un moteur de recherche qui prend en entrée une image, et renvoie en sortie des images.
  3. Un moteur de recherche qui prend en entrée une image, et renvoie en sortie des pages web (qui contiennent l'image, ou plus impressionnant qui parlent de ce qui est représenté dans l'image).

Aujourd'hui, la technologie est assez mature pour assurer ces trois missions, et c'est pour cela que le terme "moteur de recherche images" est et reste assez flou.

Comme souvent, les anglo-saxons sont un peu plus précis : ils font la distinction entre plusieurs objets, et utilisent les termes de image retrieval system pour désigner un moteur qui renvoie des images en sortie, de image meta search pour dire que le moteur se base sur une information hors de l'image, et de content-based image retrieval pour signifier que c'est le contenu réel de l'image qui est utilisé.

Dans cette série d'articles, nous allons évoquer tout cela.

L'article n'est disponible ici que sous la forme d'un extrait.
Il est accessible en lecture intégrale uniquement aux abonnés à la lettre professionnelle « Réacteur » du site Abondance...

Cliquez ici pour vous abonner à la lettre 'Réacteur' !

Vous êtes déjà abonné ? L'article complet est disponible dans la zone "Abonnés". Cliquez ici pour vous identifier.


Plus d'infos pour les abonnés :

Plus d'infos pour les non-abonnés :