La recherche d'images peut revétir plusieurs formes : texte (requête) vers image, image vers image (similarité) ou image vers page web. Dans tous ces cas, des technologies existent aujourd'hui et sont appliquées, souvent avec un bonheur certain, par de nombreux moteurs de recherche. Sylvain Peyronnet, qui a créé le moteur de recherche d'images de Qwant, nous explique dans cette série d'articles ce qui se passe "sous la carrosserie du moteur" et les différents algorithmes utilisés, avec des explications les plus... imagées possible. Ce mois-ci, ce sont les technologies mises en place dans les moteurs permettant d'obtenir des images similaires qui sont étudiées en profondeur.

Par Sylvain Peyronnet, concepteur de l'outil d'analyse de backlinks Babbar.

Le mois dernier j'ai évoqué ici-même le concept de moteur de recherche "images". Nous avons vu qu'il existe plusieurs définitions d'un tel moteur, selon les différents cas d'utilisation.

Au stade actuel de votre lecture, vous savez donc déjà que les moteurs qui sont en production actuellement sont principalement basés sur un mécanisme de recherche dans des textes associés aux images (meta données, texte entourant les images, tags divers et variés), mais qu'il existe aussi des moteurs image-images, c'est-à-dire des moteurs à qui l'on donne en entrée une image (par exemple un chat) et qui vont renvoyer en sortie d'autres images (des chats - pour poursuivre mon exemple). La figure 1 ci-dessous illustre ce mécanisme dans le cadre de l'outil TinEye, qui est principalement utilisé pour la recherche d'images dupliquées sur des sites tiers.

Fig. 1. Recherche d'image similaire à l'homme en VTT, l'outil trouve les duplications de l'image, et propose des images similaires chez un partenaire.

Cette recherche d'images par similarité à une autre image a énormément d'applications en dehors des moteurs de recherche. On a vu plus haut la recherche de copies d'une image, ce qui peut être pratique dans le cadre de la lutte contre le plagiat, mais il existe des applications bien plus importantes.

Nous passerons l'utilisation sécuritaire (recherche de personnes) pour passer à l'utilisation commerciale : la recherche de produits similaires. Explications : imaginez que vous soyez chez un ami pour l'apéro, et vous voyez un fauteuil qui vous plaît, avec une photo et une recherche d'images similaires, à vous tous les fauteuils similaires d'un grand e-commerçant. Si ce scénario d'utilisation vous intéresse, nous vous engageons à lire la référence [1], dans laquelle des ingénieur de Grid Dynamics expliquent comment ils ont réalisé un tel outil (spoiler : ils ont utilisé des réseaux de neurones convolutionnels et une recherche par plus proche voisin). La figure 2 est tiré de leur article : on y voit une recherche de robes similaires à une robe choisie par l'utilisateur.

L'article n'est disponible ici que sous la forme d'un extrait.
Il est accessible en lecture intégrale uniquement aux abonnés à la lettre professionnelle « Réacteur » du site Abondance...

Cliquez ici pour vous abonner à la lettre 'Réacteur' !

Vous êtes déjà abonné ? L'article complet est disponible dans la zone "Abonnés". Cliquez ici pour vous identifier.


Plus d'infos pour les abonnés :

Plus d'infos pour les non-abonnés :