Google a dernièrement fait plusieurs annonces-choc en termes d'intégration d'algorithmes d'intelligence artificielle et de machine learning dans son moteur de recherche. Des nouveautés certainement en rapport avec l'arrivée de Prabhakar Raghavan à la tête du département qui traite de la recherche d'information au sein de la firme de Mountain View. Voici notre analyse au sujet de ces annonces et sur la façon dont Google évolue au fil des ans. Un peu de prospective ne fait jamais de mal...

 

Vous aviez peut-être vu l’information sur Abondance (voir référence [1]) : avant l’été 2020 Google avait nommé Prabhakar Raghavan à la tête de beaucoup de départements, dont la recherche d'information. Le nom de Raghavan ne vous parle peut être pas, mais il faut savoir que pour les chercheurs en algorithmes d’approximation (dont je fais partie, c’était déjà le sujet de ma thèse il y a 20 ans) c’est une référence absolue, avec de nombreux articles sur le sujet et le livre de référence ([2], pour les experts du domaine).

Pourquoi est-ce que je vous raconte cela ? Tout d’abord parce qu’il existe une relation très forte entre algorithmes d’approximation et machine learning, et donc ce que l’on appelle de manière abusive l’intelligence artificielle (IA), mais aussi parce que c’est bien Prabhakar Raghavan qui a pris la plume pour nous annoncer : "AI is powering a more helpful Google" dans l’article du blog Google publié mi-octobre (référence [3]).

Ce mois-ci, je vais vous résumer rapidement ce que cet article présente en matière de compréhension des contenus, et vous faire part de mes remarques sur le sujet pour ensuite parler un peu du traitement de la langue au niveau des moteurs et de l’optimisation sémantique pour le SEO.

 

Mieux comprendre les contenus ?

L’objectif de Google a toujours été de proposer des résultats les plus pertinents possible, en privilégiant la paresse de l’utilisateur (c’est-à-dire lui fournir un résultat suffisant sans avoir d’interaction avec lui hors la première demande, dans une optique "moteur de réponses").

Depuis plusieurs mois Google a déployé une mise à jour appelée BERT, d’après l'algorithme éponyme créée par Jacob Devlin (voir la référence [4]). J’ai déjà évoqué dans ces mêmes pages comment fonctionnait BERT et je ne vais pas revenir sur le sujet sauf sur certains points spécifiques un peu plus loin. Le fait d’utiliser le même nom est une source de confusion assez importante, et il est heureux que Google ait décidé de mieux communiquer récemment, notamment en abordant ce qu’ils ont appelé le Deeprank (voir [6] et [7]).

Dans l’annonce récente, Google nous dit que :

La suite de cet article est réservée aux abonnés.

Sylvain Peyronnet, concepteur de l'outil d'analyse de backlinks Babbar.