S'il y a bien un sujet qui revient périodiquement dans les discussions entre SEO, c’est celui de l’impact du comportement des utilisateurs au niveau de la SERP sur le classement en lui-même : clics, CTR, Dwell Time, pogosticking, etc. Chacun a son intime conviction, entre ceux qui pensent que Google ne prend pas en compte du tout le comportement de ses utilisateurs, et ceux qui pensent que c’est un facteur très important (à tel point que des dispositifs ont été mis au point pour simuler en masse des clics dans les SERP dans l’espoir de faire bouger les lignes).

Dans cet article, je vais rappeler pourquoi la mesure de la satisfaction en temps réel est importante, et je ferai ensuite un panorama de ce qui est utilisable pour faire cette mesure.

Re-ranking et learning-to-rank

Si vous êtes un lecteur assidu de Réacteur, vous savez qu'un moteur de recherche fonctionne avec des signaux, et que ces signaux sont agrégés pour donner un score à chaque page de l’index pour une requête. Les pages avec les scores les plus hauts sont alors présentées en haut du classement.

Historiquement, les signaux sont agrégés en faisant une somme pondérée, et la pondération était déterminée de manière assez besogneuse, était fixe pendant un temps, puis revue, etc. Déjà dans ce contexte, des données liées aux comportements des utilisateurs pouvaient être utilisées pour faire ce que l’on appelle du re-ranking, c'est-à-dire des modifications “rapides” d’un classement assez statique, pour améliorer les résultats. On notera que le re-ranking est un concept qui peut servir dans d’autres contextes (pour faire de la personnalisation par exemple). Des études menées chez Microsoft (référence [1]) montre que l’usage d’information de comportements utilisateurs pour faire du re-ranking améliore la qualité perçue drastiquement (augmentation de la précision à 10, c’est-à-dire du nombre de résultats du top 10 qui sont pertinents, de près de 15%).

Mais ce qui va rendre l’usage d’informations comportementales au niveau de la SERP très important est la mise en place d'algorithmes de learning-to-rank. Le principe du learning-to-rank est un principe d’apprentissage automatique (machine learning) dont les premières approches ont été mises au point chez Altavista (voir le brevet de David Cossock, référence [2]).

L’idée du learning-to-rank est très simple. On détermine les caractéristiques importantes pour le classement, on pondère les caractéristiques, on regarde l’erreur commise en termes de qualité de résultat, puis on modifie les pondérations pour améliorer la qualité, et on recommence…

Les travaux de l’équipe de Chris Burges, chez Microsoft Bing (voir l’article [3]) vont tout changer pour les moteurs. Dès les premiers tests, ces méthodes vont montrer une réussite exceptionnelle pour calculer rapidement un bien meilleur classement, en se basant principalement sur des préférences exprimées par les utilisateurs du moteur. Les algorithmes de learning-to-rank ont bien évolués depuis (Google en a même présenté un à base de réseaux de neurones profonds, référence [4]) mais tous se "nourrissent" des préférences, qui peuvent être sous forme pointwise (j’aime/j’aime pas telle page), pairwise (je préfère la page A à la page B), ou encore listwise (voici la liste ordonnée des pages que j’aime). La plupart des approches modernes sont pairwise, car l’information de préférence par comparaison est la plus naturelle pour l’homme.

La suite de cet article est réservée aux abonnés.

Sylvain Peyronnet, concepteur de l'outil SEO Babbar.