Les moteurs de recherche tiennent-ils compte du comportement des internautes dans leurs SERP ?

S’il y a bien un sujet qui revient périodiquement dans les discussions entre SEO, c’est celui de l’impact du comportement des utilisateurs au niveau de la SERP sur le classement en lui-même : clics, CTR, Dwell Time, pogosticking, etc. Chacun a son intime conviction, entre ceux qui pensent que Google ne prend pas en compte du tout le comportement de ses utilisateurs, et ceux qui pensent que c’est un facteur très important (à tel point que des dispositifs ont été mis au point pour simuler en masse des clics dans les SERP dans l’espoir de faire bouger les lignes).

Dans cet article, je vais rappeler pourquoi la mesure de la satisfaction en temps réel est importante, et je ferai ensuite un panorama de ce qui est utilisable pour faire cette mesure.

Re-ranking et learning-to-rank

Si vous êtes un lecteur assidu de Réacteur, vous savez qu’un moteur de recherche fonctionne avec des signaux, et que ces signaux sont agrégés pour donner un score à chaque page de l’index pour une requête. Les pages avec les scores les plus hauts sont alors présentées en haut du classement.

Historiquement, les signaux sont agrégés en faisant une somme pondérée, et la pondération était déterminée de manière assez besogneuse, était fixe pendant un temps, puis revue, etc. Déjà dans ce contexte, des données liées aux comportements des utilisateurs pouvaient être utilisées pour faire ce que l’on appelle du re-ranking, c’est-à-dire des modifications “rapides” d’un classement assez statique, pour améliorer les résultats. On notera que le re-ranking est un concept qui peut servir dans d’autres contextes (pour faire de la personnalisation par exemple). Des études menées chez Microsoft (référence [1]) montre que l’usage d’information de comportements utilisateurs pour faire du re-ranking améliore la qualité perçue drastiquement (augmentation de la précision à 10, c’est-à-dire du nombre de résultats du top 10 qui sont pertinents, de près de 15%).

Mais ce qui va rendre l’usage d’informations comportementales au niveau de la SERP très important est la mise en place d’algorithmes de learning-to-rank. Le principe du learning-to-rank est un principe d’apprentissage automatique (machine learning) dont les premières approches ont été mises au point chez Altavista (voir le brevet de David Cossock, référence [2]).

L’idée du learning-to-rank est très simple. On détermine les caractéristiques importantes pour le classement, on pondère les caractéristiques, on regarde l’erreur commise en termes de qualité de résultat, puis on modifie les pondérations pour améliorer la qualité, et on recommence…

Les travaux de l’équipe de Chris Burges, chez Microsoft Bing (voir l’article [3]) vont tout changer pour les moteurs. Dès les premiers tests, ces méthodes vont montrer une réussite exceptionnelle pour calculer rapidement un bien meilleur classement, en se basant principalement sur des préférences exprimées par les utilisateurs du moteur. Les algorithmes de learning-to-rank ont bien évolués depuis (Google en a même présenté un à base de réseaux de neurones profonds, référence [4]) mais tous se “nourrissent” des préférences, qui peuvent être sous forme pointwise (j’aime/j’aime pas telle page), pairwise (je préfère la page A à la page B), ou encore listwise (voici la liste ordonnée des pages que j’aime). La plupart des approches modernes sont pairwise, car l’information de préférence par comparaison est la plus naturelle pour l’homme.

La suite est réservée à nos abonnés. Déjà abonné ? Se connecter

Envie de lire la suite ?

-10% sur nos Abonnements de 6 mois et + avec le code :

JEVEUXPASPAYERPLEINPOT

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Les moteurs de recherche tiennent-ils compte du comportement des internautes dans leurs SERP ?

Re-ranking et learning-to-rank

Cliquez ici pour annuler la réponse.

Quels KPI suivre pour son SEO ?

Quel contenu mettre en ligne pour répondre à quelle intention de recherche ?

Les articles du moment

Devenir une source que les IA citent : méthode, analyse moteur par moteur et limites

Pourquoi vous continuez de produire du contenu… pour rien [partie 2]

Fiche produit e-commerce : pourquoi le gain d’information devient un vrai levier SEO, Shopping et IA

Racheter un business en ligne : ce que 600 deals nous ont vraiment appris

Pourquoi vous continuez de produire du contenu… pour rien [Partie 1]

Dans les coulisses d’une PME e-commerce qui a câblé l’IA sur 100% de ses opérations SEM : méthode, architecture et premiers résultats

Retour d’expérience: l’IA appliquée au génie hydraulique