confiance

Quiconque s'intéresse au SEO et aux moteurs de recherche a déjà entendu parler de la notion de "TrustRank". Mais ce terme est trompeur et sa définition originale ne correspond pas à la façon dont Google envisage la confiance qu'il a dans un site. D'une façon générale, il existe de nombreux algorithmes permettant de propager des notions de confiance et, a contrario, de méfiance pour noter une page ou un site web et ainsi écarter le spam. En voici quelques exemples décrits dans cet article...

Début de l'article :


En réfléchissant au titre de l'article de ce mois-ci, nous nous sommes posés une question fondamentale : devions-nous y mettre le mot TrustRank, ou bien au contraire fallait-il l'éviter, pour que votre lecture ne commence pas sur un malentendu ? Comme vous le voyez, nous avons choisi de prendre le taureau par les cornes et d'en parler, sans le mettre dans le titre !

Dans cet article, nous allons donc évoquer les différents algorithmes qui ont été envisagés par les chercheurs dans le domaine de la recherche d'information pour propager la confiance, ou la non-confiance, sur le web. Si nous avons déjà évoqué le terme de TrustRank, c'est parce que cet algorithme, mis au point en 2004 par Zoltan Gyongyi, Hector Garcia-Molina et Jan Pedersen, est l'archétype des méthodes de propagation de la confiance. Son souci est qu'il a été longtemps confondu avec ce que Google appelait le trustrank, et qui n'avait pas de rapport (le vocable trustrank a d'ailleurs été abandonné par Google en 2009, qui lui a préféré le mot de personrank).

L'idée derrière la propagation de la confiance et de la non-confiance

L'idée de base est plutôt simple : le problème des méthodes qui calculent un score à partir des liens sur le web (comme le PageRank par exemple) est l'initialisation : si toutes les pages sont égales, les pages de spam finissent par gagner, car leur nombre est virtuellement infini. En revanche, si on sait repérer quelques pages qui sont de grande qualité et confiance, on va pouvoir s'en servir comme point de départ pour propager une information de qualité selon l'adage « les amis de mes amis sont mes amis ».

Inversement, si je repère quelques voyous, je vais partir du principe que les amis des malfaiteurs sont coupables par association. Ainsi une page de confiance qui fait un lien vers un tiers donnera un boost à ce tiers, et une page de faible qualité qui ferait un lien à un site tiers le plomberait, même légèrement.
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).