Depuis de nombreuses années que sont explorés les algorithmes de pertinence des moteurs de recherche, il semblerait qu'un critère important, en termes de netlinking, soit la nécessité d'obtenir des liens "non apparentés" : sites différents, auteurs distincts, externes plutôt qu'internes, etc. Mais ce point n'était pas si simple à prouver que cela. Or, un brevet déposé par Google semble nous donner quelques indications complémentaires à ce sujet. La lecture approfondie de ce brevet semble indiquer, s'il est mis en place par le moteur de recherche, qu'effectivement, tous les liens ne sont pas égaux devant le Dieu Google...

Cet article fait partie de la Lettre Réacteur #120 du mois de novembre 2010

Début de l'article :

En parcourant les blogs et les sites sur le référencement, un conseil revient régulièrement : pour améliorer son netlinking pour Google, il vaudrait mieux privilégier les liens émanant de noms de domaines différents (en d'autres termes, un lien externe a "plus de poids" qu'un lien interne).

Et ces conseils sont parfois assortis d'une autre conjecture : recevoir une multitude de liens émanant d'un seul et même site n'est pas optimal, car tous les liens ne sont pas pris en compte ou (cela dépend des auteurs) n'ont pas le même poids dans le calcul des scores des pages...

Ces "bonnes pratiques" sont tirées d'observations et de tests empiriques, mais force est de constater qu'il n'existe pas de démonstrations étayées par des études statistiques ou des preuves convaincantes de leur réelle efficacité.

Un brevet récemment publié par Google (Mai 2010) donne néanmoins un peu plus de crédit à ces affirmations. Intitulé "Determining quality of linked documents" (détermination de la qualité de documents liés), ce brevet décrit en fait une méthode d'évaluation de la qualité des liens dont les effets pourraient justifier les conseils cités plus haut.

Nous allons d'abord essayer de comprendre pourquoi il peut être utile de donner plus de poids à certains liens qu'à d'autres, avant de s'intéresser à la méthode décrite dans le brevet.

Dans la formule initiale du PageRank, tous les liens sont égaux

Dans la formule du PageRank publiée dans l'article de Larry Page et Serguey Brin (les fondateurs de Google), tous les liens sont pris en compte dans le calcul du score. Bien sûr, le PageRank des pages est différent, et le "jus" transmis d'une page à une autre dépend du PageRank de la page de départ et du nombre de liens, mais la formule est la même quel que soit la nature du lien. Par exemple, aucune différence n'est faite entre les liens internes (provenant du même domaine ou du même sous domaine) ou externes. On ne tient pas compte non plus de l'emplacement du lien dans la page.

Cette approche simple (d'aucuns diront simpliste), a été critiquée par certains chercheurs qui y voient un défaut majeur de l'algorithme : ce score, censé représenter l'importance d'une page sur la Toile, repose sur un modèle déconnecté de la réalité, à savoir le surfeur aléatoire.

...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).