Plusieurs éditeurs de sites web se sont aperçus, dans le passé, que des webmasters inconvenants copiaient purement et simplement leur contenu en pensant bénéficier d'un bon référencement obtenu par le site "source" parfois après de longs mois, voire années, de travail. Ce type de copie illicite s'effectuant bien entendu sans demander la moindre autorisation. Comment détecter ces plagiats ? Comment en découvrir les auteurs ? Comment faire pour stopper ces agissements ? Cet article tente d'apporter quelques éclairages à ces questions cruciales...

Préambule

Il pourrait être facile de considérer Internet comme une zone de non-droit. Or, comme tout autre média, il est soumis au code de la propriété intellectuelle. Lorsqu'un site se lance dans le référencement, il peut lui arriver de s'inspirer de ce que font les concurrents. Pour autant, s'inspirer ne signifie pas copier exactement ce qu'ils font ! Car dans ce cas il s'agit de plagiat, ce qui est répréhensible et passible de poursuites judiciaires !

Outre le préjudice moral et financier, le plagiat peut engendrer un préjudice de visibilité au sein des moteurs de recherche pour votre site, entrainant au mieux une perte de résultats, au pire la disparition de votre site au profit de l'url incriminée (phénomène de "duplicate content").

Il suffit d'avoir une forte notoriété publique, un Page Rank avec un excellent indice (au-delà de 6) et une visibilité dans les moteurs de recherche sur des requêtes stratégiques qui renvoient plusieurs millions de résultats pour que vous vous attiriez certainement des convoitises ! Il faut alors redoubler d'attentions et discerner avant tout plusieurs points :

- Comment détecter le plagiat ?

- Comment découvrir les auteurs du plagiat ?

- Comment faire pour stopper les agissements des contrevenants ?

Avant d'entamer toute investigation, munissez- vous d'outils qui vont faciliter vos recherches. Un navigateur comme Firefox vous aidera notamment dans vos analyses. Ce navigateur très performant présente l'avantage d'avoir des composants très utiles pour le référencement. Certains permettent (entre autres) de désactiver Javascript ou les feuilles de Style d'une page web… Un véritable « couteau suisse » à l'usage des webmasters. Vous pourrez télécharger ce plug-in à l'adresse suivante : http://chrispederick.com/work/webdeveloper/

Avec cet outil, vous pourrez afficher tout contenu susceptible d'être caché et couper toute redirection utilisée avec le Javascript. Dès lors, une page « mise à nue » dévoile parfois bien des secrets...

Le cas échéant, vous aurez également besoin d'analyser l'arborescence complète d'un site web.

Dans ces cas là, un logiciel « aspirateur de site » comme HT Tracks (http://www.01net.com/windows/Internet/aspirateur/fiches/1911.html) peut être très utile. Il va vous permettre de consulter et de créer la structure complète du site à analyser avec ses répertoires et sous-répertoires.

Comment détecter le plagiat ?

1ére solution : De nombreux outils statistiques comme Xiti (http://www.xiti.com/), eStat (http://www.estat.com/) ou Decisive Insight (http://www.di.nextedia.com/) et bien d'autres donnent de nombreuses informations sur la visibilité, le trafic, la transformation au niveau des actions (ventes, inscription à une newsletter…). Ils permettent de connaître les mots qui ont été utilisés par les internautes pour accéder à votre site internet via les moteurs de recherche. Faites attention à bien analyser en profondeur les requêtes utilisées par les internautes pour trouver votre site Internet !

Si vous rencontrez des mots clés suspects (mots clés incohérents par rapport à votre contenu, mots clés associant une marque concurrente avec un mot clé générique de type...), identifiez immédiatement la provenance. S'il s'agit de référencement naturel, analysez la provenance et faites une recherche sur le mot clé sur le moteur concerné pour connaître la page qui ressort dans les résultats.

Par exemple, éditeur d'un site de voyages, vous avez comme mot clé d'accès « maison de retraite » ou « partir en retraite » parmi les mots clés les plus générateurs de trafic en provenance de Google. Dès lors, il est possible d'analyser très rapidement la source du problème. Sur la requête « maison de retraite », vous chercherez les sites qui ressortent en recherche naturelle et en liens sponsorisés (LS). Rien d'anormal en ce qui concerne les LS mais dans la recherche naturelle, vous vous arrêtez sur l'un d'entre eux car vous vous apercevez que le site a entièrement recopié l'environnement de votre charte graphique : les menus sont rigoureusement identiques et le logo de votre marque a été contrefait. Mieux ! En étudiant le code source de la page, vous vous apercevez que le site incriminé a tout simplement intégré vos propres tags de votre outil statistique (Xiti ou autre) sur ses pages. CQFD. Il est temps de prendre contact avec le site concerné...

2ème solution : Il existe de nombreuses commandes utiles pour le référencement. La plus utilisée est la commande « site : »  valable pour les principaux moteurs de recherche (Yahoo, Google, Live Search). Cette commande permet de connaître le nombre de pages qui ont été indexées par le moteur de recherche. Attention aux chiffres / statistiques que vous pourrez obtenir. Ils sont souvent fournis à titre indicatif mais donnent un bon aperçu de l'état d'indexation d'un site. Vérifiez avant tout que les urls ont été bien indexées et qu'un contenu (appelé snippet dans le langage du référencement) soit bien associé à chaque url.


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).