Résumé de l'article :

Nous en avons parlé le mois dernier, les techniques de Web-scraping permettent de récupérer, de "piocher", de traiter et d'archiver le contenu ou une partie d'une page web. S'ils sont des outils de veille indispensables, ils peuvent également être utilisés en référencement naturel pour apporter sur une page web du contenu venu d'autres sources, proposant ainsi aux moteurs de recherche du texte et un contenu éditorial souvent mis à jour. Si le système peut paraître complexe au départ pour les non-initiés, il s'avère rapidement beaucoup plus facile à mettre en œuvre qu'on ne l'imagine si vous suivez bien nos indications...

Début de l'article :

Nous en avons parlé le mois dernier : le principe du Web-scraping consiste à intégrer sur son site du contenu web et, par exemple, un flux RSS (interne ou externe) en utilisant un outil adapté. Imaginons que vous offriez à vos lecteurs une page « Actualités », ils apprécieront le fait de pouvoir lire une page régulièrement actualisée. Cela peut être un des flux RSS que propose votre site, des flux RSS provenant de sites tiers ou un mélange des deux. Vous pouvez alors utiliser Yahoo! Pipes afin de mixer et de filtrer les différentes sources et générer une sorte de « méga-flux ». La différence, en termes de référencement, est importante entre du code JavaScript, tel qu'il est utilisé lors de la création d'un Snippet, et du code PHP « pur et dur ». Si les internautes n'y verront que du feu, il n'en sera pas de même pour les moteurs de recherche qui ne lisent pas le code JavaScript mais se délecteront des liens "en clair" trouvés dans vos pages PHP. Et ces derniers seront d'autant plus intéressés par votre page puisqu'elle présentera un contenu sans cesse actualisé mais également « lisible ». Il sera ainsi possible de rendre quotidienne la mise à jour d'une page en s'appuyant sur du contenu externe...

Au final, nous terminerons notre exploration des possibilités offertes par le Web-scraping en analysant, maintenant, en quoi il constitue un élément indispensable au SEO.

L'article n'est disponible ici que sous la forme d'un extrait.
Il est accessible en lecture intégrale uniquement aux abonnés à la lettre professionnelle « Réacteur » du site Abondance...

Cliquez ici pour vous abonner à la lettre 'Réacteur' !

Vous êtes déjà abonné ? L'article complet est disponible dans la zone "Abonnés". Cliquez ici pour vous identifier.

Plus d'infos pour les abonnés :

Taille de l'article : 11 pages (format A4 Word)
Auteur : Jean-Noël Anderruthy, webmaster spécialisé dans les technologies Google (http://googlexxl.blogspot.com/).

Formats disponibles : Word, PDF, HTML
Date de parution : 16 novembre 2009

Télécharger l'article au format PDF :
http://abonnes.abondance.com/archives/2009-11/

Sommaire de la lettre Réacteur de novembre 2009 :
http://abonnes.abondance.com/archives/2009-11/

Accès à la zone "Abonnés" du site Abondance.com :
http://abonnes.abondance.com/

Plus d'infos pour les non-abonnés :

Comment s'abonner à la lettre Réacteur ? :
http://commande.abondance.com/

Sommaire de la lettre Réacteur de novembre 2009 :
http://lettres.abondance.com/sommaire-RR-112009.html

Tous les articles de l'année 2009 :
http://lettres.abondance.com/articles-rechref-2009.html

Sélection des meilleurs articles des derniers mois : :
http://www.abondance.com/article-abonnes.html