Robots.txt, crawl et indexation (1ère partie)

Le fichier robots.txt est un grand classique du Web et du SEO. Pourtant, êtes-vous sûr de l’utiliser à bon escient et de bien comprendre son fonctionnement ? En effet, une utilisation erronée de ce fichier peut amener des soucis d’indexation, voire provoquer des pertes de référencement. Voici donc, dans cet article en deux parties, un état de l’art de la meilleure façon d’utiliser le fichier robots.txt pour mieux contrôler la vision de votre site qu’auront les moteurs de recherche. Vous risquez d’être surpris….

Cet article fait partie de la Lettre Réacteur #142 du mois de novembre 2012

Début de l’article :

Revue d’URL en français…

Le fichier robots.txt est l’un des plus anciens outils mis à la disposition des webmasters pour contrôler le comportement des robots d’exploration du web sur leurs sites. On pourrait donc imaginer que le rôle du robots.txt est connu, que la syntaxe de ses directives est maîtrisée, et que l’impact de leur utilisation est évalué correctement. Il n’en est rien…

Dans la pratique, le référenceur rencontre très souvent des robots.txt utilisés à mauvais escient, et même certains cas dans lesquels il peut jouer un rôle très néfaste pour un bon référencement. Et la plupart des erreurs commises à propos du robots.txt tirent leur origine d’une mauvaise interprétation du rôle de ce fichier…

Ne pas confondre « crawl » et « indexation »

L’une des erreurs les plus répandues parmi les webmasters (et, hélas, parmi les « pros » du référencement, les questions posées lors de l’examen CESEO à propos du robots.txt font souvent des dégâts chez les candidats), c’est de confondre « téléchargement d’un contenu » et « indexation ».

Les directives d’un fichier robots.txt ont pour objectif unique d’indiquer aux moteurs (en tout cas à ceux qui respectent le protocole robots.txt) que le webmaster ne souhaite pas que certaines URL soient téléchargées. Mais qu’en est-il de leur indexation ? …

La suite est réservée à nos abonnés. Déjà abonné ? Se connecter

Envie de lire la suite ?

-10% sur nos Abonnements de 6 mois et + avec le code :

JEVEUXPASPAYERPLEINPOT

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Robots.txt, crawl et indexation (1ère partie)

Cliquez ici pour annuler la réponse.

La situation fiscale de Google en France

Le référencement des vidéos dans YouTube

Les articles du moment

Ne vous fiez pas à vos yeux : les pièges invisibles qui faussent l’analyse SEO

Récupérer son SEO après le piratage de son site WordPress

Shopify SEO : 6 aspects sous-estimés qui font la différence

Gérer la bombe à retardement du contenu dupliqué (avant qu’il n’impacte vos revenus)

Knowledge Graph : et si Google ne nous disait pas tout ?

La génèse d’une météo pour Google Discover – Partie 2

Optimiser la vitesse d’un site WordPress pour les grandes audiences – Partie 2