C'est l'été ! Si vous êtes en agence, le rythme effréné des réunions s'est calmé et si vous êtes chez l'annonceur, les projets avancent sûrement à la vitesse d'un escargot asthmatique. Bref, vous avez du temps pour bichonner vos ou votre site et c'est le moment de lui faire un petit "nettoyage de printemps" pour qu'il soit frais et dispo pour la rentrée.

Pourquoi faire le ménage ?

Les internautes et notre internaute préféré Google n'aiment pas rencontrer des erreurs ou lire des informations obsolètes ou encore dénicher la promo de l'année périmée depuis deux ans.

Serp-Google-20ans-1

2003 ! Ça fait 20 ans !

Nous ne parlerons même pas des budgets de crawl et du temps perdu sur des pages.

Dans notre premier exemple, Google a l'air d'être venu voir la page il y a quelques jours … Pour une info vieille de 20 ans…

Cache-google

Google l'aime encore !

Souvent sur des sites qui ont beaucoup de bouteille, ce genre de contenu obsolète peut vite représenter des centaines et des centaines de pages qui n'ont plus aucun intérêt et qui peuvent dans certains cas pénaliser les nouveaux contenus.

Il n'est pas rare de trouver sur des sites e-commerce des quantité de pages créées pour chaque opération commerciale et pour chaque année. Un SEO a sans doute proposé un jour de faire une page par marronnier sans date de validité, mais les vieilles promos sont fréquemment encore cachées dans le site.

De la même façon, en trainant votre souris dans la Google Search Console, vous trouverez également des erreurs rencontrées par Google et si vous rôdez dans vos stats, vous repèrerez encore des erreurs à corriger.

Faire un peu de ménage ne sera pas superflu !  Alors, commençons !

Le crawl

Nous allons faire un crawl et tant qu'à y être, on ratisse large. Cela permettra par ailleurs de vérifier qu'il n'y a pas eu de régressions qui seraient passées inaperçues.

Pour cela, nous allons utiliser Screaming Frog mais un autre crawler fera aussi bien l'affaire. Je vous laisse faire vos propres réglages dans ce cas.

Les paramètres de crawl

On crawle tout – Il y a peu de chance de découvrir du Flash qui traîne, mais sait-on jamais !

On fouille partout

On n'oublie pas la pagination, on peut avoir de jolies surprises !

On va tout voir !

Les nofollow internes – Si et seulement si vous ne gérez pas les filtres de catégories d'un site Internet avec cette méthode. Sinon, vous allez être partis pour un crawl qui ne finit jamais. Dans ce cas, vous pourrez faire un échantillon pendant quelques minutes de crawl pour checker.

Les nofollow externes, cela permet juste de vérifier que les liens sortants ne sont pas en erreur, ce qui pourrait frustrer les internautes.

Astuce 1 : Vérifiez manuellement qu'ils sont bien accessibles par le robots.txt.

Astuce 2 : Vérifiez qu'un sitemap "inconnu" ne traine pas dans la Google Search Console. Souvent, les anciens sitemaps sont encore présents et ils créent surtout des erreurs.

La suite de cet article est réservée aux abonnés.

 

Sandrine Bertrand
Consultante senior chez SEO Hackers