Quand on travaille sur le référencement, il peut arriver que notre page remplisse toutes les conditions nécessaires pour pouvoir être positionnée, mais reste invisible dans Google. On a beau chercher des explications au niveau technique, éditorial, liées à l’ancienneté du site, la Search Console n’envoie aucun signal qui pourrait éclaircir la situation, la page « Actions manuelles » reste vierge. Il est probable que vous êtes devenu victime d’un des post-filtres de Google, non-évidents du premier regard, mais néanmoins toujours à côté de nous. Dans cet article nous allons passer en revue les principaux filtres de Google (SafeSearch, DMCA, Droit à l'oubli, etc.) : en quoi consistent-ils et comment les identifier dans la recherche ?

Comme on le sait, référencer un site prévoit tout un ensemble d’actions pour le rendre compatible à la fois aux besoins des internautes et à ceux des moteurs de recherche, dont Google. Et le plus souvent, cela est suffisant.

Mais si malgré cela, les résultats ne nous satisfont pas, on revoit nos optimisations en cherchant des améliorations sur l’aspect technique, éditorial ou popularité. Et cette approche est tout à fait correcte, avec une seule réserve qu’il existe également, si on peut le dire, des pouvoirs « d’en haut » que les moteurs de recherche et Google y compris peuvent appliquer par-dessus ses résultats et qui influencent directement les positionnements.

Ainsi à côté des facteurs de classement classiques, une page ou un site web peut ne pas apparaître dans les résultats de recherche à cause :

  1. D'un filtrage de contenu explicite dû au filtre SafeSearch.
  2. D'une plainte DMCA due à une infraction des droits d’auteur.
  3. D'une décision de la Cour de justice de l'Union européenne (CJUE).
  4. De restrictions gouvernementales.

Le filtre SafeSearch ou « filtre adulte »

Le filtre SafeSearch, également connu sous le nom de « filtre adulte », est le filtre le plus présent dans les résultats de recherche de Google de tous types : recherche classique, images ou vidéos. On y a à faire à chaque fois qu’on utilise Google, sans forcément s’en rendre compte, tout simplement parce qu’il est activé par défaut, notamment sur Google Images.

Option SafeSearch activée par défaut dans Google Images.

Le filtre SafeSearch a vu le jour vers l’an 2000 sous le contrôle direct de Matt Cutts. A l’époque, Google n’utilisait pas encore l’apprentissage automatique pour identifier du contenu pornographique sur des photos et le filtrage se basait uniquement sur le contenu textuel des pages.

Des années passaient et le filtre SafeSearch devenait de plus en plus vigilant et précis, notamment grâce à la mise en œuvre du machine learning et des technologies de reconnaissance des images (OCR). Aujourd’hui, il analyse à la fois le contenu textuel comme visuel et s’est doté d’une équipe dédiée à cette fonctionnalité.

Le filtre SafeSearch effectue le filtrage du contenu explicite pour l'éliminer des résultats de recherche. Parmi les résultats explicites figurent les contenus à caractère sexuel, pornographique, violent et sanglant. Ça, c’est ce que nous annonce la page de documentation officielle de Google.

Mais en parcourant les options dans l’API de Google (SafeSearch Annotation), on identifie le fait qu'il va bien au-delà.

Il existe 5 types de catégories de contenus que Google cherche, analyse et classe dans la catégorie du contenu explicite :

  1. Adulte - le contenu réservé aux adultes contenant des éléments tels que de la nudité, des images ou des dessins animés pornographiques ou des activités sexuelles.
  2. Spoof – une modification apportée à la version originale de l'image pour la faire paraître drôle ou offensante.
  3. Medical – contenu à caractère médical.
  4. Violence – contenu avec des scènes de violence.
  5. Racy – vêtements étriqués ou transparents, nudité couverte, poses obscènes ou provocantes, ou gros plans de zones sensibles du corps.

Une question légitime que vous pouvez poser à ce moment-là est : pourquoi puis-je y être touché si je ne publie pas de photos à caractère adulte ?

Pour 2 raisons :

  • Comme tout algorithme automatique, le filtre SafeSearch peut se tromper.
  • Il calcule une probabilité (« likelihood ») que votre contenu est adulte et les probabilités ne sont pas un axiome et sont sujettes aux erreurs.

Voyons quelques exemples à l’aide de l’outil de test de l’API de Google. En analysant la photo de la fameuse sculpture de Rodin, Google la considère comme « racy » - piquante :

La suite de cet article est réservée aux abonnés.

Alexis Rylko, directeur technique SEO chez iProspect (https://www.iprospect.com/https://alekseo.com/)