En tant qu'utilisateurs du moteur de recherche Google, nous oublions parfois que derrière ces milliards de requêtes se cache toute une mécanique avancée et extrêmement pointue. Dans la majeure partie des cas, nous devons aider les algorithmes à comprendre ce que nous souhaitons exactement, bien au-delà des simples mots-clés que nous tapons dans le champ de recherche. Ce procédé passe par certaines de nos actions mais aussi au travers des divers paramètres d'URL utilisés par le moteur de recherche. Leur compréhension peut nous aider à gagner parfois beaucoup de temps au quotidien. Mais attention, tous ne sont pas visibles…
Google fait partie des moteurs de recherche qui préfèrent ne pas afficher tous les paramètres dont il a besoin au sein de ses URL. Ainsi, lorsque nous procédons à une recherche simple, nous voyons essentiellement des paramètres courants comme celui reprenant la requête tapée ou la page visitée au sein des centaines d'autres qui composent les pages de résultats (SERP). Voyons donc ce qui se cache derrière certains arguments d'URL, parfois obscurs pour le commun des mortels…
Quelques prérequis techniques
Avant de nous lancer tête baissée dans les paramètres des adresses de Google, nous devons comprendre pourquoi certains arguments sont visibles et d'autres non. Et surtout, dans le cas où ces paramètres sont naturellement masqués, comment se fait-il que nous puissions les voir et les connaître ?
Dans les faits, plusieurs aspects techniques expliquent comment Google peut choisir d'afficher ou masquer des paramètres. Tout d'abord, il faut différencier les requêtes de type GET (par défaut) et de type POST.
Les requêtes GET affichent les données dans les URL et permettent de facilement transmettre les informations d'une page à une autre. En effet, il suffit de récupérer le paramètre GET dans l'URL, comme par exemple le numéro de la page visitée, pour la transmettre à la page suivante, et ainsi de suite. C'est le meilleur moyen de transmettre des données non risquées, c'est pourquoi Google utilise cette méthode classique pour fournir la requête (paramètre « q », signifiant « query » en anglais) et le nombre de résultat par page (paramètre « start » qui lui permet de savoir à quel résultat les pages doivent commencer, comme « 20 » pour la troisième page par exemple).
À contrario, l'envoi de données en méthode POST masque les informations par défaut, ce qui est très pratique pour les données plus sensibles et cela permet d'éviter d'obtenir des URL d'une longueur incommensurable. Google procède ainsi pour cacher certaines informations par défaut, comme nous le verrons un peu plus loin dans cet article.
Maintenant que nous différencions les paramètres GET et POST, vous devez vous demander comment nous pouvons connaître certains paramètres cachés de Google ? Rien de magique là-dedans, nul besoin de Gérard Majax, mais simplement de deux ou trois procédés simples :
- L'utilisation des vues « en cache » de Google affiche des paramètres supplémentaires relatifs aux URL à visiter.
Fig. 1. URL referer avec paramètres provenant du cache de Google.
Mathieu Chartier
Consultant-Formateur et webmaster indépendant, Internet-Formation (https://www.internet-formation.fr)