Connaissez-vous R ? Il s'agit d'un langage de programmation et un environnement de travail largement utilisé lorsqu'il s'agit d'analyser des données statistiques issues de sources diverses. Dans cet ensemble de deux articles, nous allons vous présenter cet outil et son utilisation pour proposer des graphiques et tableaux de bord plus ou moins simples ou sophistiqués en partant des données extraites de Google Analytics. Apprenons, ce mois-ci, à récupérer les informations d'Analytics et à créer un graphique simple affichant le nombre de visites sur un site web.

Début de l'article :

Google Analytics est probablement l’un des outils de récolte de données de sites web le plus utilisé au monde. Son interface web est sympathique et ergonomique, mais pas toujours très pratique, notamment pour faire des représentations réellement adaptées au besoin de son entreprise ou de son activité. Mais si l’interface web n’est pas toujours telle qu'on la désirerait, les données existent dans l’outil, et il serait dommage de s'en passer uniquement parce que les interfaces ne sont pas « au top ». Ce mois-ci nous allons commencer un diptyque sur l’utilisation de l'outil R pour créer des visualisations spécifiques à partir des données issues de Google Analytics.

Qu’est-ce que R ?

R (disponible sur le site [1]) est un langage de programmation et un environnement de travail utilisé pour un très grand nombre de tâches dont des analyses statistiques de données, ou encore la création de visualisations graphiques. R est open source et a été bâti autour d’un langage appelé S, developpé aux Bell Labs par John Chambers dans les années 70 (voir [2]). A l’origine de ce langage, on retrouve Ross Ihaka et Robert Gentleman, mais il existe aujourd'hui une communauté particulièrement dynamique qui contribue au développement de l’outil.

Pour installer R, rien de compliqué, il suffit de se rendre sur le site [1] et de télécharger l’archive qui convient à votre système d’exploitation. Vous pouvez également, si vous le souhaitez, utiliser une interface graphique plus fournie que celle de base en téléchargeant Rstudio qui est gratuit dans sa version open source sans support. Pour se servir de R, il existe deux modes de fonctionnement : en ligne de commande (mode interactif) ou en écrivant ces commandes dans des fichiers qui seront interprétés ensuite (scripts). Tout au long de cet article, nous utiliserons le mode interactif, qui permet de saisir des commandes de manière simple, et de procéder par étapes tout en contrôlant le résultat en temps réel.

R est un système très riche qui possède de nombreuses fonctionnalités, notamment grâce à son système de packages. Un package est tout simplement une bibliothèque de fonctions utiles, créees par l’équipe de développement de R ou par des tiers. Pour installer un package, on peut passer via l’interface graphique ou via la commande install.packages. Vous pourrez ensuite utiliser le package en le chargeant ...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).