Découvrez l'addin Esquisse !

Récemment, DreamRs (une entreprise FRANCAISE de conseils et d’expertises en data science spécialisée en R) a développé un addin R, nommé Esquisse, qui permet de créer des graphiques ggplot2 de façon interactive, en cliquer-glisser (ou drag and drop). Outre le fait que cet addin permet à ceux qui débutent avec ggplot2, d’obtenir plus simplement et plus rapidement les visualisations souhaitées, c’est aussi un véritable outil pédagogique ! En effet une fois la visualisation réalisée avec Esquisse, l’addin fournit les lignes de commandes à utiliser avec ggplot2 pour parvenir au même résultat.

C'est quoi un addin R?

Un addin R c’est une extension de R Studio, qui s’installe comme un package, et qui permet de simplifier certaines manipulations. Par exemple, vous pouvez retrouver ici un article sur l’addin color picker qui facilite la gestion des couleurs sous R.

Comment installer l'addin Esquisse ?

Il y a deux solutions. La plus simple consiste à installer la version déposée sur CRAN, par exemple en utilisant l’outil d’installation de R Studio :

La deuxième solution consiste à installer la version de développement depuis le répertoire GitHub de l’addin. Pour cela il est d’abord nécessaire d’installer le package devtools :

library(devtools)
devtools::install_github("dreamRs/esquisse") 

Comment utiliser Esquisse ?

Les données

Tous les jeux de données présents dans l’environnement R vont être accessibles dans l’outil Esquisse. J’ai choisi d’illustrer l’utilisation de cet addin avec le jeu de données “sleepstudy” du package “lme4”, je vais donc commencer par le charger :

data(sleepstudy) 

Ces données sont relatives à une expérimentation explorant l’effet de la privation de sommeil sur le temps moyen de réactionDix huit sujets sont soumis à trois heures de sommeil par nuit, pendant 10 jours ; leur temps moyen de réaction à une série de tests sont enregistrés quotidiennement.

Le jeu de données comporte alors trois variables :

  • Reaction : le temps de réaction
  • Days : le nombre jour écoulé depuis le début de l’expérimentation
  • Subjet : un numéro d’identification du sujet
head(sleepstudy) 
## Reaction Days Subject 
## 1 249.5600 0 308 
## 2 258.7047 1 308 
## 3 250.8006 2 308 
## 4 321.4398 3 308 
## 5 356.8519 4 308 
## 6 414.6901 5 308 

Je charge également les jeux de données “mtcars” et “iris” qui appartiennent au package “dataset” (installé par défaut à chaque session ), afin d’avoir plusieurs datasets dans mon environnement R.

data(mtcars)
data(iris) 

Ouverture d'Esquisse

Pour utiliser Esquisse, il suffit d’aller dans le menu Addins, de repérer la partie ESQUISSE et de choisir “ggplot2 builder”.

addin R esquisse ggplot2

Une fenêtre va alors s’ouvrir en superposition de R Studio:

addin R esquisse ggplot2

Dans la première partie de la fenêtre, vous allez pouvoir choisir, via un menu déroulant, sur quel jeu de données vous souhaitez travailler. Esquisse va vous proposer tous les jeux de données présents dans votre environnement R. Si votre environnement n’en contient pas, alors Esquisse vous proposera les jeux de données inclus dans le package ggplot2.

Une fois, le jeu de données sélectionné, il est possible de mettre de coté certaines variables (elles ne seront pas accessibles dans Esquisse).

Ici, je choisis de conserver les 3 variables du jeu de données “. Il suffit alors de valider tous ces choix :

addin R esquisse ggplot2

Cette fenêtre de sélection disparaît et laisse place à l’outil Esquisse à proprement parlé :

Exemple d'utilisation d'Esquisse

Les principe du cliquer-glisser

Ici, je souhaite réaliser un boxplot afin de visualiser l’évolution du temps de réaction des sujets au fil des jours. Pour cela, il suffit de déplacer l’étiquette Réaction dans la boite Y, puis l’étiquette Days dans la boite X. Le graph se crée alors de façon automatique.

Pour obtenir une représentation par sujet, il suffit de placer l’étiquette de la variable “Subject” dans la boite “Facet” :

Gestion des titres et labels des axes

Vous pouvez alors très facilement ajouter un titre, un sous titre, changer les noms des axes à partir de la boite “Labels et Title”, qui se trouve dans la partie inférieure gauche.

addin R esquisse ggplot2

Modification des options du plot

La boite “Plot options” permet d’accéder à des options spécifiques du type de plot considéré. Ici il s’agit d’un scatterplot puisque les variable Y et X sont de type numérique continue.

Dans le cas d’un scatterplot, il est possible :

  • d’ajouter une courbe de lissage,
  • de modifier la taille des points,
  • de changer la couleurs des points,
  • de modifier le thème du plot,
  • de changer la position de la légende, ou la supprimer complètement.

Remarque : Le type de graph, peut être modifié à partir de la boite en haut à gauche (au dessous de Choose data). Selon les variables sélectionnées en X et Y tous les choix ne sont pas disponibles.

Sélection des données

A partir de la boite “Data”, il est possible de  limiter les valeurs des variables du jeu de données considérées (ici Reaction, Days et Subject).

Obtenir le code et exporter le graph

La dernière boite, “Export & code” est extrêmement intéressante puisqu’elle permet :

  • d’obtenir le code ggplot2 du plot réalisé en cliquer-glisser,
  • de copier ce code (bouton Copy to clipboard),
  • d’insérer ce code directement dans la console (Insert Code in script),
  • d’exporter le plot dans un fichier PNG,
  • d’exporter le plot directement dans un power point !

 

Et par expérience, je sais que cette dernière option est génialissime ! En plus le plot est modifiable !

Et maintenant c’est à vous ! Faites des essais, modifiez, recommencez….

Pour aller plus loin

Vous pouvez retrouvez d’autres exemples d’utilisation de cet addin ici.

Si vous voulez connaître d’autres addin R, vous trouverez une liste ici.

Et enfin, si vous voulez en apprendre davantage sur le développement d’un addin, je vous conseille cette présentation de Fanny et Victor, les fondateurs de dreamRs

Conclusion

Je pense que cet addin Esquisse est vraiment un outil intéressant. D’abord parce qu’il peut permettre, notamment aux débutants, d‘explorer rapidement un jeu de données. Ensuite, parce qu’il permet d’essayer, de nouvelles choses, très facilement et de façon ludique. Et enfin, parce qu’en fournissant les lignes de commandes de ggplot2, il permet de progresser, dans l’utilisation de ce package.

Et vous, que pensez vous de cet addin ? Dite le moi en commentaire !

Si cet article vous a plu, ou vous a été utile, et si vous le souhaitez, vous pouvez soutenir ce blog en faisant un don sur sa page Tipeee 🙏

Crédits photos : stux.

12 réponses

  1. Claire, je n’y connaissais rien en ggplot (et je trouvais ça un peu trop compliqué) et maintenant j’ai juste envie de les utiliser partout. Merci de m’avoir fait découvrir cela !

  2. Claire, merci infiniment pour votre précieux article
    cet addin me plait beaucoup, il donne vraiment l’envie pour analyser les données.

  3. hello j’utilise la version r studio Version 1.1.463 dont le chargement du package esquisse n’est pas disponible que faire? je dispose d’un r version 3.5.3 en plus mais je suis plus sur rstudio vu sa praticabilité plus simple

  4. Bonjour, lorsque je souhaite ouvrir le Addins ‘ggplots2’ builder du package ESQUISSE, c’est ESQUISSE qui s’ouvre et non ggplot2 builder.
    Je peux construire les graphs de la même manière, mais on ne peut les visualiser correctement.
    Une astuce?
    Merci

    1. Bonjour Natacha,

      Vous pouvez essayer de réduire le zoom sur R Studio, avant d’ouvrir esquisse (ou ggplot2 builder).
      Pour cela, allez dans le menu de RStudio, dans l’onglet View et choisissez zoom out. Vous pouvez aussi employer le raccourci CTRL + -.
      Bonne continuation.

  5. Bonsoir ! Merci beaucoup pour l’article. Serait-ce possible d’utiliser l’addin Esquisse sous R sans Rstudio? Votre réponse me sera d’une grande utilité

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.