C'est de la data et mon expeRtise afin d'en tirer le maximum

Comprendre le workspace R en 3 minutes

La notion de workspace n’est pas toujours facile à appréhender lorsqu’on commence à utiliser R. Dans cet article, je vais essayer d’apporter quelques éléments, notamment pour les débutants.

Table des matières

C'est quoi le workspace ?

Le workspace (ou espace de travail – en français) est l’environnement de votre session R. Il comprend tous les objets que vous créez durant une session de travail sous R. Par exemple, lorsque vous importez des données, elles deviennent un objet de type data.frame et sont intégrées à l’environnement global. De même lorsque vous réalisez un subset de données, ou lorsque vous stockez la sortie d’un modèle ou d’un test statistique dans un objet.

Par exemple, si vous employer la commande suivante :

b <- 5 

Vous créez un objet b qui a pour valeur 5, et celui-ci vient s’inclure dans votre environnement.

De même si vous stockez dans un objet,  nommé mod, le résultat de la régression linéaire simple entre les variables Sepal.Length et Sepal.Width du jeu de données iris (inclus dans le package dataset qui est chargé par défaut – vous n’avez donc pas besoin d’importer les données iris), cet objet fera partie de votre environnement.

mod <- lm(Sepal.Length~Sepal.Width, data=iris) 

Ces deux objets sont alors visibles dans l’onglet Environnement de la fenêtre en haut à droite :

environnement R et workspace

Sauvegarde du workspace

Lorsque vous quittez votre session de travail R, soit en cliquant sur la croix dans l’angle supérieur droit, soit par File –> Quit Session, soit par le raccourci CTRL + Q, R vous propose d’enregistrer votre workspace :

sauver les workspace en quittant sa session

R emploie la terminolgie “workspace image” qui peut être in peu déroutante au début.

Cette fonctionnalité (de proposer de sauver le workspace) est celle par défaut. Je vous montre un peu plus loin comment la modifier.

Le fichier .RData

Si vous choisissez Save, R va enregistrer ce workspace (c’est-à-dire les objets créés) dans le fichier .RData qui se trouve à la racine de votre projet R.

Le fichier .RData du projet R

Vous trouverez plus d’informations concernant la création de projets R dans  mon article 7 étapes pour organiser son travail sous R.

Et quand vous ouvrirez à nouveau R (en cliquant sur le fichier R project), R va charger le fichier .RData et vous retrouverez tous vos objets.

Là encore, ce chargement automatique du fichier .RData est l’option par défaut.

Changer les options par défaut concernant le workspace

En allant dans le menu Tools –> Global Options :

Modification des options du workspace

Vous pourrez voir que les options par défaut, concernant le workspace, sont :

  • de restaurer le fichier .RData dans le workspace à chaque ouverture de session
  • de demander l’enregistrement du workspace dans le fichier .RData à chaque fermeture de session.
Modifier les options par défaut concernant le workspace

Vous pouvez alors modifier ces options.

En termes de bonne pratiques, les développeurs préfèrent décocher la case Restore.RData into workspace at startup et mettre Save workspace to .RData on exit à Never. Le but étant de favoriser un travail à l’aide de script et de toujours partir d’un environnement vierge afin de s’assurer que tous les objets sont bien créés par le script.

Personnellement, je fais exactement l’inverse ! Je garde coché Restore.RData into workspace at startup et j’ai fixé Save workspace to .RData on exit à always.

A vous de voir ce qui vous correspond le mieux !

Exporter (sauver) et importer un workspace

A quoi ça sert ?

Il peut être utile de sauver un workspace, soit comme une sauvegarde de son travail, soit pour le partager dans le cadre d’une collaboration. Cela permet de récupérer tous les objets nécessaires pour un travail, sans avoir à les créer par l’intermédiaire d’un script. Cela permet, par exemple, de transmettre des data frame formatés.

Imaginons que vous avez importé un fichier csv, que vous avez dû passer certaines variables en type factor, et que vous avez modifié les levels.

Si vous exportez ce fichier en csv et que vous le transmettez à votre collègue, celui-ci devra refaire l’importation et le formatage (à l’aide de votre script par exemple). Mais si vous transmettez votre workspace, le data frame formaté sera directement disponible.

Pour obtenir davantage d’informations concernant la modification des levels des facteurs, vous pouvez consulter mon article “Comment modifier l’ordre d’affichage dans un plot ?

Via RStudio

RStudio propose un outil pour exporter (ou sauvez) et importer facilement des worskspaces. Il s’agit des icônes de disquette et de dossier qui se trouvent dans l’onglet Environment:

importer et exporter un workspace

Pour sauver votre workspace, vous devez cliquer sur la disquette, cela permet d’ouvrir une fenêtre d’enregistrement :

Sauver un workspace

Le fichier créé est bien de type workspace. Son extension est cachée, mais elle est .RData. Vous pourrez le voir en allant, sous windows, dans votre dossier associé au projet R, puis clic droit –> Propriétés.

Pour importer, un workspace, il suffit de cliquer sur l’icône du dossier avec la flèche verte qui en sort.

Si vous voulez essayer, vous pouvez télécharger un workspace exemple en cliquant sur le bouton ci-dessous :

Par les lignes de commandes

Pour sauver / exporter un workspace, à la racine de votre projet R, vous devez employer la fonction save.image(), comme ceci :

save.image(file="export_workspace.RData") 

Attention à ne pas oublier l’extension .RData:

exportation d'un workspace par une ligne de commandes

Pour importer un workspace, vous devez employer la fonction load().

Pour essayer, vous pouvez télécharger ci-dessous un exemple de workspace nommé  workspace_reg_logistique.RData et le placer à la racine de votre projet R.

load(file = "workspace_reg_logistique.RData") 

Votre environnement devrait contenir tous ces éléments :

 

importation de workspace par la fonction load

Conclusion

J’espère que ce petit article sur le workspace permettra au plus grand nombre de mieux comprendre cette notion d’espace de travail, et comment s’en servir.

Si cet article vous a plu, ou vous a été utile, vous pouvez le partager, et soutenir le blog en réalisant un don libre sur la page Tipeee.

Crédit photo : Manfred Richter de Pixabay

Poursuivez votre lecture

2 réponses

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.