La notion de workspace n’est pas toujours facile à appréhender lorsqu’on commence à utiliser R. Dans cet article, je vais essayer d’apporter quelques éléments, notamment pour les débutants.
Le workspace (ou espace de travail – en français) est l’environnement de votre session R. Il comprend tous les objets que vous créez durant une session de travail sous R. Par exemple, lorsque vous importez des données, elles deviennent un objet de type data.frame
et sont intégrées à l’environnement global. De même lorsque vous réalisez un subset de données, ou lorsque vous stockez la sortie d’un modèle ou d’un test statistique dans un objet.
Par exemple, si vous employer la commande suivante :
b <- 5
Vous créez un objet b qui a pour valeur 5, et celui-ci vient s’inclure dans votre environnement.
De même si vous stockez dans un objet, nommé mod,
le résultat de la régression linéaire simple entre les variables Sepal.Length
et Sepal.Width
du jeu de données iris
(inclus dans le package dataset
qui est chargé par défaut – vous n’avez donc pas besoin d’importer les données iris), cet objet fera partie de votre environnement.
mod <- lm(Sepal.Length~Sepal.Width, data=iris)
Ces deux objets sont alors visibles dans l’onglet Environnement
de la fenêtre en haut à droite :
Lorsque vous quittez votre session de travail R, soit en cliquant sur la croix dans l’angle supérieur droit, soit par File –> Quit Session, soit par le raccourci CTRL + Q
, R vous propose d’enregistrer votre workspace :
R emploie la terminolgie “workspace image” qui peut être in peu déroutante au début.
Cette fonctionnalité (de proposer de sauver le workspace) est celle par défaut. Je vous montre un peu plus loin comment la modifier.
Si vous choisissez Save
, R va enregistrer ce workspace (c’est-à-dire les objets créés) dans le fichier .RData
qui se trouve à la racine de votre projet R.
Vous trouverez plus d’informations concernant la création de projets R dans mon article 7 étapes pour organiser son travail sous R.
Et quand vous ouvrirez à nouveau R (en cliquant sur le fichier R project), R va charger le fichier .RData
et vous retrouverez tous vos objets.
Là encore, ce chargement automatique du fichier .RData
est l’option par défaut.
En allant dans le menu Tools –> Global Options :
Vous pourrez voir que les options par défaut, concernant le workspace, sont :
.RData
dans le workspace à chaque ouverture de session.RData
à chaque fermeture de session.Vous pouvez alors modifier ces options.
En termes de bonne pratiques, les développeurs préfèrent décocher la case Restore.RData into workspace at startup
et mettre Save workspace to .RData on exit à Never
. Le but étant de favoriser un travail à l’aide de script et de toujours partir d’un environnement vierge afin de s’assurer que tous les objets sont bien créés par le script.
Personnellement, je fais exactement l’inverse ! Je garde coché Restore.RData into workspace at startup
et j’ai fixé Save workspace to .RData on exit à always
.
A vous de voir ce qui vous correspond le mieux !
Il peut être utile de sauver un workspace, soit comme une sauvegarde de son travail, soit pour le partager dans le cadre d’une collaboration. Cela permet de récupérer tous les objets nécessaires pour un travail, sans avoir à les créer par l’intermédiaire d’un script. Cela permet, par exemple, de transmettre des data frame formatés.
Imaginons que vous avez importé un fichier csv, que vous avez dû passer certaines variables en type factor
, et que vous avez modifié les levels
.
Si vous exportez ce fichier en csv et que vous le transmettez à votre collègue, celui-ci devra refaire l’importation et le formatage (à l’aide de votre script par exemple). Mais si vous transmettez votre workspace, le data frame formaté sera directement disponible.
Pour obtenir davantage d’informations concernant la modification des levels des facteurs, vous pouvez consulter mon article “Comment modifier l’ordre d’affichage dans un plot ?“
RStudio propose un outil pour exporter (ou sauvez) et importer facilement des worskspaces. Il s’agit des icônes de disquette et de dossier qui se trouvent dans l’onglet Environment
:
Pour sauver votre workspace, vous devez cliquer sur la disquette, cela permet d’ouvrir une fenêtre d’enregistrement :
Le fichier créé est bien de type workspace
. Son extension est cachée, mais elle est .RData
. Vous pourrez le voir en allant, sous windows, dans votre dossier associé au projet R, puis clic droit –> Propriétés.
Pour importer, un workspace, il suffit de cliquer sur l’icône du dossier avec la flèche verte qui en sort.
Si vous voulez essayer, vous pouvez télécharger un workspace exemple en cliquant sur le bouton ci-dessous :
Pour sauver / exporter un workspace, à la racine de votre projet R, vous devez employer la fonction save.image()
, comme ceci :
save.image(file="export_workspace.RData")
Attention à ne pas oublier l’extension .RData
:
Pour importer un workspace, vous devez employer la fonction load()
.
Pour essayer, vous pouvez télécharger ci-dessous un exemple de workspace nommé workspace_reg_logistique.RData
et le placer à la racine de votre projet R.
Puis utiliser la commande suivante :
load(file = "workspace_reg_logistique.RData")
Votre environnement devrait contenir tous ces éléments :
J’espère que ce petit article sur le workspace permettra au plus grand nombre de mieux comprendre cette notion d’espace de travail, et comment s’en servir.
Si cet article vous a plu, ou vous a été utile, vous pouvez le partager, et soutenir le blog en réalisant un don libre sur la page Tipeee.
Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.
2 Responses
Très bonne explication de la nation ” workspace”
Merci Claire.