Versionnage de vos scripts avec RStudio + Git

Dans cet article je vais vous montrer comment faire du versionnage de votre script, en local, avec R studio.

C’est quoi le versionnage ?

Le versionnage de votre script c’est le fait de garder une trace de toutes les modifications que vous avez réalisé entre sa version initiale et sa version finale.

 

Sans versionnage, vous sauvegardez probablement votre script lors de grosses modifications ou à  la fin de chaque journée, en incrémentant le nom du fichier. Par exemple “mon_super_script_v1”, puis “mon_super_script_v2” etc… ou encore “mon_super_script_v150118”, puis “mon_super_script_v160118″, voire mon_super_script_v160118_17h” !

Au final vous vous retrouvez avec un working directory envahit des différentes versions de votre script. Et dans quelques semaines vous aurez beaucoup de mal à vous rappeler quelle est la différence entre “mon_super_script_v1” et “mon_super_script_v2” ?

Avec le versionnage, vous n’avez plus besoin de renommer votre script, vous n’en gardez qu’une seule version, la dernière. Votre working directory n’est plus envahit. Pour autant vous ne perdez pas les modifications puisqu’elles sont enregistrées à part, dans un sorte de tracker. Et surtout vous pouvez les visualiser très facilement.

Voici un exemple très simple:commit git rstudioLes sections grises correspondent à du code inchangé, les sections rouges correspondent à du code supprimé, et les sections vertes correspondent à du code ajouté. 

Comment ça s’installe ?

C’est assez simple :1. Organisez votre travail sous la forme d’ un projet R, comme décrit dans l’article “Importer facilement vos données dans le logiciel R“.2. Télécharger et installer le logiciel Git Bash (pour windows) ici.3. Ouvrer votre projet R et aller dans Tools (menu tout en haut) ==> Global option et vérifiez dans l‘onglet Git/SVN que l‘exécutable de git est bien indiqué.Sinon, refaites l’installation.RStudio global option 4. Toujours dans R Studio, aller dans Tools ==> Project Option ==> Git/SVN et choississez git comme Version control system ==> OKR studio project option git 5. Fermer et ouvrez à nouveau R Studio. Vous devriez avoir un nouvel onglet git dans la fenêtre supérieure droite, ainsi qu’un menu git, en dessous de l’onglet Help du menu supérieur.R studio git Si vous n’avez pas d’onglet git, allez dans votre working directory (là ou il y a le projet R) ==> clique droit ===> Git Bash Here. Et dans la console qui vient de s’ouvrir écrivez “git init”. Puis appuyer sur a touche Entrée, fermez et ouvrez à nouveau R Studio. git init R studio 

Comment ça marche ?

Là aussi, c’est assez simple. Pour cela:1. Créez un nouveau document .R ou .Rmd : File ==> New File ==> R Script ou R Markdown 2. Ecrivez quelques lignes.code langage R 3. Sauvez le (File ==> Save As…) 4. Allez dans l’onglet Git, et cochez la case correspondant à votre script (c’est pour dire à Git que c’est ce document que vous voulez  versionner) 5. Cliquez sur commit ( on peut le traduire par “enregistrement”)commit r studio 6. Inscrivez un message de commit, qui correspond au pourquoi de cette version. Par exemple pour un premier commit (enregistrement), on peut écrire “commit1”. Si c’est parce que vous avez ajouté un nouveau plot vous pouvez écrire “ajout boxplot par espèce” par exemple.commit git Rstudio7. Reprenez votre script et modifiez le. Supprimez des lignes, ajoutez en de nouvelles:code langage R 8.Refaites les étapes 3 à 6 : Sauvez ==> git ==> sélectionnez ==> commit, écrivez un message de commit.commit git RStudio 

Comment accéder aux modifications ?

1. Allez dans l’onglet Git, puis cliquez sur commitmodification R code git  2. Allez dans l’onglet History de la fenêtre de commitmodification git Dans la partie haute de la fenêtre, vous pouvez voir l’historique des commits (le plus ancien en bas, le plus récent en haut).Dans la seconde partie, vous pouvez voir les modifications entre la version choisie (dans la parie haute, vous pouvez cliquer sur les différentes versions) et la précédente, avec : 
  • des parties grises qui correspondent à du code identique.
  • des parties  rouges correspondent à du code supprimé.
  • des parties vertes qui correspondent à du code ajouté.
 

Pour aller plus loin

Vous trouverez plus d’infos sur l’utilisation de Git en local dans le chapitreGit et GitHub”  du livre “R packages” d’Hadley Wickham.Vous pouvez aussi connecter Git avec GitHub. Il s’agit d’un site internet qui permet d’héberger des répertoires (ou dossiers ) de code, nommés “repo”. Github permet alors de partager ces repos, et de travailler à plusieurs en parallèle. Là encore, vous trouverez plus d’infos dans le chapitre “Git et GitHub”  du livre “R packages” d’Hadley Wickham. J’espère que cet article vous donnera envie d’essayer le versionnage de vos scripts. Vous verrez c’est extrêmement pratique ! Si cet article vous a plu, ou vous a été utile, et si vous le souhaitez, vous pouvez soutenir ce blog en faisant un don sur sa page Tipeee 🙏👉 Cliquez ici pour soutenir le blog Statistiques et Logiciel RCrédit photo : karmabomb1

4 réponses

  1. bonjour , tout d’abord merci pour ce site qui est très bien fait et agréable à consulter.
    sur git j’aurais une question: la sauvegarde des versions se fait-elle en local ou sur un serveur?

  2. Merci beaucoup pour cet article très instructif..
    J’ai une question : peut-on choisir la version à exécuter ou bien on peut juste voir les modifications, quitte à les réintégrer si on change d’avis?

    Merci.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *