Versionner facilement vos scripts R avec git​

Versionner facilement vos scripts R avec git Travailler de manière reproductible est une compétence indispensable aujourd’hui. Et parmi l’ensemble des choses que l’on peut mettre facilement en place pour travailler de manière reproductible avec R et RStudio, il y a le versionnage de nos scripts, en local,  avec l’outil git. Le versionnage des scripts a […]

Mémo sur les fonctions lapply, sapply, tapply, apply

Mémo des fonctions lapply, sapply, tapply, apply Image par Gerd Altmann de Pixabay Ces fonctions lapply, sapply, tapply et lapply permettent d’appliquer une fonction (mean, par exemple, pour calculer une moyenne) sur des données, de façon itérative. Autrement dit, elles font la même chose qu’une boucle for(), tout en ayant une syntaxe concise, puisque ça se […]

Comment obtenir l’indice d’une ligne ?

obtenir l'indice de ligne

Comment obtenir l’indice d’une ligne ? Image par mohamed Hassan de Pixabay Lorsqu’on analyse des données, on a fréquemment besoin de déterminer les indices des lignes répondant à une certaine condition. On peut, par exemple, avoir besoin de connaître sur quelle ligne se trouve la valeur minimale d’une variable. Nous allons voir qu’il existe quelques […]

Créer des séquences et des grilles avec R

Créer des séquences et des grilles avec R Savoir créer des séquences de chiffres ou de chaînes de caractères sous R, ainsi que des grilles, peut être très utile.   J’ai régulièrement besoin de créer des séquences, pour : construire un jeu de données, créer les breaks sur les axes d’un plot avec ggplot2, produire un clée primaire en […]

Réalisez de multiples tests en quelques lignes avec une fonction map()

tests multiples avec le logiciel R

Réalisez de multiples tests en quelques lignes avec une fonction map() Cette semaine, au cours d’une séance de coaching “libre”, on m’a demandé comment faire de multiples tests de wilcoxon de façon automatisés (il y en avait plus de 250 à faire), et comment récupérer la p-value, afin ensuite de faire un sous jeu de données avec seulement les […]

Liste de ressources pour le package purrr

purrr récursif logiciel R

Liste de ressources pour le package purrr Très récemment, je discutais avec une étudiante, qui voulait progresser dans la programmation R, de l’intérêt du package `purrr` pour optimiser ses codes. En réalité, je n’ai pas pu aller très loin dans mes explications, et mes démonstrations, parce que je maîtrise pas du tout ce package ! Cette conversation a été un peu frustrante, mais […]

Nombre de décimales, notation scientifique et arrondis avec R

nombre de décimales

Nombre de décimales, notation scientifique et arrondis avec R Crédits photo : geralt Voici un post pour vous montrer quelques fonctions qui permettent de gérer l’affichage, en termes de nombre de décimales (le nombre de chiffres après la virgule) et de notation scientifique, des sorties R. Je vous parlerai ensuite de quelques fonctions très utiles […]

Gagnez du temps par l’automatisation de vos tests de permutation

automatisation des tests de permutation

Gagnez du temps par l’automatisation de vos tests de permutation Comme je l’expliquais dans un précédent article, les tests de permutation sont des approches robustes, basées sur l’aléatoire et le ré-échantilonnage, qui permettent de réaliser des tests statistiques paramétriques, sans que la validité des résultats ne reposent sur des distributions théoriques ! En pratique, les tests […]

Comment utiliser ggplot dans une boucle ou dans une fonction ?

ggplot_aes_string()

Comment utiliser ggplot dans une boucle ou dans une fonction ? ggplot() est la fonction de base du package ggplot2, qui est le package incontournable pour réaliser des représentations graphiques avec R. ggplot2 est extrêmement populaire car il permet de réaliser une multitude de visualisations, de façon rapide et esthétique. La réalisation de plots avec ce package nécessite un […]

Mémo sur les lists

Mémo sur les lists Aujourd’hui je vous propose un petit mémo sur les lists. Les lists sont un type d’objet R, comme le sont les vecteurs, les data frame, les matrices et les array. Je me représente les lists comme des commodes à tiroir, qui contiennent des objets différents : un tiroir peut contenir un […]