Opérations en ligne avec dplyr

Travailler en ligne avec dplyr

Opérations en ligne avec dplyr Réaliser des opérations en ligne sur un data frame avec le package dplyr est relativement mal connu, et pourtant très facilement réalisable. Comme nous allons le voir, lorsqu’on crée des nouvelles variables à l’aide d’une opération sur des variables déjà présentes (le minimum par exemple), par défaut,  dplyr va considérer […]

5 fonctions pour regrouper des modalités

5 fonctions pour regrouper des modalités Image par Free-Photos de Pixabay Lorsqu’on travaille avec des variables qualitatives, c’est-à-dire des variables considérées comme des factor dans R, cela peut être vraiment utile de savoir regrouper certaines modalités. Par exemple, plusieurs modalités d’une variable qualitative peuvent avoir des effectifs très faibles. Dans cette situation, cela peut avoir […]

8 fonctions pour la manipulation

8 fonctions pour la manipulation

8 fonctions pour la manipulation Dans cet article, je vous présente, 8 fonctions très utiles, que j’utilise quasi quotidiennement pour analyser des données, et qui sont parfois méconnues !Cet article est complémentaire à celui dédié à la manipulation de données avec le package dplyr. Cliquez ici pour accéder à l’article dédié à la manipulation des […]

Fusionner deux tableaux de données par leurs colonnes : les jointures

fusion de dataset

Fusionner deux tableaux des données par leurs colonnes : les jointures Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs tableaux de données (data frames), pour constituer un seul grand tableau de données.   Cliquez ici pour accéder à l’article dédié à la combinaison de 2 tables par leurs lignes […]

Fusionner les lignes de deux data frame

Fusionner les lignes de deux data frames Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs data frames pour constituer un seul grand tableau de données. Dans d’autres situations, on a besoin de savoir si des lignes sont redondantes sur plusieurs data frames, et si c’est le cas de fusionner les données, […]

Gérer le données de date et d’heure avec le package lubridate

Gérer les données de date et d’heure avec le package lubridate Si vous avez déjà dû travailler sur des fichiers comportant des données indiquant le temps, avec des dates, ou des heures (et des minutes et des secondes), ou les deux à la fois, vous savez que ce n’est pas toujours facile à gérer. D’abord, parce que les dates ne […]

Format wide et long : pourquoi, et comment ?

formats wide et long

Format wide et long : pourquoi, et comment ? Les formats wide et long Format wide Je dis très régulièrement que, pour être traités avec le logiciel R, les jeux de données doivent être au format “tidy”, c’est-à-dire avec une ligne par observation, une variable par colonne, et une valeur au croisement d’une ligne et […]

Manipulations de données avec le package dplyr

manipulation data package dplyr

Manipulations de données avec le package dplyr Crédits photos : SarahRichterArt. a semaine dernière, je discutais avec un étudiant qui débute dans l’analyse de données avec R. Il devait réaliser des manipulations sur un tableau de données (on appelle cela un data frame en R), plus précisément il avait besoin de sélectionner certaines lignes, créer de […]

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.