8 fonctions pour la manipulation

8 fonctions pour la manipulation

8 fonctions pour la manipulation Dans cet article, je vous présente, 8 fonctions très utiles, que j’utilise quasi quotidiennement pour analyser des données, et qui sont parfois méconnues !Cet article est complémentaire à celui dédié à la manipulation de données avec le package dplyr. Cliquez ici pour accéder à l’article dédié à la manipulation des […]

Fusionner deux tableaux de données par leurs colonnes : les jointures

fusion de dataset

Fusionner deux tableaux des données par leurs colonnes : les jointures Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs tableaux de données (data frames), pour constituer un seul grand tableau de données.   Cliquez ici pour accéder à l’article dédié à la combinaison de 2 tables par leurs lignes […]

Fusionner les lignes de deux data frame

Fusionner les lignes de deux data frames Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs data frames pour constituer un seul grand tableau de données. Dans d’autres situations, on a besoin de savoir si des lignes sont redondantes sur plusieurs data frames, et si c’est le cas de fusionner les données, […]

Gérer le données de date et d’heure avec le package lubridate

Gérer les données de date et d’heure avec le package lubridate Si vous avez déjà dû travailler sur des fichiers comportant des données indiquant le temps, avec des dates, ou des heures (et des minutes et des secondes), ou les deux à la fois, vous savez que ce n’est pas toujours facile à gérer. D’abord, parce que les dates ne […]

Format wide et long : pourquoi, et comment ?

formats wide et long

Format wide et long : pourquoi, et comment ? Les formats wide et long Format wide Je dis très régulièrement que, pour être traités avec le logiciel R, les jeux de données doivent être au format “tidy”, c’est-à-dire avec une ligne par observation, une variable par colonne, et une valeur au croisement d’une ligne et […]

Manipulations de données avec le package dplyr

manipulation data package dplyr

Manipulations de données avec le package dplyr Crédits photos : SarahRichterArt. a semaine dernière, je discutais avec un étudiant qui débute dans l’analyse de données avec R. Il devait réaliser des manipulations sur un tableau de données (on appelle cela un data frame en R), plus précisément il avait besoin de sélectionner certaines lignes, créer de […]