Opérations en ligne avec dplyr
Opérations en ligne avec dplyr Réaliser des opérations en ligne sur un data frame avec le package dplyr est relativement mal connu, et pourtant très facilement réalisable. Comme nous allons le voir, lorsqu’on crée des nouvelles variables à l’aide d’une opération sur des variables déjà présentes (le minimum par exemple), par défaut, dplyr va considérer […]
5 fonctions pour regrouper des modalités
5 fonctions pour regrouper des modalités Image par Free-Photos de Pixabay Lorsqu’on travaille avec des variables qualitatives, c’est-à-dire des variables considérées comme des factor dans R, cela peut être vraiment utile de savoir regrouper certaines modalités. Par exemple, plusieurs modalités d’une variable qualitative peuvent avoir des effectifs très faibles. Dans cette situation, cela peut avoir […]
8 fonctions pour la manipulation
8 fonctions pour la manipulation Dans cet article, je vous présente, 8 fonctions très utiles, que j’utilise quasi quotidiennement pour analyser des données, et qui sont parfois méconnues !Cet article est complémentaire à celui dédié à la manipulation de données avec le package dplyr. Cliquez ici pour accéder à l’article dédié à la manipulation des […]
Fusionner deux tableaux de données par leurs colonnes : les jointures
Fusionner deux tableaux des données par leurs colonnes : les jointures Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs tableaux de données (data frames), pour constituer un seul grand tableau de données. Cliquez ici pour accéder à l’article dédié à la combinaison de 2 tables par leurs lignes […]
Fusionner les lignes de deux data frame
Fusionner les lignes de deux data frames Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs data frames pour constituer un seul grand tableau de données. Dans d’autres situations, on a besoin de savoir si des lignes sont redondantes sur plusieurs data frames, et si c’est le cas de fusionner les données, […]
Gérer le données de date et d’heure avec le package lubridate
Gérer les données de date et d’heure avec le package lubridate Si vous avez déjà dû travailler sur des fichiers comportant des données indiquant le temps, avec des dates, ou des heures (et des minutes et des secondes), ou les deux à la fois, vous savez que ce n’est pas toujours facile à gérer. D’abord, parce que les dates ne […]
Manipulations de données avec le package dplyr
Manipulations de données avec le package dplyr Crédits photos : SarahRichterArt. a semaine dernière, je discutais avec un étudiant qui débute dans l’analyse de données avec R. Il devait réaliser des manipulations sur un tableau de données (on appelle cela un data frame en R), plus précisément il avait besoin de sélectionner certaines lignes, créer de […]