8 fonctions pour la manipulation

8 fonctions pour la manipulation

8 fonctions pour la manipulation Dans cet article, je vous présente, 8 fonctions très utiles, que j’utilise quasi quotidiennement pour analyser des données, et qui sont parfois méconnues !Cet article est complémentaire à celui dédié à la manipulation de données avec le package dplyr. Cliquez ici pour accéder à l’article dédié à la manipulation des […]

Analyser une playlist Spotify avec R

analyser une playlist spotify avec R

Analyser une playlist Spotify avec R Je ne sais pas ce que vous avez fait lors de l’annonce du confinement, mais personnellement, j’ai pris deux décisions absolument majeures : Augmenter mon forfait Netflix Passer à un abonnement Spotify Family ! Et mi-avril j’ai créée une playlist sur Spotify, que j’ai nommée, avec beaucoup d’originalité, “Confinement”, […]

Fusionner deux tableaux de données par leurs colonnes : les jointures

fusion de dataset

Fusionner deux tableaux des données par leurs colonnes : les jointures Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs tableaux de données (data frames), pour constituer un seul grand tableau de données.   Cliquez ici pour accéder à l’article dédié à la combinaison de 2 tables par leurs lignes […]

Fusionner les lignes de deux data frame

Fusionner les lignes de deux data frames Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs data frames pour constituer un seul grand tableau de données. Dans d’autres situations, on a besoin de savoir si des lignes sont redondantes sur plusieurs data frames, et si c’est le cas de fusionner les données, […]

Nettoyer et valider les données avec R

nettoyez et valider vos données

Nettoyer et valider les données avec R Après l’importation des données, et avant leur analyse à proprement parlé,les nettoyer et les valider est indispensable ! Dans cet article, je vous propose de passer en revue, quelques étapes importantes de ce processus. Rappels concernant l’importation des données Lorsqu’on souhaite importer des données dans R, celles-ci peuvent être sous différents formats de […]

Format wide et long : pourquoi, et comment ?

formats wide et long

Format wide et long : pourquoi, et comment ? Les formats wide et long Format wide Je dis très régulièrement que, pour être traités avec le logiciel R, les jeux de données doivent être au format “tidy”, c’est-à-dire avec une ligne par observation, une variable par colonne, et une valeur au croisement d’une ligne et […]

Manipulations de données avec le package dplyr

manipulation data package dplyr

Manipulations de données avec le package dplyr Crédits photos : SarahRichterArt. a semaine dernière, je discutais avec un étudiant qui débute dans l’analyse de données avec R. Il devait réaliser des manipulations sur un tableau de données (on appelle cela un data frame en R), plus précisément il avait besoin de sélectionner certaines lignes, créer de […]