Opérations en ligne avec dplyr

Travailler en ligne avec dplyr

Opérations en ligne avec dplyr Réaliser des opérations en ligne sur un data frame avec le package dplyr est relativement mal connu, et pourtant très facilement réalisable. Comme nous allons le voir, lorsqu’on crée des nouvelles variables à l’aide d’une opération sur des variables déjà présentes (le minimum par exemple), par défaut,  dplyr va considérer […]

8 fonctions pour la manipulation

8 fonctions pour la manipulation

8 fonctions pour la manipulation Dans cet article, je vous présente, 8 fonctions très utiles, que j’utilise quasi quotidiennement pour analyser des données, et qui sont parfois méconnues !Cet article est complémentaire à celui dédié à la manipulation de données avec le package dplyr. Cliquez ici pour accéder à l’article dédié à la manipulation des […]

Analyser une playlist Spotify avec R

analyser une playlist spotify avec R

Analyser une playlist Spotify avec R Je ne sais pas ce que vous avez fait lors de l’annonce du confinement, mais personnellement, j’ai pris deux décisions absolument majeures : Augmenter mon forfait Netflix Passer à un abonnement Spotify Family ! Et mi-avril j’ai créée une playlist sur Spotify, que j’ai nommée, avec beaucoup d’originalité, “Confinement”, […]

Fusionner deux tableaux de données par leurs colonnes : les jointures

fusion de dataset

Fusionner deux tableaux des données par leurs colonnes : les jointures Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs tableaux de données (data frames), pour constituer un seul grand tableau de données.   Cliquez ici pour accéder à l’article dédié à la combinaison de 2 tables par leurs lignes […]

Fusionner les lignes de deux data frame

Fusionner les lignes de deux data frames Lorsqu’on analyse des données, il peut arriver qu’on ait besoin de fusionner les lignes de plusieurs data frames pour constituer un seul grand tableau de données. Dans d’autres situations, on a besoin de savoir si des lignes sont redondantes sur plusieurs data frames, et si c’est le cas de fusionner les données, […]

Nettoyer et valider les données avec R

nettoyez et valider vos données

Nettoyer et valider les données avec R Après l’importation des données, et avant leur analyse à proprement parlé,les nettoyer et les valider est indispensable ! Dans cet article, je vous propose de passer en revue, quelques étapes importantes de ce processus. Rappels concernant l’importation des données Lorsqu’on souhaite importer des données dans R, celles-ci peuvent être sous différents formats de […]

Manipulations de données avec le package dplyr

manipulation data package dplyr

Manipulations de données avec le package dplyr Crédits photos : SarahRichterArt. a semaine dernière, je discutais avec un étudiant qui débute dans l’analyse de données avec R. Il devait réaliser des manipulations sur un tableau de données (on appelle cela un data frame en R), plus précisément il avait besoin de sélectionner certaines lignes, créer de […]