FORMATION

Maîtrisez la manipulation de vos tableaux de données avec dplyr, tidyr et lubridate :

Apprenez à manipuler efficacement  vos tableaux de données. 
manipulation des données avec dplyr

La manipulation des tableaux de données est une étape préalable incontournable à toute analyse, qu’elle soit descriptive, visuelle, statistique, ou prédictive.

Les opérations les plus importantes à maîtriser, en termes de manipulation des données, sont la création de subsets (par la sélection de lignes et ou de colonnes), l’assemblage de tables en ligne ou en colonne, et la transformation du format de tables ( d’un format wide vers un format long, et inversement).
La gestion des données de dates et d’heure est également une compétence très fréquemment nécessaire.

C’est ce que je vous propose d’apprendre à réaliser, avec R, au cours de cette formation “Maîtrisez la manipulation de vos tableaux de données avec dplyr, tidyr et lubridate”.

 

Prochaine session

9 décembre 2021

Informations

  • Objectifs : 
    • Apprendre à créer des subsets (par sélection de colonnes et ou de lignes) avec le package dplyr
    •  Apprendre à assembler deux tables de données avec le package dplyr
    • Apprendre à pivoter un tableau de données, du format wide vers le format long, et inversement avec le package tidyr
    • S’initier à la gestion des données de dates et d’heures avec le package lubridate

 

  • Public :
    • Toute personne amenée à travailler avec des données, à l’aide du logiciel R, et souhaitant les manipuler aisément et efficacement.

 

  • Prérequis :
    • Le participant a des connaissances de base de l’outil informatique et du logiciel R : les types de données, les structures de données, la création et la manipulation d’objets, l’importation de données.

 

  • Méthode : Pédagogie active mêlant exposés, exercices et applications pratiques dans le logiciel R.

 

  • Modalités : distanciel (avec Teams)

 

  • Coût : 

    • 350 euros TTC

 

  • Nombre de participants : 
    • nombre minimal pour que la formation ait lieu : 2
    • nombre maximal  de participants : 10

 

 

Vous avez des questions ?

  • Vous souhaitez des précisions
  • Vous souhaitez organiser cette formation en intra-entreprise, pour vos collaborateurs ?
  • Vous souhaitez savoir quand une nouvelle session est prévue ?

 

       Contactez- moi 👇   👇   👇

Programme (1 jour, soit 7h)

Module 1 : Manipulation de données avec le package dplyr
  • Introduction au package tidyverse et à la notion de pipe
  • Sélection des colonnes (variable) avec la fonction select()
  • Sélection de lignes avec la fonction filter()
  • Création de nouvelles variables avec la fonction mutate()
  • Création de tables résumées avec les fonctions group_by() et summarise()

 

Module 2 : Combinaison de deux tableaux de données
  • Fonctions d’assemblage de lignes
  • Notion de clé primaire
  • Fonctions de fusion de tables

 

Module 3 : Transformation du format de tables avec le package tidyr
  • Format wide et format long
  • Passage d’un format wide à un format long
  • Passage d’un format long à un format wide
  •  
Module 4 : Gestion des données de dates et d’heure avec le package lubridate
  • Spécificité des données de date et d’heure et norme
  • Les fonctions de parsing du package lubridate
  • Les fonctions d’extraction du package lubridate

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.