Maîtrisez la manipulation

de vos tableaux de données

avec tidyverse : dplyr, tidyr, et lubridate

(1 jour - 7 heures)

manipulation des données avec dplyr

La manipulation des tableaux de données est une étape incontournable à toute analyse, qu’elle soit descriptive, visuelle, statistique ou prédictive.

Les opérations les plus importantes à maîtriser, en termes de manipulation des données, sont la création de subsets (par la sélection de lignes et ou de colonnes), l’assemblage de tables en ligne ou en colonne, et la transformation du format de tables (d’un format wide vers un format long et inversement). La gestion des données de dates et d’heures est également une compétence fréquemment nécessaire.

C’est ce que je vous propose d’apprendre à réaliser, avec R, au cours de cette formation “Maîtrisez la manipulation de vos tableaux de données avec dplyr, tidyr et lubridate.

Quels sont les objectifs ?

  • Apprendre à créer des subsets (par sélection de colonnes et ou de lignes) avec le package dplyr.
  • Apprendre à assembler deux tables de données avec le package dplyr.
  • Apprendre à pivoter un tableau de données, du format wide vers le format long, et inversement avec le package tidyr.
  • S’initier à la gestion des données de dates et d’heures avec le package lubridate.

A qui s'adresse cette formation ?

A toute personne amenée à travailler avec des données, à l’aide du logiciel R, et souhaitant les manipuler aisément et efficacement.

Y'a t'il des prérequis ?

Il est nécessaire d’avoir une connaissance de base du logiciel R : savoir qu’il existe différentes class de données (numeric, factor character), savoir manipuler à minima les vecteurs et les data frame : création, extraction d’un élément, savoir importer des données, etc. Dans l’idéal, le participant a suivi la formation Bien Débuter avec R, ou atteint un niveau équivalent par la pratique.

Quels est le contenu ?

  • Introduction à la manipulation de données avec le package dplyr : introduction au package tidyverse, sélection de lignes et de colonnes, création de nouvelles variables, création de tables résumées.
  • Combinaison de deux tableaux de données : fonction d’assemblage de lignes, notion de clé primaire, fonctions de fusion de tables.
  • Transformation du format de tables avec le package tidyr : format wide et long, passage d’un format à l’autre.
  • Gestion des données de dates et d’heure avec le package lubridate : spécificité des données de dates et d’heure, les fonctions de parsing, et les fonctions d’extraction du package lubridate

Comment se déroule la formation ?

Les formations se déroulent selon une alternance de théorie, puis de mise en pratique, ensemble en pas à pas, puis d’exercices à réaliser en autonomie.

Est-ce que vous pourrez utiliser vos données ?

Oui, bien sur ! Lors des exercices, vous pourrez employer vos données, si vous préférez. En revanche, a priori, aucune correction individuelle ne pourra alors être réalisée.

Quand auront lieu les prochaines sessions ?

  • planning en cours de réalisation

Quel est le tarif ?

Les frais dont de 450 euros HT , -10% dès 2 inscrits, -20% à partir de 3 inscrits.

Est ce que le nombre de places est limité ?

Oui. Toutes les formations se déroulent en petit comité afin que tout le monde puisse prendre la parole et poser des questions. Le nombre de places est donc limité à 5 stagiaires. Et la formation a lieu à partir de 2 stagiaires.

Est-ce finançable par les OPCOs ?

Certaines sessions de cette formation sont portées par l’organisme de formation Data Value, qui est certifié Qualiopi. Lorsque cela est le cas, vous pourrez alors, sous certaines conditions, utiliser vos fonds de formation pour financer totalement cette formation, via vos OPCOs. En dehors de ces sessions, a priori, aucune prise en charge par les fonds de formation ne pourra avoir lieu. Les sessions portées par Data Value sont précisées dans la partie “Quand auront lieu les prochaines formations?”

Comment s'inscrire ?

Pour vous inscrire, il suffit de télécharger le bulletin d’inscription et de me le retourner par mail à l’adresse claire@delladata.fr. Je vous ferai alors parvenir une convention de formation.

Une fois complété, merci me l’adresser (claire@delladata.fr), ou l’adresser directement à l’organisme de formation Data Value (formation@datavalue.fr)

Est-ce que l'on peut l'organiser en intra ?

Cette formation peut être réalisée en intra-entreprise, intra-laboratoire, ou intra-faculté, en distanciel ou en présentiel, selon vos besoins et vos préférences.

Pour cela, il faut que nous en discutions plus en détail par téléphone. Envoyez-moi un message à claire@delladata.fr, pour fixer un rendez-vous.

Vous avez d'autres questions ?

Pour toute question, contactez-moi : claire@delladata.fr

une question ? Un besoin spécifique ?

N'hésitez pas !

Contactez moi pour me décrire vos besoins de formations à R et en biostatistiques