Formation

Manipulations des tables de données avec R

L'essentiel des packages dplyr, et lubridate

(1 jour - 7 h)

Prochaine session​

                        ⏱️  1 jour                   📅  23 mai  2024                📌 Distanciel                 🏷️  490 euros HT (exonéré de TVA)          

Pourquoi cette formation ?

Parce que pour manipuler efficacement et rapidement les tables de données, il est essentiel de maîtriser les principales fonctions des packages dplyr et lubridate

Les packages dplyr et lubridate

Le package dplyr est un package R qui a été développé pour faciliter la manipulation de données en R. Ce package   permet, par exemple, de :

  • filtrer les observations en fonction de conditions spécifiques 
  • sélectionner les variables pertinentes 
  • regrouper les observations et les résumer 
  • joindre plusieurs tables de données partageant une variable commune.

Le package dispose également d’une multitude de fonctions secondaires très utiles.

manipulation avec dplyr

Le package lubridate est un package R qui a été développé pour faciliter la manipulation de dates et de temps. Ce package permet, par exemple, de :

  • convertir une chaîne de caractères en données de date et de temps
  • extraire les composantes d’une date ou d’un temps
  • réaliser des opérations sur les dates ou les temps : ajouter, ou soustraire des jours, des heures, des minutes ou des secondes
  • calculer des durées
Formation manipulation des données de dates et d'heures

A qui s'adresse cette formation ?

Cette formation s’adresse principalement aux data analystes, statisticiens, médecins DIM, chargés de projets, enseignants, chercheurs, étudiants, ingénieurs, techniciens,  etc…), qui travaillent avec des données sous R, et qui souhaitent apprendre rapidement (en une journée) à les manipuler de manière plus efficace.

Quels sont les objectifs ?

🎯  Apprendre à réaliser des subsets de données en filtrant des observations, et en sélectionnant des variables, 

🎯  Apprendre à créer ou transformer des variables, à regrouper des observations et les résumer 

🎯  Apprendre à joindre des tables par une variable commune

🎯  Apprendre à pivoter une table en format wide et long

🎯   Apprendre à manipuler les données de dates et de temps : conversion d’une chaîne de caractères en format date, extraction des éléments, calculs sur les dates, etc…

Quel est le programme ?

📌   Introduction aux packages dplyr et lubridate : place dans le méta package tidyverse, utilisation du pipe %>%,  gestion des potentiels conflits de packages

📌   Création de subsets : filtre des observations, sélection des variables, 

📌   Création et transformation de variables, regroupement d’observations et résumé

📌   Assemblage de tables par jointure : notion de clé primaire, jointure entières, jointure interne, jointures gauche et droite  

📌   Pivoter une table en format long et wide

📌  Autres fonctions utiles de dplyr

📌   Les données de dates et de temps : problèmes fréquents, principales fonctions du package lubridate

📌   Conversion d’une chaîne de caractères en données de date et de temps, extraction des éléments, arrondis, ajouter et soustraire, calculer des délais  

Modalités et tarifs

Cette formation, sous un format inter-entreprise (c’est-à-dire pour des stagiaires provenant de différentes structures) est programmée environ 2 fois par an, en visioconférence (avec l’outil Teams).  Le nombre maximal de stagiaires est limité à 5, et il n’y a pas de nombre minimal d’inscriptions (la formation est maintenue même si une seule inscription est enregistrée).
Vous pouvez retrouver les prochaines sessions
 sur le planning des formations.

Le tarif est de 490 euros HT  ( -10% dès 2 inscrits, -20% à partir de 3 inscrits).

Pour vous inscrire, il suffit de télécharger le formulaire d’inscription de le compléter et le retourner à claire@delladata.fr

Une convention de formation vous sera alors adressée, celle-ci devra être signée par la personne responsable de formation au sein de votre organisation. L’inscription ne sera validée qu’à réception de la convention de formation.

Cette formation peut également être réalisée en intra-entreprise (c’est-à-dire pour des stagiaires d’une même structure), en présentiel (maximum 10 stagiaires) ou en distanciel (maximum 7 stagiaires).

 

Les tarifs de la formation sont

  • 1790 euros HT en distanciel 
  • 2250 euros HT en présentiel (plus frais de déplacements à définir).

Pour obtenir plus d’informations ou organiser cette information en intra-entreprise, contactez-moi par mail : claire@delladata.fr, ou utilisez le formulaire de contact  👇👇👇

FAQ

Oui, bien sûr ! Lors des exercices, vous pourrez employer vos données, si vous préférez. En revanche, a priori, aucune correction individuelle ne pourra alors être réalisée.

Pour les formations intra-entreprise (au sein d’une même structure), certains exercices pourront être adaptés à vos données, si vous en faîtes la demande au préalable.

Il est nécessaire d’avoir une connaissance de base du logiciel R : savoir qu’il existe différentes class de données (numeric, factor character), savoir manipuler, a minima, les vecteurs et les data frame : création, extraction d’un élément, savoir importer des données, etc. Dans l’idéal, le participant a suivi la formation “Les fondamentaux de R”, ou atteint un niveau équivalent par la pratique.

L’organisme de formation DellaData n’a pas de certification QUALIOPI, il n’est donc pas possible, en inter-entreprise, de mobiliser des fonds de formation pour prendre en charges les frais.

En revanche, lorsqu’elle est réalisée en intra-entreprise, cette formation peut être portée par un organisme de formation partenaire, certifié QUALIOPI.  La mobilisation de fonds de formation pour prendre en charges une partie des frais, est alors possible.

Organisme de formation : DellaData

  • NDA: 93040100204 auprès du préfet de région PACA
  • SIRET : 90838795400013
  • Adresse : 1087 ch de Ste Roustagne – 04100 Manosque
  • Formatrice et interlocutrice : Claire Della Vedova (claire@delladata.fr / 06.64.98.21.42)
  • Blog : https://delladata.fr/blog/

Qu'est-ce que les stagiaires en disent ?

une question ? Un besoin spécifique ?

N'hésitez pas !

Contactez moi pour me décrire vos besoins de formations à R et en biostatistiques

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.