Prochaine session
Une prochaine session sera programmée dans le courant du 4ème trimestre 2024
Pourquoi cette formation ?
Parce que pour manipuler efficacement et rapidement les tables de données, il est essentiel de maîtriser les principales fonctions des packages dplyr et lubridate
Les packages dplyr et lubridate
Le package dplyr est un package R qui a été développé pour faciliter la manipulation de données en R. Ce package permet, par exemple, de :
- filtrer les observations en fonction de conditions spécifiques
- sélectionner les variables pertinentes
- regrouper les observations et les résumer
- joindre plusieurs tables de données partageant une variable commune.
Le package dispose également d’une multitude de fonctions secondaires très utiles.
Le package lubridate est un package R qui a été développé pour faciliter la manipulation de dates et de temps. Ce package permet, par exemple, de :
- convertir une chaîne de caractères en données de date et de temps
- extraire les composantes d’une date ou d’un temps
- réaliser des opérations sur les dates ou les temps : ajouter, ou soustraire des jours, des heures, des minutes ou des secondes
- calculer des durées
A qui s'adresse cette formation ?
Cette formation s’adresse principalement aux data analystes, statisticiens, médecins DIM, chargés de projets, enseignants, chercheurs, étudiants, ingénieurs, techniciens, etc…), qui travaillent avec des données sous R, et qui souhaitent apprendre rapidement (en une journée) à les manipuler de manière plus efficace.
Quels sont les objectifs ?
Apprendre à réaliser des subsets de données en filtrant des observations, et en sélectionnant des variables,
Apprendre à créer ou transformer des variables, à regrouper des observations et les résumer
Apprendre à joindre des tables par une variable commune
Apprendre à pivoter une table en format wide et long
Apprendre à manipuler les données de dates et de temps : conversion d’une chaîne de caractères en format date, extraction des éléments, calculs sur les dates, etc…
Quel est le programme ?
Introduction aux packages dplyr et lubridate : place dans le méta package tidyverse, utilisation du pipe %>%, gestion des potentiels conflits de packages
Création de subsets : filtre des observations, sélection des variables,
Création et transformation de variables, regroupement d’observations et résumé
Assemblage de tables par jointure : notion de clé primaire, jointure entières, jointure interne, jointures gauche et droite
Pivoter une table en format long et wide
Autres fonctions utiles de dplyr
Les données de dates et de temps : problèmes fréquents, principales fonctions du package lubridate
Conversion d’une chaîne de caractères en données de date et de temps, extraction des éléments, arrondis, ajouter et soustraire, calculer des délais
Modalités et tarifs
Cette formation, sous un format inter-entreprise (c’est-à-dire pour des stagiaires provenant de différentes structures) est programmée environ 2 fois par an, en visioconférence (avec l’outil Teams). Le nombre maximal de stagiaires est limité à 5, et il n’y a pas de nombre minimal d’inscriptions (la formation est maintenue même si une seule inscription est enregistrée).
Vous pouvez retrouver les prochaines sessions sur le planning des formations.
Le tarif est de 490 euros HT ( -10% dès 2 inscrits, -20% à partir de 3 inscrits).
Pour vous inscrire, il suffit de télécharger le formulaire d’inscription de le compléter et le retourner à claire@delladata.fr
Une convention de formation vous sera alors adressée, celle-ci devra être signée par la personne responsable de formation au sein de votre organisation. L’inscription ne sera validée qu’à réception de la convention de formation.
Cette formation peut également être réalisée en intra-entreprise (c’est-à-dire pour des stagiaires d’une même structure), en présentiel (maximum 10 stagiaires) ou en distanciel (maximum 7 stagiaires).
Les tarifs de la formation sont
- 1790 euros HT en distanciel
- 2250 euros HT en présentiel (plus frais de déplacements à définir).
Pour obtenir plus d’informations ou organiser cette information en intra-entreprise, contactez-moi par mail : claire@delladata.fr, ou utilisez le formulaire de contact
FAQ
Oui, bien sûr ! Lors des exercices, vous pourrez employer vos données, si vous préférez. En revanche, a priori, aucune correction individuelle ne pourra alors être réalisée.
Pour les formations intra-entreprise (au sein d’une même structure), certains exercices pourront être adaptés à vos données, si vous en faîtes la demande au préalable.
Il est nécessaire d’avoir une connaissance de base du logiciel R : savoir qu’il existe différentes class de données (numeric, factor character), savoir manipuler, a minima, les vecteurs et les data frame : création, extraction d’un élément, savoir importer des données, etc. Dans l’idéal, le participant a suivi la formation “Les fondamentaux de R”, ou atteint un niveau équivalent par la pratique.
L’organisme de formation DellaData n’a pas de certification QUALIOPI, il n’est donc pas possible, en inter-entreprise, de mobiliser des fonds de formation pour prendre en charges les frais.
En revanche, lorsqu’elle est réalisée en intra-entreprise, cette formation peut être portée par un organisme de formation partenaire, certifié QUALIOPI. La mobilisation de fonds de formation pour prendre en charges une partie des frais, est alors possible.
Organisme de formation : DellaData
- NDA: 93040100204 auprès du préfet de région PACA
- SIRET : 90838795400013
- Adresse : 1087 ch de Ste Roustagne – 04100 Manosque
- Formatrice et interlocutrice : Claire Della Vedova (claire@delladata.fr / 06.64.98.21.42)
- Blog : https://delladata.fr/blog/