R pour la data analyse

(3 jours - 21 heures)

Quels sont les objectifs ?

S’approprier les outils et les méthodes permettant de rendre son processus d’analyse de données avec R, aisé, reproductible et performant. Acquérir une grande dextérité dans la manipulation des données grâce aux packages dplyr, tidyr et lubridate. Apprendre à réaliser des rapports d’analyses, dynamiques et automatisés, avec les packages R markdown, et des graphiques performants avec le package ggplot2.

A qui s'adresse cette formation ?

A toute personne amenée dans le cadre de son activité professionnelle, ou ses études, à analyser des données avec le logiciel R, et souhaitant sont rendre son processus de travail plus performant.

Y'a t'il des prérequis ?

Il est nécessaire d’avoir une connaissance de base du logiciel R : savoir qu’il existe différentes class de données (numeric, factor character), savoir manipuler à minima les vecteurs et les data frame : création, extraction d’un élément, savoir importer des données, etc. Dans l’idéal, le participant a suivi la formation Bien Débuter avec R, ou atteint un niveau équivalent par la pratique.

Quels est le contenu ?

  • Introduction : origine et évolution de R, place de R dans la data analyse.
  • Rappels : les outils de RStudio, ProjetR, Bonnes pratiques pour la création de data frames, importations, vérifications et exportations de données, des scripts et d’environnements, mises à jour.
  • Manipulations de données avec le package dplyr : introduction au tidyverse, sélection avancée de lignes et de colonnes, création de nouvelles variables, création de tables résumées, autres fonctions intéressantes
  • Manipulations des variables catégorielles avec le package forecats : inspection des modalités (niveaux), modification de l’ordre et du nom des modalités, regroupements automatisés.
  • Manipulations des chaînes de caractères avec le package stringr : détection des patterns, découpage, gestion des longueurs, remplacement, etc.
  • Manipulations des données de dates et d’heure avec le package lubridate : convertir les données dans un format adéquat, décomposer les éléments d’année de mois et de jour, etc., calculer des différences de dates.
  • Assemblage et pivot de tables : jointure de tables : left join, right join, inner join et full join, formats wide et long des données et conversion.
  • Représentations graphiques avec ggplot2 : principe des couches, réalisation des graphiques courants : scatterplots, barplots line plot, boxplot, représentation des séries temporelles, utilisation du facetting, et du mapping, éléments de mise en forme.
  • Création de rapports dynamiques et automatisés avec R Markdown : principe, formats de sortie, les éléments d’un fichier Rmd, gestion des éléments de texte, des tables, des images, des graphiques, gestions des éléments de code, numérotation et table des matières, importation
  • Introduction à la programmation fonctionnelle avec le package purrr (module optionnel – en fonction du rythme de la formation, mais supports pédagogiques transmis dans tous les cas)

Comment se déroule la formation ?

La formation se déroule selon une alternance de théorie, puis de mise en pratique, ensemble en pas à pas, puis d’exercices à réaliser en autonomie.

Est ce que vous pourrez utiliser vos données ?

Oui, bien sur ! Lors des exercices, vous pourrez employer vos données, si vous préférez. En revanche, a priori, aucune correction individuelle ne pourra alors être réalisée.

Quand auront lieu les prochaines sessions ?

  • 27, 28 et 29 juin 2022 (en distanciel avec Teams)

Quel est le tarif ?

Les frais dont de 1500 euros HT, -10% dès 2 inscrits, -20% à partir de 3 inscrits.

Est-ce que le nombre de places est limité ?

Oui. Toutes les formations se déroulent en petit comité afin que tout le monde puisse prendre la parole et poser des questions. Le nombre de places est donc limité à 5 stagiaires. Et la formation a lieu à partir de 2 stagiaires.

Est-ce finançable par les OPCOs ?

Cette formation est portée par l’organisme de formation Data Value qui est certifié Qualiopi. Vous pourrez alors, sous certaines conditions, utiliser vos fonds de formation pour financer totalement cette formation, vis vos OPCOs.

Comment s'inscrire ?

Pour vous inscrire, il suffit de télécharger le bulletin d’inscription et de me le retourner par mail à l’adresse claire@delladata.fr. Je vous ferai alors parvenir une convention de formation.

Est-ce que l'on peut l'organiser en intra ?

Cette formation peut être réalisée en intra-entreprise, intra-laboratoire, ou intra-faculté, en distanciel ou en présentiel, selon vos besoins et vos préférences.

Selon vos besoins, cette formation peut être réduite à 2 jours, en supprimant, certains des éléments du programme.

Pour cela, il faut que nous en discutions plus en détail par téléphone. Envoyez-moi un message à claire@delladata.fr, pour fixer un rendez-vous.

Vous avez d'autres questions ?

Pour toute question, contactez-moi : claire@delladata.fr

Qu'est-ce que les stagiaires en disent ?

une question ? Un besoin spécifique ?

N'hésitez pas !

Contactez moi pour me décrire vos besoins de formations à R et en biostatistiques