Cette formation R pour la data analyse est une formation de 3 jours pour approfondir l’utilisation de R et structurer efficacement son travail d’analyse de données à l’aide des bonnes pratiques de l’écosystème tidyverse.
Il s’agit d’une formation appliquée, orientée vers la pratique, qui met l’accent sur la manipulation et la transformation des données, la production d’analyses reproductibles et la génération de rapports dynamiques avec Quarto.
A qui s'adresse cette formation ?
Cette formation s’adresse aux personnes qui utilisent déjà R et souhaitent aller au-delà des bases, structurer leur flux de travail et adopter de bonnes pratiques pour l’analyse de données et le reporting reproductible.
Elle est particulièrement adaptée aux :
personnes amenées à analyser régulièrement des données avec R dans le cadre de leur activité professionnelle ou de leurs études
utilisateurs et utilisatrices de R ayant acquis des bases par une formation d’initiation ou par la pratique, et souhaitant gagner en efficacité et en fiabilité
ingénieur(e)s, chargé(e)s d’études, doctorant(e)s, chercheur(se)s ou personnels techniques produisant des analyses sous R
biostatisticien(ne)s, data managers et chargé(e)s d’études travaillant sur des données de santé ou de recherche
professionnel(le)s intervenant dans des institutions de santé ou agences publiques (par exemple agences sanitaires, autorités de santé, structures exploitant des données médico-administratives telles que le PMSI)
personnes souhaitant optimiser la manipulation de données avec le tidyverse et produire des analyses reproductibles et des rapports dynamiques avec Quarto
Cette formation s’inscrit comme une suite logique à une formation de prise en main de R.
Elle peut également être complétée par des ateliers thématiques d’une journée ou des formations plus spécialisées.
Ce que cette formation n'est pas
Cette formation n’a pas vocation à :
enseigner l’ensemble du langage R ni couvrir tous les usages possibles de R en data science
se substituer à un cursus académique complet en statistique, en informatique ou en data science
aborder des développements avancés relevant de la programmation logicielle (optimisation de performances, développement de packages, programmation orientée objet avancée)
proposer des méthodes « clés en main » sans réflexion sur la structuration du code, la reproductibilité et la qualité des analyses
Elle vise au contraire à :
consolider et structurer l’utilisation de R pour l’analyse de données
adopter des bonnes pratiques de manipulation, de transformation et de visualisation des données
fiabiliser les analyses et les rendre reproductibles
poser des bases solides pour un usage professionnel de R, et pour poursuivre vers des formations ou ateliers plus spécialisés
Prérequis
Il est nécessaire d’avoir déjà utilisé le logiciel R et de disposer de bases opérationnelles.
Les participant(e)s doivent notamment :
savoir travailler dans RStudio et utiliser des scripts R
connaître les principales structures de données (vecteurs, data frames)
savoir importer des données tabulaires (CSV, Excel)
comprendre et exécuter du code R simple
Cette formation s’adresse à des personnes ayant suivi une formation d’initiation à R ou ayant acquis un niveau équivalent par la pratique.
La formation ne reprend pas les bases de prise en main de R (installation, découverte de l’interface, notions élémentaires du langage), mais vise à approfondir et structurer l’analyse de données avec R.
Objectifs et compétences visées
Cette formation vise à permettre aux participant(e)s de structurer et optimiser leur utilisation de R pour l’analyse de données, en adoptant des bonnes pratiques de travail, de manipulation et de nettoyage des données, ainsi que de reporting reproductible.
À l’issue de la formation, les participant(e)s seront capables de :
organiser et structurer efficacement leur travail sous R à l’aide de projets clairs et de scripts lisibles
mettre en place un versionnage des scripts afin de sécuriser et tracer l’évolution des analyses
importer des données de manière robuste, en automatisant et en accélérant les importations de fichiers tabulaires
nettoyer des données de façon systématique et reproductible
(uniformisation des variables, gestion des doublons, corrections et contrôles de cohérence)
enchaîner les étapes de manipulation des données nécessaires à l’analyse (sélection, transformation, agrégation, jointures, changement de format)
gérer différents types de variables (facteurs, chaînes de caractères, dates) de manière fiable
produire des analyses descriptives et des visualisations adaptées aux données et aux objectifs
automatiser la production de résultats et de rapports dynamiques avec Quarto
améliorer la lisibilité, la maintenabilité et la réutilisation de leur code R
Cette formation permet ainsi de gagner en efficacité, en fiabilité et en reproductibilité dans le traitement et l’analyse de données sous R, et constitue un socle solide pour un usage professionnel avancé du logiciel.
Programme détaillé
- Création et structuration de projets R
- Architecture des projets et bonnes pratiques
- Versionnage des scripts en local avec Git
- Principes du reporting reproductible
- Premiers éléments : texte, code, tableaux et graphiques
- Structuration d’un document Quarto
- Numérotation, table des matières, légendes et renvois
- Gestion des problèmes d’encodage
- Accélération des importations
- Automatisation des importations de fichiers CSV et Excel
Objectif : Savoir manipuler et transformer des tables de données en enchaînant les opérations courantes nécessaires à l’analyse à l’aide du tidyverse.
- Introduction au méta-package tidyverse
- Création de sous-ensembles, ajout et transformation de variables
- Création de tables agrégées par groupe
- Autres manipulations utiles
Objectif : Mettre en œuvre une démarche rigoureuse et reproductible de nettoyage des données afin d’en assurer la qualité, la cohérence et la fiabilité avant toute analyse.
- Uniformisation des noms des variables
- Création de labels
- Gestion des doublons
- Nettoyage et corrections diverses
Module 6 – Manipulations supplémentaires
Objectif : Savoir combiner et restructurer des tables de données à l’aide de jointures, d’assemblages et de changements de format afin de préparer les données pour l’analyse.
- Jointure de tables à l’aide d’une clé primaire
- Assemblage de tables de même structure
- Passage en format long et wide
- Variables catégorielles avec forcats
- Chaînes de caractères avec stringr et glue
- Dates et heures avec lubridate
- Initiation à la programmation fonctionnelle avec purrr (quelques exemples)
Objectif : Réaliser des graphiques adaptés aux données et aux objectifs d’analyse à l’aide du package ggplot2.
- Principe du package
- Premiers graphiques (scatterplots, etc.)
- Gestion des couleurs, formes, tailles et courbes de tendance
- Découpage en sous-fenêtres
- Autres types de graphiques
Utilisation raisonnée de l’intelligence artificielle
Tout au long de la formation, des outils d’intelligence artificielle peuvent être utilisés de manière transversale pour accompagner l’écriture, la compréhension et l’amélioration de scripts R.
L’intelligence artificielle est mobilisée comme un outil d’assistance au travail d’analyse de données (aide à la formulation de code, à la compréhension de scripts existants, à l’amélioration de traitements), dans une démarche critique et encadrée.
Elle ne se substitue ni à la compréhension des méthodes, ni au raisonnement analytique.
Pour les facultés et établissements d’enseignement supérieur, des formats spécifiques sur deux jours peuvent être proposés,
Modalités pratiques
⏱️ Durée
3 jours (21 heures)
💻 Format
Distanciel (visioconférence)
Présentiel possible selon les besoins
Formation proposée en inter ou en intra-entreprise
👥 Effectif
Groupes à taille limitée (environ 5), favorisant les échanges et les questions
Tarif
1 500 € HT par participant(e) pour la formation de 3 jours (21 h) – Supports pédagogiques inclus.
Les tarifs en intra-entreprise sont établis sur devis, en fonction du format et des modalités de la formation.
Organisme exonéré de TVA en vertu de l’article 261-4-4°a du CGI
📘 Pédagogie et supports
Alternance d’apports théoriques et de mises en pratique
Supports remis aux participant(e)s
Temps dédiés aux questions et à l’interprétation
🧰 Logiciels
📝 Evaluation des acquis
R et RStudio
Git
Exercices pratiques, mises en situation et échanges oraux tout au long de la formation.
.
✔️ Suivi et assiduité
Émargement par demi-journée.
Adaptation et accessibilité
Les exemples peuvent être adaptés au contexte des participants en intra-entreprise.
Toute situation de handicap ou besoin spécifique peut être signalé en amont afin d’étudier les adaptations possibles.
Prochaine session
Session inter-entreprise : du 30 juin au 2 juillet 2026 – distanciel
S'inscrire à la formation
Cette formation est proposée en inter-entreprise (inscription individuelle) ou en intra-entreprise (formation sur mesure pour une organisation).
Pour une inscription individuelle en inter-entreprise, vous pouvez demander le formulaire d’inscription.
- Pour une formation intra-entreprise, un devis personnalisé est établi sur demande.
Informations pratiques et programmes
FAQ
Oui, bien sûr ! Lors des exercices, vous pourrez employer vos données, si vous préférez. En revanche, a priori, aucune correction individuelle ne pourra alors être réalisée.
Pour les formations intra-entreprise (au sein d’une même structure), certains exercices pourront être adaptés à vos données, si vous en faîtes la demande au préalable.
L’organisme de formation DellaDATA n’est pas certifié QUALIOPI.
À ce titre, il n’est pas possible de mobiliser directement des fonds de formation pour la prise en charge des frais, notamment dans le cadre d’une inscription individuelle en inter-entreprise.
En revanche, cette formation est régulièrement mutualisée avec des organismes de formation partenaires certifiés QUALIOPI.
Selon le contexte, notamment lorsqu’elle est intégrée à un dispositif porté par un organisme partenaire, une prise en charge par les OPCO peut être envisagée.
Les modalités de financement dépendant de la situation, je vous invite à me contacter en amont afin d’échanger sur les solutions possibles.
Organisme de formation : DellaDATA
- NDA: 93040100204 auprès du préfet de région PACA
- SIRET : 90838795400013
- Organisme exonéré de TVA en vertu de l’article 261-4-4°a du CGI
- Adresse : 1087 ch de Ste Roustagne – 04100 Manosque
- Formatrice et interlocutrice : Claire Della Vedova (claire@delladata.fr / 06.64.98.21.42)
- Blog : https://delladata.fr/blog/
Qu'est-ce que les stagiaires en disent ?








