FORMATION

Réaliser ses analyses statistiques avec R (3 jours - 21h)

Prochaine session

17 au 19 novembre 2021 (en partenariat avec l’organisme de formation Data Value, certifié Datadock).

Informations

  • Objectifs :
    • Apprendre à utiliser le logiciel R pour analyser des données.
    • Mettre en œuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
  • Public : Toute personne souhaitant analyser des données avec R.
  • Prérequis :
    • Le participant a des connaissances de base sur le logiciel R : les types de données, les structures de données, la création et la manipulation d’objets, l’importation de données
  • Modalités : distanciel (avec Teams)

  • Coût : 

    • 1500 euros HT pour les 3 jours

    • Cette formation  s’adresse principalement aux salariés d’entreprises, ou d’établissement français, car ceux-ci peuvent bénéficier d’une prise en charge partielle ou totale par leurs opérateurs de compétences (OPCO), dans le cadre de la formation continue.

  • Programme : voir ci-dessous ou  Cliquez ici pour le télécharger

  • Formulaire d’inscription : Cliquez ici pour le télécharger . Celui lui devra être complété et adressé à l’organisme de formation Data Value, en utilisant cette adresse mail : formation@datavalue.fr

  • Vous avez des questions ?

  • Vous souhaitez organiser cette formation en intra-entreprise, pour vos collaborateurs ? Contactez moi à claire@delladata.fr

Programme

Statistiques descriptives
  • Gestion d’un jeu de données – dataframe : Importation, caractérisation, sélection, sous-ensembles
  • Premières analyses d’un jeu de données : Premières vérifications, valeurs manquantes, recodage
  • Résumé d’une variable quantitative – numeric : Indicateurs numériques, représentations graphiques
  • Résumé d’une variable qualitative – factor Indicateurs numériques, représentations graphiques
Intervalle de confiance
  • Le raisonnement à partir d’un échantillon : Généralités, échantillonnage, estimation d’un paramètre
  • Intervalle de confiance d’une moyenne
  • Intervalle de confiance d’une proportion
  • Intervalle de confiance d’une variance
Tests d’hypothèses
  • Qu’est-ce qu’un test d’hypothèse ? : Généralités, règle de décision, risques d’erreur, puissance
  • Les tests de conformité ou de comparaison à une norme : Conformité d’une moyenne, d’une proportion
  • Les tests de comparaison de deux populations : Comparaison de deux moyennes, de deux proportions
  • Test d’ajustement à une loi de probabilité normale : Le test de Shapiro-Wilk
  • Introduction aux tests non paramétriques : Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman
Liaisons entre deux variables
  • Liaison entre deux variables quantitatives : Nuage de points, intensité de la liaison, significativité
  • Liaison entre deux variables qualitatives : Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
  • Liaison entre une variable qualitative et quantitative : Comparaison de plusieurs populations, le rapport de corrélation
  • Liaisons entre plusieurs variables – Approches graphiques : matrice de nuages de points, treillis – Caractériser des sous-populations par plusieurs variables
L’analyse de la variance – Anova
  • Analyse de la variance à un facteur :Variabilité inter, intra, totale – Rapport de corrélation – Le test de Fisher
  • Comparaisons multiples de moyennes : Analyses post hoc, la procédure de Tukey
  • Analyse de la variance à deux facteurs et interaction
  • Extensions de l’Anova : Modèle à effet fixe ou aléatoire, modèle hiérarchisé
Régression linéaire simple et multiple
  • De la corrélation à la régression : L’intérêt d’un modèle – Variables à expliquer, explicatives, erreur
  • La régression linéaire simple : Ajustement par la méthode des moindres carrés – Tests et validation du modèle
  • La régression linéaire multiple
  • Choix d’un modèle de régression : Pourquoi sélectionner un sous-ensemble de variables explicatives ? Les différentes approches et critères de sélection d’un modèle
Analyse de données multidimensionnelles
  • Un panorama des méthodes multidimensionnelles Analyses factorielles, classification – Le package FactoMineR
  • ACP : Analyse en Composantes principales
  • AFC : Analyse Factorielle des Correspondances
  • ACM : Analyse des correspondances Multiples
  • CAH : Classification Ascendante Hiérarchique

Bonjour !

vous venez souvent ?

Identifiez-vous pour avoir accès à toutes les fontionnalités !

Aide mémoire off'R ;)

Enregistrez vous pour recevoir gratuitement mes fiches “aide mémoire” (ou cheat sheets) qui vous permettront de réaliser facilement les principales analyses biostatistiques avec le logiciel R et pour être informés des mises à jour du site.