ANOVA à un facteur : partie 2 – la pratique

comparaisons

ANOVA à un facteur : partie 2 – la pratique Table des matières Pour faire suite au précédent article sur l’ANOVA à un facteur qui était plutôt théorique, je vais vous montrer, dans cet article comment réaliser, en pratique, une ANOVA à un facteur avec R. Pour cela, je vais utiliser le jeu de données […]

Tests de permutation avec le logiciel R

Tests de permutation avec le logiciel R Les tests de permutation sont des approches robustes, basées sur l’aléatoire et le ré-échantilonnage. Elles permettent de réaliser des tests “classiques”, notamment des procédures paramétriques, sans que la validité des résultats ne reposent sur des distributions théoriques ! Concrètement, ça veut dire par exemple, qu’il est possible de […]

Imputation des données manquantes par missMDA !

Imputation des données manquantes par missMDA !

Imputation des données manquantes par missMDA ! La semaine dernière j’ai assisté à une présentation, par François Husson, du package missMDA, dont il est co auteur avec Julie Josse. Le package missMDA permet de faire de l’imputation, c’est à dire de remplacer les données manquantes d’un tableau de données par des valeurs plausibles. Le principe est […]

Comparaison de deux pourcentages avec le logiciel R

Comparaison de deux pourcentages avec le logiciel R Après le post concernant l’analyse descriptive des variables catégorielles et celui dédié à la visualisation des variables catégorielles, cet article s’intéresse à la comparaison de deux pourcentages, autrement dit à la comparaison statistique des combinaisons de deux variables catégorielles. Le test statistique le plus couramment employé pour […]

Tutoriel : Comment importer plusieurs jeux de données automatiquement

imortation automatisée de pluliseurs fichiers dans R

Tutoriel : Comment importer plusieurs jeux de données automatiquement Il y a quelques années, j’ai fait une prestation qui consistait à analyser des données de températures mesurées le long d’une rivière. Cette analyse nécessitait d’importer plusieurs jeux de données dans R, une bonne vingtaine ! Il y avait des fichiers pour chaque lieu de prélèvement, […]

Data visualisation des variables catégorielles

visualisation des variables catégorielles

Data visualisation des variables catégorielles Pour faire suite à un premier article concernant la description des variables catégorielles, publié il y a quelques semaines, je vais vous présenter, dans ce billet, quelques visualisations particulièrement adaptées à la représentation graphique de ce type de données. J’en utilise classiquement trois : les mosaic plots les bar plots […]

Analyse descriptive des variables catégorielles

Analyse descriptive des variables catégorielles Il y quelques temps, j’ai publié un article sur l’analyse descriptive des variables numériques. Pour ne pas laisser en reste les variables descriptives, je vais vous montrer, dans ce post, quelques fonctions R qui permettent de réaliser facilement une analyse descriptive de ce type de variable. Plus précisément, je vais […]

Comparaison de deux moyennes avec le logiciel R

Comparaison de deux moyennes avec le logiciel R Alors vous y voilà, vous avez recueilli deux échantillons d’observations numériques continues, et vous vous demandez si les données de ces deux groupes sont différentes ou non. Autrement formulé vous vous demandez si les populations dont sont issus vos deux échantillons sont différentes ou pas.   Ce type […]

Comment évaluer la liaison entre deux variables numériques ?

tutoriel régression corrélation

Comment évaluer la liaison entre deux variables numériques ? Dans un précédent article j’abordais, d’un point de vue théorique, les méthodes qui peuvent être employées pour évaluer la liaison entre deux variables numériques continues. Je disais qu’il en existe deux principales : la régression linéaire simple qui permet d’évaluer s’il existe un lien linéaire entre les […]

Estimer l’intervalle de confiance d’une moyenne par bootstrap en une seule ligne de commande

intervalle de confiance

Estimer l’intervalle de confiance d’une moyenne par bootstrap en une seule ligne de commande Il y a deux semaines, lorsque j’ai publié l’article sur comment faire des analyses statistiques descriptives de variables numériques avec le logiciel R j’ai parlé de l’intervalle de confiance “bootstrap percentile” de la moyenne. Et j’ai montré comment l’estimer avec le package […]