La régression linéaire simple avec le logiciel R

régression linéaire avec R

Particuliers : 125 euros/j Etudiants  et  Chômeurs (sur justificatifs) : 70 euros La régression linéaire simple avec le logiciel R Dans cet article, tourné une nouvelle fois sur la pratique, je vous propose 10 étapes pour mener à bien une régression linéaire simple avec le logiciel R. Pour rappel, la régression linéaire simple est une méthode […]

Comparaisons multiples et ajustement des pvalues avec le logiciel R

augmentation du risque alpha

Comparaisons multiples et ajustement des p-values avec le logiciel R Dans un article précédent, je parlais des comparaisons multiples qui sont réalisées après à une ANOVA significative, afin d’identifier les moyennes statistiquement différentes entre elles. Je disais que lorsque des comparaisons multiples sont réalisées, le risque de se tromper (en déclarant que deux moyennes sont différentes si en réalité, […]

ANOVA à un facteur : partie 2 – la pratique

comparaisons

ANOVA à un facteur : partie 2 – la pratique Table des matières Pour faire suite au précédent article sur l’ANOVA à un facteur qui était plutôt théorique, je vais vous montrer, dans cet article comment réaliser, en pratique, une ANOVA à un facteur avec R. Pour cela, je vais utiliser le jeu de données […]

Tests de permutation avec le logiciel R

Tests de permutation avec le logiciel R Les tests de permutation sont des approches robustes, basées sur l’aléatoire et le ré-échantilonnage. Elles permettent de réaliser des tests “classiques”, notamment des procédures paramétriques, sans que la validité des résultats ne reposent sur des distributions théoriques ! Concrètement, ça veut dire par exemple, qu’il est possible de […]

Imputation des données manquantes par missMDA !

Imputation des données manquantes par missMDA !

Imputation des données manquantes par missMDA ! La semaine dernière j’ai assisté à une présentation, par François Husson, du package missMDA, dont il est co auteur avec Julie Josse. Le package missMDA permet de faire de l’imputation, c’est à dire de remplacer les données manquantes d’un tableau de données par des valeurs plausibles. Le principe est […]

Comparaison de deux pourcentages avec le logiciel R

Comparaison de deux pourcentages avec le logiciel R Après le post concernant l’analyse descriptive des variables catégorielles et celui dédié à la visualisation des variables catégorielles, cet article s’intéresse à la comparaison de deux pourcentages, autrement dit à la comparaison statistique des combinaisons de deuxvariables catégorielles. Le test statistique le plus couramment employé pour comparer […]

Tutoriel : Comment importer plusieurs jeux de données automatiquement

imortation automatisée de pluliseurs fichiers dans R

Tutoriel : Comment importer plusieurs jeux de données automatiquement Il y a quelques années, j’ai fait une prestation qui consistait à analyser des données de températures mesurées le long d’une rivière. Cette analyse nécessitait d’importer plusieurs jeux de données dans R, une bonne vingtaine ! Il y avait des fichiers pour chaque lieu de prélèvement, […]

Data visualisation des variables catégorielles

visualisation des variables catégorielles

Data visualisation des variables catégorielles Pour faire suite à un premier article concernant la description des variables catégorielles, publié il y a quelques semaines, je vais vous présenter, dans ce billet, quelques visualisations particulièrement adaptées à la représentation graphique de ce type de données. J’en utilise classiquement trois : les mosaic plots les bar plots […]

Analyse descriptive des variables catégorielles

Analyse descriptive des variables catégorielles Il y quelques temps, j’ai publié un article sur l’analyse descriptive des variables numériques. Pour ne pas laisser en reste les variables descriptives, je vais vous montrer, dans ce post, quelques fonctions R qui permettent de réaliser facilement une analyse descriptive de ce type de variable. Plus précisément, je vais […]

Comparaison de deux moyennes avec le logiciel R

Comparaison de deux moyennes avec le logiciel R Alors vous y voilà, vous avez recueilli deux échantillons d’observations numériques continues, et vous vous demandez si les données de ces deux groupes sont différentes ou non. Autrement formulé vous vous demandez si les populations dont sont issus vos deux échantillons sont différentes ou pas.   Ce type […]