7 étapes pour organiser son travail sous R

7 étapes pour organiser son travail sours R

7 étapes pour organiser son travail sous R Lorsque je réalise des séances de coaching individuelles, ou lorsque je fais des formations, je commence toujours par expliquer comment organiser efficacement son flux de travail sous R. Ce sont des étapes clés, qui a mon sens, doivent être engagées avant même de parler d’analyse de données ! […]

Régression linéaire simple : quand les hypothèses ne sont pas satisfaites

Régression linéaire simple : quand les hypothèses ne sont pas satisfaites Pour faire suite au précédent post sur la régression linéaire simple  dans cet article, je vais vous parler des alternatives possibles à cette méthode, lorsqu’une, ou plusieurs de ses hypothèses de validité, ne sont pas satisfaites. Pour rappel, la régression linéaire simple est une […]

La régression linéaire simple avec le logiciel R

régression linéaire avec R

La régression linéaire simple avec le logiciel R Dans cet article, tourné une nouvelle fois sur la pratique, je vous propose 10 étapes pour mener à bien une régression linéaire simple avec le logiciel R. Pour rappel, la régression linéaire simple est une méthode statistique classique, qui est employée pour évaluer la significativité du lien […]

ANOVA à un facteur : quand les hypothèses ne sont pas satisfaites

anova avec R

ANOVA à un facteur : quand les hypothèses ne sont pas satisfaites Cet article est le troisième volet dédié à l’analyse de variance à un facteur. Après l’article sur la théorie de l’ANOVA à un facteur, et celui sur la réalisation de cette méthode avec le logiciel R, cet article est dédié aux solutions envisageables […]

ANOVA à un facteur : partie 2 – la pratique

ANOVA à un facteur : partie 2 – la pratique Pour faire suite au précédent article sur l’ANOVA à un facteur qui était plutôt théorique, je vais vous montrer, dans cet article comment réaliser, en pratique, une ANOVA à un facteur avec R. Pour cela, je vais utiliser le jeu de données cholesterol du package […]

ANOVA à un facteur : partie 1

ANOVA un facteur

ANOVA à un facteur : partie 1 L’ANOVA à un facteur (ou one-way ANOVA) est une méthode statistique extrêmement répandue, qui est employée pour comparer plus de deux moyennes. Elle est dite à un facteur, car les moyennes sont relatives aux différentes modalités d’une seule variable, ou facteur. Cette méthode est un peu déconcertante au […]

Ressources francophones pour l’analyse de données avec le logiciel R

Ressources R francophones

Ressources francophones pour l’analyse de données avec le logiciel R La semaine dernière deux personnes m’ont demandé des conseils sur les ressources, en français et de préférence gratuites, à utiliser pour apprendre à analyser des données avec le logiciel R. J’ai évidemment répondu que mon blog était une excellente option ;-), mais j’ai aussi essayer […]

Comparaison de deux moyennes avec le logiciel R

Comparaison de deux moyennes avec le logiciel R Alors vous y voilà, vous avez recueilli deux échantillons d’observations numériques continues, et vous vous demandez si les données de ces deux groupes sont différentes ou non. Autrement formulé vous vous demandez si les populations dont sont issus vos deux échantillons sont différentes ou pas.   Ce type […]

12 conseils pour organiser efficacement vos données dans un tableur

tableaur

12 conseils pour organiser efficacement vos données dans un tableur En tant qu’ ingénieur en biostatistique, mon métier consiste à analyser les données des autres. Ces autres, qui sont des collègues,  me transmettent leurs données sous la forme d’un tableur (Excel dans 99% des cas).Mais lorsque je les reçois, je m’arrache régulièrement les cheveux. Heureusement, […]

Analyses statistiques descriptives de données numériques – partie 1

Analyses statistiques descriptives de données numériques – partie 1 Les analyses statistiques descriptives ont un rôle très important car elles permettent de donner une première intelligibilité aux données. Comme je l’ai expliqué ici, les analyses statistiques descriptives consistent à calculer des paramètres qui résument les données étudiées. Ces paramètres sont de deux types. Il s’agit […]