Comment déterminer la taille de l'échantillon en ANOVA : le nombre minimum d'unités expérimentales

# Installer et charger les packages nécessaires #install.packages("tidyverse") library(tidyverse) # Charger les données iris data(iris) # Utiliser la fonction slice_head() du package dplyr pour sélectionner les 5 premières lignes de chaque espèce iris_short <- iris %>% group_by(species) %>% slice_head(n=5) # affichage des données iris_short ## Sepal.Length Sepal.Width Petal.Length Petal.Width Species ## 1 5.1 3.5 1.4 0.2 setosa ## 2 4.9 3.0 1.4 0.2 setosa ## 3 4.7 3.2 1.3 0.2 setosa ## 4 4.6 3.1 1.5 0.2 setosa ## 5 5.0 3.6 1.4 0.2 setosa ## 6 7.0 3.2 4.7 1.4 versicolor ## 7 6.4 3.2 4.5 1.5 versicolor ## 8 6.9 3.1 4.9 1.5 versicolor ## 9 5.5 2.3 4.0 1.3 versicolor ## 10 6.5 2.8 4.6 1.5 versicolor ## 11 6.3 3.3 6.0 2.5 virginica ## 12 5.8 2.7 5.1 1.9 virginica ## 13 7.1 3.0 5.9 2.1 virginica ## 14 6.3 2.9 5.6 1.8 virginica ## 15 6.5 3.0 5.8 2.2 virginica

library(parameters) parameters(model,effectsize_type = c("eta", "f" )) ## Parameter | Sum_Squares | df | Mean_Square | F | p | Eta2 | Cohen's f ## ---------------------------------------------------------------------------- ## Species | 0.37 | 2 | 0.19 | 2.14 | 0.161 | 0.26 | 0.60 ## Residuals | 1.04 | 12 | 0.09 | | | | ## ## Anova Table (Type 1 tests)

# Installer et charger les packages nécessaires #install.packages("pwr") library(pwr) # Définir les paramètres de la puissance de l'analyse alpha <- 0.05 # Niveau de signification power <- 0.8 # Puissance souhaitée f <- 0.6 # Effect size f # Calculer le nombre d'unités expérimentales nécessaires n <- pwr.anova.test(k = 3, f = f, sig.level = alpha, power = power) n ## ## Balanced one-way analysis of variance power calculation ## ## k = 3 ## n = 9.990612 ## f = 0.6 ## sig.level = 0.05 ## power = 0.8 ## ## NOTE: n is number in each group

# Définition d'une séquence de nombres allant de 5 à 50 par incréments de 1 et stockage dans l'objet "n" n <- seq(5,50,by=1) # Calcul de la puissance statistique pour une ANOVA à un facteur avec trois groupes en fonction de n # Les valeurs de f et sig.level doivent être définies au préalable # La fonction pwr.anova.test du package "pwr" est utilisée pour effectuer le calcul puissance <- pwr.anova.test(k = 3, f = f, sig.level = alpha,n=n)$power # Création d'un objet data frame "df" contenant les valeurs de n et de puissance df <- data.frame(n, puissance) # Création d'un graphique à partir de l'objet "df" en utilisant la bibliothèque ggplot2 # La fonction geom_point ajoute des points au graphique correspondant à chaque paire (n, puissance) # La fonction geom_hline ajoute deux lignes horizontales au graphique à y = 0.8 (en bleu) et y = 0.9 (en rouge) ggplot(df, aes(x=n, y=puissance))+ geom_point()+ geom_hline(yintercept=0.8, colour="blue", linetype=2)+ geom_hline(yintercept=0.9, colour="red",linetype=2)

13 réponses

Lilian Vallet dit :
4 mai 2023 à 10 h 32 min
Merci Claire pour ce post, toujours très intéressant !
Pour la sélection des 5 premières valeurs de chaque espèce, nous pouvons utiliser la fonction slice_head du tidyverse :
iris%>%
group_by(Species)%>%
slice_head(n=5)
L’ensemble des fonctions slice et notamment slice_sample sont très pratiques !
Répondre
1. Claire Della Vedova dit :
  7 mai 2023 à 12 h 54 min
  Bonjour Lilian,
  Vous venez de me prendre en flagrant délit de sur-utilisation des fonctions map ! Comme je ne sais pas bien me servir de purrr, et des fonctions map, j’essaye de les employer le plus possible !
  Votre suggestion est tellement plus élégante et simple, que j’ai modifié le code de l’article.
  Merci.
  Répondre
Benjamin Ncangu dit :
4 mai 2023 à 11 h 49 min
Bonjour Madame Claire.
Je suis très ravi d’apprendre ce calcul mais quelques questions me viennent à l’esprit.
Dans l’exemple donné ci-haut, les résultats obtenus viennent d’une simulation à partir des données existantes.
Alors comment obtenir le nombre minimum d’unités expérimentales si ces données là n’existaient pas.
Merci
Répondre
1. Claire Della Vedova dit :
  7 mai 2023 à 12 h 49 min
  Bonjour Benjamin,
  Bonjour,
  vous pouvez vous aider des seuils d’effect size classiquement employés (small : 0.1, medium : 0.25, large : 0.4) (https://imaging.mrc-cbu.cam.ac.uk/statswiki/FAQ/effectSize), et en utilisant une puissance de 0.8 (minimum classique) et 0.9.
  J’espère que cela vous aide.
  Bonne continuation.
  Répondre
OROU Hidirou dit :
4 mai 2023 à 12 h 50 min
Bonjour Claire,
J’ai beaucoup apprécié votre article et j’ai une question à vous poser. Je souhaite commencer une expérimentation mais je n’ai pas encore de données. Comment puis-je déterminer les paramètres de f et de puissance pour obtenir le nombre minimal d’unités expérimentales nécessaires ?
Je vous remercie d’avance pour votre aide et vous adresse mes salutations cordiales.
Répondre
1. Claire Della Vedova dit :
  7 mai 2023 à 12 h 47 min
  Bonjour,
  vous pouvez vous aider des seuils d’effect size classiquement employés (small : 0.1, medium : 0.25, large : 0.4) (https://imaging.mrc-cbu.cam.ac.uk/statswiki/FAQ/effectSize), et en utilisant une puissance de 0.8 (minimum classique) et 0.9.
  J’espère que cela vous aide.
  Bonne continuation.
  Répondre
Neila dit :
4 mai 2023 à 14 h 20 min
Bonjour et merci beaucoup pour cet article très intéressant, très clair, qui répond à une question cruciale qu’on se pose toujours. Je sais enfin comment faire pour y répondre et j’ai hâte de mettre cela en application ! Mille merci pour cela !
Je me posais une petite question par curiosité sur l’un des termes de la fonction pwr.anova.test où je vois qu’il faut renseigner que k = 3. A quoi correspond ce k et sa valeur est-elle constante ou bien dépend-t-elle de quelque chose ?
Merci beaucoup !
Répondre
1. Céline dit :
  4 mai 2023 à 15 h 58 min
  Salut, k corresponds au nombre de modalités/ traitements différents, ici on a 3 espèces
  Répondre
Traoré dit :
4 mai 2023 à 17 h 04 min
Merci bien
Répondre
Abdoul Kader GANDEMA dit :
4 mai 2023 à 17 h 17 min
Merci bien à vous
Répondre
Seka seka dit :
10 octobre 2023 à 9 h 49 min
Merci Claire
Répondre
Bonnald Julie dit :
5 juin 2026 à 11 h 20 min
Bonjour Claire,
Merci beaucoup pour ce post très intéressant.
Peut on utiliser cette méthode si nos données ne suivent pas la normalité ?
Et si ce n’est pas le cas, existe t il une méthode analogue ?
Merci beaucoup de votre aide grâce à ce post et aux nombreux autres !
Bonne continuation
Répondre
1. Claire Della Vedova dit :
  8 juin 2026 à 9 h 11 min
  Bonjour Julie,
  En principe l’ANOVA est assez robuste aux écarts modérés à la normalité, notamment si les groupes sont équilibrés, et les effectifs sont suffisants (à partir de 15 ??). Dans ce cas, vous pouvez employer ces méthodes.
  Si vos données sont très éloignées de la normalité (distribution tr§s asymétrique, présences de valeurs extrêmes) c’est le test de Kruskal- Wallis qui s’appliquera, et dans ce cas là, je ne connais pas d’approche facile à mettre en place. Une piste peut être : regarder du côté des simulations avec le package simr.
  J’espère que cela vous aide tout de même.
  Répondre

Comment déterminer la taille de l’échantillon en ANOVA : le nombre minimum d’unités expérimentales

Introduction

Les étapes de calcul du nombre minimum d'unités expérimentales nécessaires :

Exemple d'un calcul du nombre minimum d'unités expérimentales nécessaires, avec R

Génération des données

Réalisation de l'ANOVA à un facteur

Calcul de l'effect size f

Calcul du nombre minimum d'unités expérimentales nécessaires

Généralisation du calcul

Conclusion

13 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?

Aide mémoire off'R ;)

Comment déterminer la taille de l’échantillon en ANOVA : le nombre minimum d’unités expérimentales

Introduction

Les étapes de calcul du nombre minimum d'unités expérimentales nécessaires :

Exemple d'un calcul du nombre minimum d'unités expérimentales nécessaires, avec R

Génération des données

Réalisation de l'ANOVA à un facteur

Calcul de l'effect size f

Calcul du nombre minimum d'unités expérimentales nécessaires

Généralisation du calcul

Conclusion

13 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?​

Aide mémoire off'R ;)

Vous souhaitez soutenir mon travail ?