ANOVA non paramétrique à 2 facteurs ou le test de Scheirer-Ray-Hare

# renommer TG <- ToothGrowth TG$dose <- as.factor(TG$dose) library(tidyverse) TG %>% group_by(supp, dose) %>% count() ## # A tibble: 6 x 3 ## # Groups: supp, dose [6] ## supp dose n ## <fct> <fct> <int> ## 1 OJ 0.5 10 ## 2 OJ 1 10 ## 3 OJ 2 10 ## 4 VC 0.5 10 ## 5 VC 1 10 ## 6 VC 2 10

TG.aov <- aov(len~dose*supp, contrasts = list(dose=contr.sum, supp=contr.sum), data=TG) Anova(TG.aov, type=3) ## Anova Table (Type III tests) ## ## Response: len ## Sum Sq Df F value Pr(>F) ## (Intercept) 21236.5 1 1610.393 < 2.2e-16 *** ## dose 2426.4 2 92.000 < 2.2e-16 *** ## supp 205.4 1 15.572 0.0002312 *** ## dose:supp 108.3 2 4.107 0.0218603 * ## Residuals 712.1 54 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# test de shapiro wilk sur les résidus check_normality(TG.aov) ## OK: residuals appear as normally distributed (p = 0.669). # test de Bartlet : check_homogeneity(TG.aov) ## OK: There is not clear evidence for different variances across groups (Bartlett Test, p = 0.226).

### Scheirer–Ray–Hare test library(rcompanion) scheirerRayHare(len ~ dose * supp, data = TG, type=2) ## ## DV: len ## Observations: 60 ## D: 0.999222 ## MS total: 305 ## Df Sum Sq H p.value ## dose 2 12394.4 40.669 0.00000 ## supp 1 1050.0 3.445 0.06343 ## dose:supp 2 515.5 1.692 0.42923 ## Residuals 54 4021.1

library(lmPerm) set.seed(1234) TG.aovp <- aovp(len~dose*supp, contrasts = list(dose=contr.sum, supp=contr.sum), data=TG) ## [1] "Settings: unique SS " summary(TG.aovp) ## Component 1 : ## Df R Sum Sq R Mean Sq Iter Pr(Prob) ## dose1 2 2426.43 1213.22 5000 < 2e-16 *** ## supp1 1 205.35 205.35 5000 < 2e-16 *** ## dose1:supp1 2 108.32 54.16 3123 0.04195 * ## Residuals 54 712.11 13.19 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

View(warpbreaks) WB <- warpbreaks library(tidyverse) WB %>% group_by(wool, tension) %>% count() ## # A tibble: 6 x 3 ## # Groups: wool, tension [6] ## wool tension n ## <fct> <fct> <int> ## 1 A L 9 ## 2 A M 9 ## 3 A H 9 ## 4 B L 9 ## 5 B M 9 ## 6 B H 9

WB.aov <- aov(breaks~wool*tension, contrasts = list(wool=contr.sum, tension=contr.sum), data=WB) Anova(WB.aov, type=3) ## Anova Table (Type III tests) ## ## Response: breaks ## Sum Sq Df F value Pr(>F) ## (Intercept) 42785 1 357.4672 < 2.2e-16 *** ## wool 451 1 3.7653 0.0582130 . ## tension 2034 2 8.4980 0.0006926 *** ## wool:tension 1003 2 4.1891 0.0210442 * ## Residuals 5745 48 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

### Scheirer–Ray–Hare test library(rcompanion) scheirerRayHare(breaks~wool*tension, data = WB, type=2) ## ## DV: breaks ## Observations: 54 ## D: 0.9980941 ## MS total: 247.5 ## Df Sum Sq H p.value ## wool 1 327.6 1.3261 0.249508 ## tension 2 2670.2 10.8093 0.004496 ## wool:tension 2 899.8 3.6427 0.161810 ## Residuals 48 9194.9

library(lmPerm) set.seed(1234) WB.aovp <- aovp(breaks~wool*tension, contrasts = list(wool=contr.sum, tension=contr.sum), data=WB) ## [1] "Settings: unique SS " summary(WB.aovp) ## Component 1 : ## Df R Sum Sq R Mean Sq Iter Pr(Prob) ## wool1 1 450.7 450.67 2452 0.03956 * ## tension1 2 2034.3 1017.13 5000 0.00020 *** ## wool1:tension1 2 1002.8 501.39 5000 0.01660 * ## Residuals 48 5745.1 119.69 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

14 réponses

Laurence C dit :
18 mars 2022 à 9 h 57 min
Génial, je vais explorer ça !
Cela signifie que l’on peut explorer les effets d’interactions, ce qui est compliqué avec les analyses non-paramétriques.
En revanche, pourriez-vous indiquer comment on rédige les résultats du test dans un compte-rendu ou article scientifique.
Il faut indiquer la valeur du H et la p-value j’imagine ?
Répondre
1. Claire Della Vedova dit :
  20 mars 2022 à 17 h 50 min
  Bonjour Laurence,
  oui on peut explorer les interactions, mais en gardant à l’esprit que le test manque de puissance. C’est pour ça que je testerai la robustesse des résultats avec l’anova paramétrique et le test de permutation.
  Concernant la rédaction des résultats, je pense que l’on peut s’inspirer de ce que fait le package report. Vous trouverez un exemple dans cet article « Obtenir un reporting automatique des analyses statistiques«
  Répondre
GINOUVES dit :
18 mars 2022 à 10 h 05 min
Bonjour Claire et merci pour ces explications. Finalement dans cet exemple, vous préférez opter pour une ANOVA paramétrique malgré une absence d’homogénéité des variances. Dans ce cas là, n’est-il pas tout simplement préférable de partir sur un test de Kruskal-Wallis ?
Bien cordialement
Répondre
1. Claire Della Vedova dit :
  20 mars 2022 à 17 h 38 min
  Bonjour,
  Le test de Kruskall-Wallis est une anova non paramétrique à un seul facteur. Ici on est sur une anova non paramétrique à 2 facteurs. Et comme le test manque de puissance, je pense que c’est pas mal de vérifier la robustesse des résultats avec une méthode paramétrique, même si les hypothèses ne sont pas satisfaites.
  Bonne continuation
  Répondre
SamGG dit :
18 mars 2022 à 11 h 10 min
Merci Claire pour ce partage et les visualisations avec le package performance.
Rcompanion est une telle mine qu’il y a toujours à découvrir… tout comme DellaData.fr !
Répondre
Sauriau P.-G. dit :
18 mars 2022 à 15 h 19 min
Merci beaucoup pour cette page comme toujours extrêmement didactique et source d’inspirations.
Vous avez pour clarifier l’aspect « nouveauté » dans la troisième édition du Sokal & Rohl (1991) en page 445-447 un exemple traité de ce test
avec les calculs à la main (box 13.12) pour bien en comprendre construction et logique.
L’ouvrage de Jerrold Zar (1984) présente également ce test en chapitre 13.4, p. 219 avec une approche de comparaisons multiples remaniée dans les éditions ultérieures.
En tout cas dans le domaine de la biologie expérimentale, voilà un test bien intéressant.
Répondre
Mbusa dit :
18 mars 2022 à 16 h 02 min
Merci beaucoup, Claire. C’est chouette ce test. R peut tout faire finalement. On ne cessera d’apprendre.
Répondre
GALBONI Adama dit :
18 mars 2022 à 23 h 46 min
Claire, je vous tire mon chapeau. Vous aviez une méthodo simple pour faire passer la pilule.
J’ai beaucoup aimé ce tuto.
Bon vent!!
Répondre
TRAORE dit :
19 mars 2022 à 15 h 25 min
Vraiment merci beaucoup je me demandais depuis fort longtemps si cela était possible
Répondre
Sauriau P.-G. dit :
20 mars 2022 à 11 h 08 min
Je pense avoir oublié de citer mes sources :
Sokal, R.R. & Rohlf, F.J., 1995. Biometry. The principles and practice of statistics in biological research. Third edition. New York, Freeman, W.H. and Co. : 887 p.
qui fait duite à l’édition de 198 en deux volumes (livre + tables)
et
Zar, J.H., 1984. Biostatistical analysis. Englewood Cliffs, New Jersey, Prentice Hall : 718 p.
avec sa nouvelle édition
Zar, J.H., 2014. Biostatistical analysis. Harlow, UK, Pearson Education Limited : 756 p.
Cordialement
Répondre
1. Claire Della Vedova dit :
  20 mars 2022 à 17 h 36 min
  Bonjour Pierre Guy,
  merci pour ces compléments d’information.
  J’ajoute aussi la publication originale :
  Scheirer, C. J., Ray, W. S., & Hare, N. (1976). The analysis of ranked data derived from completely randomized factorial designs. Biometrics, 429-434.
  Répondre
Philippe Vignoles dit :
1 septembre 2022 à 11 h 05 min
Bonjour Claire,
Je rebondis sur votre article, il est vrai avec beaucoup de retard…
Ce que j’aime bien dans votre blog, c’est l’approche claire (sans jeu de mots) de la présentation d’un problème qui est pourtant loin d’être simple. Bravo à vous pour ces présentations synthétiques et abordables.
Votre comparaison entre les différentes analyses est vraiment intéressante mais une question me taraude cependant :
dans l’analyse par permutations, si on relance la commande, les résultats finaux changent. Il est vrai qu’ils ne changent pas toujours d’une manière fondamentale mais je me suis retrouvé dans des cas où justement, des résultats significatifs ne l’étaient plus après une 2e voire 3e tentative… Cela s’explique bien entendu par le réarrangement des données du fait de la permutation…
Mais du coup, quelle est la méthode à utiliser ? Doit-on se contenter des premiers calculs seulement ?
Merci d’avance de votre point de vue
Cordialement
Philippe
Répondre
1. Claire Della Vedova dit :
  28 septembre 2022 à 9 h 21 min
  Bonjour Philippe,
  je suis bien embêtée aussi lorsque je constate ce comportement.
  Je pense qu’il faudrait faire une boucle pour lancer 100, 1000 ou 10 000 simulations et regarder combien de fois les résultats s’inversent….mais je n’ai rien de plus précis à vous recommander.
  Répondre
Obrayane dit :
16 janvier 2023 à 23 h 07 min
Bonjour ! Je suis très comptent de lire votre article sur l’Anova à deux facteurs, de sur quoi j’ai eu ce dilemme lors de la rédaction de mon mémoire et j’ai alors trouvé par hasard le test de Scheirer-Ray-Hare en fessant mes recherches.
Répondre

ANOVA non paramétrique à 2 facteurs ou le test de Scheirer-Ray-Hare

Table des matières

Analyse des données ToothGrowth

Data

Anova paramétrique à 2 facteurs

Anova non paramétrique à 2 facteurs : Test de Scheirer-Ray-Hare.

Anova à 2 facteurs par permutations

Analyse des données warpbreaks

Data

Anova paramétrique à deux facteurs

Anova non paramétrique à 2 facteurs : Test de Scheirer-Ray-Hare.

Anova à deux facteurs par permutation

Conclusion

Poursuivez votre lecture

Soutenir le blog

14 réponses

Laisser un commentaire Annuler la réponse

Aide mémoire off'R ;)