p-values ajustées : affichez les facilement sur un graph !

data("ToothGrowth") TG <- ToothGrowth head(TG) ## len supp dose ## 1 4.2 VC 0.5 ## 2 11.5 VC 0.5 ## 3 7.3 VC 0.5 ## 4 5.8 VC 0.5 ## 5 6.4 VC 0.5 ## 6 10.0 VC 0.5 str(TG) ## 'data.frame': 60 obs. of 3 variables: ## $ len : num 4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ... ## $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ... ## $ dose: num 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 0.5 ...

TG$dose <- as.factor(TG$dose) str(TG) ## 'data.frame': 60 obs. of 3 variables: ## $ len : num 4.2 11.5 7.3 5.8 6.4 10 11.2 11.2 5.2 7 ... ## $ supp: Factor w/ 2 levels "OJ","VC": 2 2 2 2 2 2 2 2 2 2 ... ## $ dose: Factor w/ 3 levels "0.5","1","2": 1 1 1 1 1 1 1 1 1 1 ...

mc_t_test <- compare_means(len ~ dose, comparisons = my_comparisons, p.adj= "holm", method='t.test', data = ToothGrowth) mc_t_test ## # A tibble: 3 x 8 ## .y. group1 group2 p p.adj p.format p.signif method ## ## 1 len 0.5 1 1.27e- 7 2.50e- 7 1.3e-07 **** T-test ## 2 len 0.5 2 4.40e-14 1.30e-13 4.4e-14 **** T-test ## 3 len 1 2 1.91e- 5 1.90e- 5 1.9e-05 **** T-test

# on ajoute la hauteur ou indiquer les p-values sur le graphs mc_t_test <- mc_t_test %>% mutate(y.position = c(29, 35, 39)) mc_t_test ## # A tibble: 3 x 9 ## .y. group1 group2 p p.adj p.format p.signif method y.position ## ## 1 len 0.5 1 1.27e- 7 2.50e- 7 1.3e-07 **** T-test 29 ## 2 len 0.5 2 4.40e-14 1.30e-13 4.4e-14 **** T-test 35 ## 3 len 1 2 1.91e- 5 1.90e- 5 1.9e-05 **** T-test 39

ggboxplot(TG, x = "dose", y = "len", color = "dose", palette =c("#00AFBB", "#E7B800", "#FC4E07"), add = "jitter", shape = "dose")+ # ajout de la p-value globale stat_compare_means(method = "anova", label.y=45)+ # ajout des p-values des comparaisons deux à deux grace à la fonction # stat_pvalue_manual et l'objet mc_t_test stat_pvalue_manual(mc_t_test, label = "p.adj")+ theme(legend.position="none")

my.anova <- lm(len~dose, data=TG) library(car) Anova(my.anova) ## Anova Table (Type II tests) ## ## Response: len ## Sum Sq Df F value Pr(>F) ## dose 2426.4 2 67.416 9.533e-16 *** ## Residuals 1025.8 57 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pairwise.t.test(TG$len, TG$dose, p.adj="holm", pool.sd =FALSE) ## ## Pairwise comparisons using t tests with non-pooled SD ## ## data: TG$len and TG$dose ## ## 0.5 1 ## 1 2.5e-07 - ## 2 1.3e-13 1.9e-05 ## ## P value adjustment method: holm

# on indique les comparaisons deux à deux my_comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") ) mc_wilcox_test <- compare_means(len ~ dose, comparisons = my_comparisons, p.adj= "holm", method='wilcox.test', data = ToothGrowth)

mc_wilcox_test ## # A tibble: 3 x 8 ## .y. group1 group2 p p.adj p.format p.signif method ## ## 1 len 0.5 1 0.00000702 0.000014 7.0e-06 **** Wilcoxon ## 2 len 0.5 2 0.0000000841 0.00000025 8.4e-08 **** Wilcoxon ## 3 len 1 2 0.000177 0.00018 0.00018 *** Wilcoxon

# on ajoute la hauteur ou indiquer les p-values sur le graphs mc_wilcox_test <- mc_wilcox_test %>% mutate(y.position = c(29, 35, 39)) mc_wilcox_test ## # A tibble: 3 x 9 ## .y. group1 group2 p p.adj p.format p.signif method y.position ## ## 1 len 0.5 1 7.02e-6 1.40e-5 7.0e-06 **** Wilco~ 29 ## 2 len 0.5 2 8.41e-8 2.50e-7 8.4e-08 **** Wilco~ 35 ## 3 len 1 2 1.77e-4 1.80e-4 0.00018 *** Wilco~ 39

ggboxplot(TG, x = "dose", y = "len", color = "dose", palette =c("#00AFBB", "#E7B800", "#FC4E07"), add = "jitter", shape = "dose")+ # ajout de la p-value globale stat_compare_means(method = "kruskal.test", label.y=45)+ # ajout des p-values des comparaisons deux à deux grace à la fonction # stat_pvalue_manual et l'objet mc_wilcox_test stat_pvalue_manual(mc_wilcox_test, label = "p.adj")+ theme(legend.position="none")

my.ks <- kruskal.test(len~dose, data=TG) my.ks ## ## Kruskal-Wallis rank sum test ## ## data: len by dose ## Kruskal-Wallis chi-squared = 40.669, df = 2, p-value = 1.475e-09

pairwise.wilcox.test(TG$len, TG$dose, p.adj="holm") ## ## Pairwise comparisons using Wilcoxon rank sum test ## ## data: TG$len and TG$dose ## ## 0.5 1 ## 1 1.4e-05 - ## 2 2.5e-07 0.00018 ## ## P value adjustment method: holm

13 réponses

Bobo B. Kabungu dit :
30 mai 2019 à 8 h 15 min
Très intéressant. À recommander vivement. L’illustration graphique est parlante.
Répondre
KORA dit :
30 mai 2019 à 9 h 24 min
Merci claire pour cet article très riche
Répondre
Louis Aldebert dit :
30 mai 2019 à 12 h 14 min
Je trouve cela particulièrement intéressant, car, personnellement, je ne trouvais une pas grande utilité à comparer des boxplots. Mais avec les p-values indiqués comme ceci ça a une vraie valeur ajoutée !
Merci Claire
Répondre
Paradiso dit :
31 mai 2019 à 11 h 00 min
Bonjour, tout d’abord merci pour l’article.
J’aimerai savoir s’il est possible de spécifier le nombre de comparaison que l’on souhaite faire dans le p.adj. Car spécifier que la correction se fait avec Holms est une chose mais j’aimerai être sur que le nombre de comparaisons est exactement celui que je souhaite.
Bine à vous,
MP
Répondre
1. Claire Della Vedova dit :
  31 mai 2019 à 12 h 03 min
  Bonjour,
  On ne précise pas directement le nombre de comparaisons mais on spécifie les comparaisons individuellement via
  my_comparisons <- list( c("0.5", "1"), c("1", "2"), c("0.5", "2") )et ensuite my_comparaisons passe en argument de stat_compare_means(). Bonne continuation
  Répondre
Lassana dit :
31 mai 2019 à 14 h 14 min
Bonjour,
Encore merci Claire pour le partage.
Cordialement
Répondre
Souvenir dit :
31 mai 2019 à 23 h 13 min
Mais comment faire lorsque le modèle de comparaison est sous tendu par un glm et non un lm
Répondre
1. Claire Della Vedova dit :
  2 juin 2019 à 23 h 02 min
  Et ben, je pense qu’il faut faire les segments horizontaux sous ggplot2 avec geom_segment() et ajouter les p-values ajustées avec annotate(), mais c’est fastidieux. J’essaierai de le montrer dans un prochain article.
  Bonne continuation
  Répondre
Sansan dit :
1 juin 2019 à 22 h 13 min
Merci beaucoup Claire. Cet article m’est très utile. Merci
Répondre
chizere dit :
3 juin 2019 à 13 h 44 min
Bonjour, Je vous remercie pour cet article vraiment intéressant. J’avais une question pour le test de kruskal Wallis, comment est-ce qu’on pourrait procéder quand on se retrouve dans un cas avec un rang, au lieu de plusieurs.
Répondre
1. Claire Della Vedova dit :
  11 juin 2019 à 21 h 43 min
  Bonjour,
  je pense que ce n’est pas possible, vous devez avoir des réplicats.
  Bonne continuation
  Répondre
Orson jean Durand dit :
24 janvier 2020 à 3 h 32 min
Très utiles
Répondre
1. Claire Della Vedova dit :
  26 janvier 2020 à 21 h 56 min
  Merci.
  Répondre

DellaData

Transformez vos données en connaissances

p-values ajustées : affichez les facilement sur un graph

Contexte

Le Principe

P-values ajustées après une ANOVA paramétrique

Réalisation

Définir les comparaisons deux à deux souhaitées

Créer un data frame qui contiendra les pvalues

Ajouter une variable y.position dans ce data frame

Faire le graph

Vérifications

Réalisation de l'ANOVA

Réalisation des comparaisons multiples

P-values ajustées après une ANOVA non paramétrique

Réalisation

Définir les comparaisons deux à deux

Créer un data frame qui contiendra les p-values ajustées

Ajouter une variable y.position dans ce data frame

Faire le graph

Vérification

Réalisation du test de Kruskal Wallis

Réalisation des comparaisons multiples

Remarques

Pour aller plus loin

13 réponses

Laisser un commentaire Annuler la réponse

Bonjour !

vous venez souvent ?

Aide mémoire off'R ;)