Réalisez de multiples tests en quelques lignes avec une fonction map()

library(ISwR) head(cystfibr) ## age sex height weight bmp fev1 rv frc tlc pemax ## 1 7 0 109 13.1 68 32 258 183 137 95 ## 2 7 1 112 12.9 65 19 449 245 134 85 ## 3 8 0 124 14.1 64 22 441 268 147 100 ## 4 8 1 125 16.2 67 41 234 146 124 85 ## 5 8 0 127 21.5 93 52 202 131 104 95 ## 6 9 0 130 17.5 68 44 308 155 118 80

wilcox.test(pemax~sex, data=cystfibr) ## ## Wilcoxon rank sum test with continuity correction ## ## data: pemax by sex ## W = 100, p-value = 0.2158 ## alternative hypothesis: true location shift is not equal to 0

library(tidyverse) library(purrr) pvalues <- cystfibr%>% select(-sex) %>% map(~wilcox.test(.x~sex, data=cystfibr)) %>% map_dbl("p.value") pvalues <- round(pvalues,3) # arrondi à 3 chiffres après la virgule

pval_df <- data_frame(var,pvalues) pval_df ## # A tibble: 9 x 2 ## var pvalues ## ## 1 age 0.441 ## 2 height 0.261 ## 3 weight 0.344 ## 4 bmp 0.493 ## 5 fev1 0.009 ## 6 rv 0.218 ## 7 frc 0.476 ## 8 tlc 0.805 ## 9 pemax 0.216

pval_df$pval_ajust <- p.adjust(pval_df$pvalues, method="BH") pval_df ## # A tibble: 9 x 3 ## var pvalues pval_ajust ## ## 1 age 0.441 0.555 ## 2 height 0.261 0.555 ## 3 weight 0.344 0.555 ## 4 bmp 0.493 0.555 ## 5 fev1 0.009 0.0810 ## 6 rv 0.218 0.555 ## 7 frc 0.476 0.555 ## 8 tlc 0.805 0.805 ## 9 pemax 0.216 0.555

cystfibr_long <- cystfibr %>% gather(var, value, -sex) head(cystfibr_long) ## sex var value ## 1 0 age 7 ## 2 1 age 7 ## 3 0 age 8 ## 4 1 age 8 ## 5 0 age 8 ## 6 0 age 9

cystfibr_nested <- cystfibr_long%>% group_by(var) %>% nest() head(cystfibr_nested ) ## # A tibble: 6 x 2 ## var data ## ## 1 age ## 2 height ## 3 weight ## 4 bmp ## 5 fev1 ## 6 rv

wt <- wilcox.test(pemax~sex, data=cystfibr) wt ## ## Wilcoxon rank sum test with continuity correction ## ## data: pemax by sex ## W = 100, p-value = 0.2158 ## alternative hypothesis: true location shift is not equal to 0 broom::tidy(wt) ## # A tibble: 1 x 4 ## statistic p.value method alternative ## ## 1 100 0.216 Wilcoxon rank sum test with continuity cor~ two.sided

cystfibr_nested ## # A tibble: 9 x 5 ## var statistic p.value method alternative ## ## 1 age 91.5 0.441 Wilcoxon rank sum test with continu~ two.sided ## 2 height 98 0.261 Wilcoxon rank sum test with continu~ two.sided ## 3 weight 95 0.344 Wilcoxon rank sum test two.sided ## 4 bmp 90 0.493 Wilcoxon rank sum test with continu~ two.sided ## 5 fev1 126. 0.00856 Wilcoxon rank sum test with continu~ two.sided ## 6 rv 54 0.218 Wilcoxon rank sum test with continu~ two.sided ## 7 frc 63.5 0.476 Wilcoxon rank sum test with continu~ two.sided ## 8 tlc 72 0.805 Wilcoxon rank sum test with continu~ two.sided ## 9 pemax 100 0.216 Wilcoxon rank sum test with continu~ two.sided

wilcox_res <- cystfibr %>% gather(var, value, -sex) %>% group_by(var) %>% nest() %>% mutate( wilcox_test=map(data,wilcox_test), tidy=map(wilcox_test, broom::tidy)) %>% unnest(tidy,.drop=TRUE)

wilcox_res$pval_ajust <- p.adjust(wilcox_res$p.value, method="BH") wilcox_res ## # A tibble: 9 x 6 ## var statistic p.value method alternative pval_ajust ## ## 1 age 91.5 0.441 Wilcoxon rank sum test w~ two.sided 0.554 ## 2 height 98 0.261 Wilcoxon rank sum test w~ two.sided 0.554 ## 3 weight 95 0.344 Wilcoxon rank sum test two.sided 0.554 ## 4 bmp 90 0.493 Wilcoxon rank sum test w~ two.sided 0.554 ## 5 fev1 126. 0.00856 Wilcoxon rank sum test w~ two.sided 0.0770 ## 6 rv 54 0.218 Wilcoxon rank sum test w~ two.sided 0.554 ## 7 frc 63.5 0.476 Wilcoxon rank sum test w~ two.sided 0.554 ## 8 tlc 72 0.805 Wilcoxon rank sum test w~ two.sided 0.805 ## 9 pemax 100 0.216 Wilcoxon rank sum test w~ two.sided 0.554

wilcox_res_sig <- wilcox_res %>% select(var, p.value, pval_ajust) %>% # on ne garde que ces 3 var filter(pval_ajust<0.1) wilcox_res_sig ## # A tibble: 1 x 3 ## var p.value pval_ajust ## ## 1 fev1 0.00856 0.0770

mod_lm <- function(df){ lm(pemax~value, data=df) } rls_res <- cystfibr %>% gather(var, value, -sex,-pemax) %>% group_by(var) %>% nest() %>% mutate( mod=map(data, mod_lm), glance=map(mod, broom::glance)) %>% unnest(glance,.drop=TRUE) %>% select(var, r.squared, p.value)%>% select(var,p.value) %>% mutate(pval_ajust=p.adjust(p.value, method="BH")) rls_res ## # A tibble: 8 x 3 ## var p.value pval_ajust ## ## 1 age 0.00111 0.00413 ## 2 height 0.00155 0.00413 ## 3 weight 0.000646 0.00413 ## 4 bmp 0.270 0.308 ## 5 fev1 0.0228 0.0457 ## 6 rv 0.124 0.166 ## 7 frc 0.0380 0.0608 ## 8 tlc 0.385 0.385

3 réponses

Dany OTRON dit :
19 juillet 2019 à 20 h 04 min
Thanks you Claire ! Very helpfull
Répondre
pauline dit :
2 février 2022 à 5 h 48 min
Bonjour,
J’ai un problème avec la commande suivante :
wilcox.test(pemax~sex, data=cystfibr)
Voilà ce que j’obtiens :
Wilcoxon rank sum test with continuity correction
data: pemax by sex
W = 100, p-value = 0.2158
alternative hypothesis: true location shift is not equal to 0
Warning message:
In wilcox.test.default(x = c(95L, 100L, 95L, 80L, 70L, 110L, 100L, :
impossible de calculer la p-value exacte avec des ex-aequos
et lorsque je charge le package tidyverse :
library(tidyverse)
— Attaching packages ———————————————————— tidyverse 1.3.1 —
v ggplot2 3.3.3 v purrr 0.3.4
v tibble 3.1.1 v dplyr 1.0.6
v tidyr 1.1.3 v stringr 1.4.0
v readr 1.4.0 v forcats 0.5.1
— Conflicts ————————————————————— tidyverse_conflicts() —
x dplyr::filter() masks stats::filter()
x dplyr::lag() masks stats::lag()
Warning messages:
1: le package ‘tidyverse’ a été compilé avec la version R 3.6.3
2: le package ‘ggplot2’ a été compilé avec la version R 3.6.3
3: le package ‘tibble’ a été compilé avec la version R 3.6.3
4: le package ‘tidyr’ a été compilé avec la version R 3.6.3
5: le package ‘readr’ a été compilé avec la version R 3.6.3
6: le package ‘purrr’ a été compilé avec la version R 3.6.3
7: le package ‘dplyr’ a été compilé avec la version R 3.6.3
8: le package ‘forcats’ a été compilé avec la version R 3.6.3
Pouvez-vous m’aider ?
Par avance merci.
Répondre
1. Claire Della Vedova dit :
  2 février 2022 à 8 h 37 min
  Bonjour,
  Le message sur le test de wilcoxon est seulement un warning vous disant que puisque vos données comportent des ex aequo la p-value est obtenue par une approximation (approximation selon une distribution normale, je pense) alors que sans ex aequo le test emploi une méthode exacte. C’est simplement une information, le test et les résultats restent valides.
  Et pour tidyverse, il s’agit aussi d’informations qui vous disent que c’est une vieille version de R qui est employé. Je pense que cela fonctionne, mais je vous recommande de mettre R à jour. Vous trouverez un article sur le blog, si vous faites une recherche par mot clé dans le bandeau de recherche, au-dessus des articles.
  Bonne continuation
  Répondre

Réalisez de multiples tests en quelques lignes avec une fonction map()

Prérequis

Le jeu de données utilisé

Le test de Wilcoxon

Réalisez de multiples tests de façon automatisée

Multiples tests : approche simple avec la fonction map

Multiples tests : approche plus complexe avec une fonction map

Ajuster de multiples modèles

Conclusion

3 réponses

Laisser un commentaire Annuler la réponse

Aide mémoire off'R ;)