Calcul du nombre de sujets nécessaires - compléments

#Charger le package tidyverse. library(tidyverse) # Créer une séquence de valeurs de 0.1 à 0.6 par pas de 0.1. Ces valeurs représentent l'effect size f = seq(0.1, 0.4, by=0.1) # Créer une séquence de valeurs de 3 à 6. Ces valeurs représentent la variable le nombre de groupes. k= c(3:5) # Créer une séquence de valeurs de 0.7 à 0.95 par pas de 0.05. Ces valeurs représentent la puissance du test. power = seq(0.7, 0.95, by=0.05) # Utiliser la fonction expand_grid du package tidyverse pour créer un data.frame avec toutes les combinaisons possibles de 'f', 'k', et 'power'. mydf <- expand_grid(f=f, k=k, power=power) # Afficher les 20 premières lignes du data.frame créé. # %>% est l'opérateur de pipe qui prend le résultat de la gauche (mydf) et l'utilise comme premier argument de la fonction suivante (slice_head). # slice_head() est une fonction de dplyr qui sélectionne les premières lignes d'un data.frame. mydf %>% slice_head(n=20) # A tibble: 20 × 3 f k power <dbl> <int> <dbl> 1 0.1 3 0.7 2 0.1 3 0.75 3 0.1 3 0.8 4 0.1 3 0.85 5 0.1 3 0.9 6 0.1 3 0.95 7 0.1 4 0.7 8 0.1 4 0.75 9 0.1 4 0.8 10 0.1 4 0.85 11 0.1 4 0.9 12 0.1 4 0.95 13 0.1 5 0.7 14 0.1 5 0.75 15 0.1 5 0.8 16 0.1 5 0.85 17 0.1 5 0.9 18 0.1 5 0.95 19 0.2 3 0.7 20 0.2 3 0.75 # Application de la fonction pwr.anova.test à chaque ligne de mydf afin de calculer le nombre de sujets nécessaires pour chaque combinaison library(pwr) mydf <- mydf %>% rowwise() %>% mutate(n = pwr.anova.test(k = k, f = f, sig.level = 0.05, power = power)$n) # Affichage des 10 premières lignes de mydf mydf %>% slice_head(n=10) # A tibble: 72 × 4 # Rowwise: f k power n <dbl> <int> <dbl> <dbl> 1 0.1 3 0.7 258. 2 0.1 3 0.75 287. 3 0.1 3 0.8 322. 4 0.1 3 0.85 365. 5 0.1 3 0.9 423. 6 0.1 3 0.95 516. 7 0.1 4 0.7 221. 8 0.1 4 0.75 245. 9 0.1 4 0.8 274. 10 0.1 4 0.85 309. # visualisation library(see) # pour utiliser la fonction scale_colour_material() et utiliser de + jolies couleurs ggplot(mydf, aes(x=n, y=power, colour=as.factor(k)))+ geom_point()+ facet_wrap(~paste0("f=", f), scales="free_x")+ geom_line()+ scale_colour_material()

4 réponses

Jean Claude Roy dit :
26 mai 2023 à 16 h 16 min
Bonjour Madame
J’utilise ce chemin pour vous contacter.
Tout d’abord j’aime bien lire vos articles parfois bien techniques mais toujours d’appoint…me procurant de belles découvertes découlant du travail d’une passionnée de toute évidence.
Je suis retraité, un autodidacte en dilettante dans l’analyse de données, le plus souvent descriptives, puisant dans l’information statistique publique de l’administration gouvernementale et municipale.
Je fais alors les liens avec tous les tests statistiques pour m’approprier la théorie sous jacente et les calculs mathématiques les appuyant.
J’utilise beaucoup le logiciel R et Rcmdr et Factominer et les fonctions statistiques d’Excel…. et beaucoup d lectures spécialisées.
Jai découvert récemment le logiciel Jamovi que j’aime bien par ailleurs et permettant la visualisation rapide en modifiant plus facilement les requêtes.
Que pensez vous de ce logiciel …
Salutations du Québec…et continuez votre beau travail.
Répondre
Gérard dit :
28 mai 2023 à 6 h 16 min
Merci Claire
Cela me sera utile
Cordialement
Répondre
Xav dit :
29 mai 2023 à 9 h 16 min
Bonjour Claire,
Merci pour vos posts que je trouve clairs, agréables à lire et que je conseille. Concernant le calcul du nombre de sujets, j’aimerais ajouter quelques commentaires.
Je dois d’abord préciser que mon domaine d’activité actuel concerne la recherche animale où la réduction du nombre d’animaux est cruciale.
Pour les ANOVAs, beaucoup de chercheurs font le calcul en ne considérant que des ANOVAs à une voie, alors que des ANOVAs à plusieurs voies avec interactions seraient plus justifiées. Par exemple, avec un plan 2×2, un f à 0.4 (correspondant grossièrement à un d de Cohen à 0.8), une puissance à 80% et un risque alpha à 0.05, le traitement par une ANOVA dite omnibus [une voie, 4 groupes] nécessite 76 sujets, alors que si on prend en compte l’interaction dans une ANOVA à deux voies, il suffit de 52 sujets. L’économie est de 32 %. J’anticipe peut-être sur votre prochain post.
Quelques précisions pour vos lecteurs. Dès qu’on multiplie les voies, il faut faire attention aux degrés de liberté et avec R au type de carrés (sujet que vous avez évoqué à propos des ANOVAs, je crois). Pour GPower, le site de Karl Wuensch est excellent https://core.ecu.edu/wuenschk/StatsLessons.htm Chercher dans la page Power Analysis, en particulier le calcul de puissance pour les ANOVAs (calcul du nombre de degrés de liberté et type de carrés). Il complète bien le tuto de GPower.
Pour les analyses de survie le logiciel PS Power and Sample Size de l’université Vanderbilt (https://biostat.app.vumc.org/wiki/Main/PowerSampleSize) est simple. Choisir l’onglet survival.
Concernant GPower, je ne comprends pas bien ce que signifie old-school. Dans ce cas, que dire de R que j’adore, mais qui me fait parfois penser à mes débuts en Fortran 80 colonnes, ou au C Kernighan et Ritchie ! Ce qui compte, c’est l’absence de bugs, ce qui n’est pas toujours le cas des jolies interfaces « modernes ».
Continuez, vos qualités de pédagogue sont précieuses.
Xav
PS. Avez-vous l’intention de faire un ou deux tutos sur les plans d’expérience ? R doit bien avoir des procédures dédiées.
Répondre
1. Claire Della Vedova dit :
  30 mai 2023 à 6 h 40 min
  Bonjour Xavier,
  Merci beaucoup pour ce complément du complément, en particulier pour les deux liens précieux !
  Répondre

Calcul du nombre de sujets nécessaires - compléments

Table des matières

Les logiciels et applications gratuits pour calculer la le nombre de sujets nécessaires (NSN)

Le logiciel GPower

L’application biostaTGV

Les calculateurs en ligne

Les packages R pour le calcul du nombre de sujets nécessaires

Les livres pour le calcul du nombre de sujets nécessaires

Prendre en compte les perdus de vue (biais d’attrition) dans le calcul du nombre de sujets nécessaires

Évaluer l'impact de la variation de plusieurs paramètres sur le calcul du nombre de sujets nécessaires

Conclusion

4 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?

Aide mémoire off'R ;)

Calcul du nombre de sujets nécessaires - compléments

Table des matières

Les logiciels et applications gratuits pour calculer la le nombre de sujets nécessaires (NSN)

Le logiciel GPower

L’application biostaTGV

Les calculateurs en ligne

Les packages R pour le calcul du nombre de sujets nécessaires

Les livres pour le calcul du nombre de sujets nécessaires

Prendre en compte les perdus de vue (biais d’attrition) dans le calcul du nombre de sujets nécessaires

Évaluer l'impact de la variation de plusieurs paramètres sur le calcul du nombre de sujets nécessaires

Conclusion

4 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?​

Aide mémoire off'R ;)

Vous souhaitez soutenir mon travail ?