Tutoriel : afficher des barres d'erreur sur un graphique

# simulation des poids des 10 000 souris constituant la population avec set.seed(123) # fixer le tirage pseudo aléatoire x <- rnorm(n=10000, mean=250, sd=25) # premier échantillon x1 <- sample(x,30) # moyenne des poids du premier échantillon round(mean(x1),1) [1] 249

# réalisation des 1000 échantillons de 3O souris à la partir de la population x et calcul de la moyenne means <- replicate(1000, mean(sample(x,30))) # calcul de l'écart type des moyennes round(sd(means),1) [1] 4.5

# réalisation des 1000 échantillons de 10 souris à la partir de la population x et calcul de la moyenne means <- replicate(1000, mean(sample(x,10))) # calcul de l'écart type des moyennes round(sd(means),1) [1] 7.7

# Définir les niveaux du facteur Regime <- rep(c("RégimeA", "RégimeB", "RégimeC"), each = 30) # Générer des poids poids perdu set.seed(123) # pour reproductibilité yA <- rnorm(30, mean = 5, sd = 2) yB <- rnorm(30, mean =3, sd = 2) yC<- rnorm(30, mean =7, sd = 2) Poids_perdu <- c(yA, yB, yC) # Création d'u numero d'identification ID =paste("patient", 1:90, sep="_") # Création d'un un data frame avec les variables mydata <- data.frame( ID, Regime, Poids_perdu ) # Afficher les première ligne du data frame head(mydata) ID Regime Poids_perdu 1 patient_1 RégimeA 3.879049 2 patient_2 RégimeA 4.539645 3 patient_3 RégimeA 8.117417 4 patient_4 RégimeA 5.141017 5 patient_5 RégimeA 5.258575 6 patient_6 RégimeA 8.430130

library(Rmisc) mydata.agg <- summarySE(mydata, measurevar = "Poids_perdu", groupvars = "Regime") mydata.agg Regime N Poids_perdu sd se ci 1 RégimeA 30 4.905792 1.962061 0.3582218 0.7326458 2 RégimeB 30 3.356677 1.670256 0.3049456 0.6236838 3 RégimeC 30 7.048841 1.739588 0.3176038 0.6495727

#Charger la bibliothèque ggplot2 library(ggplot2) #Créer un graphique ggplot en spécifiant le data frame et les mappages esthétiques de base ggplot(mydata.agg, aes(x = Regime, y = Poids_perdu, colour = Regime)) + #Ajouter des points représentant les moyennes de poids perdu pour chaque régime geom_point(size = 3) + #Ajouter des barres d'erreur représentant l'écart type autour des moyennes geom_errorbar(aes(ymin = Poids_perdu - sd, ymax = Poids_perdu + sd), width = 0.2) + #Ajouter des annotations de texte pour indiquer le nombre de données (N) geom_text(aes(y = min(Poids_perdu) - 1, label = paste("N =", N)), vjust = -0.5) +

ggplot(mydata.agg, aes(x = Regime, y = Poids_perdu, colour = Regime)) + geom_point(size = 3) + geom_errorbar(aes(ymin = Poids_perdu - se, ymax = Poids_perdu + se), width = 0.2) + geom_text(aes(y = min(Poids_perdu) - 1, label = paste("N =", N)), vjust = -0.5) + theme_minimal() + labs(title = "Poids perdu par régime avec erreur standard", x = "Régime", y = "Poids perdu (kg)") + theme(legend.position = "none")

ggplot(mydata.agg, aes(x = Regime, y = Poids_perdu, colour = Regime)) + geom_point(size = 3) + geom_errorbar(aes(ymin = Poids_perdu - ci, ymax = Poids_perdu + ci), width = 0.2) + geom_text(aes(y = min(Poids_perdu) - 1, label = paste("N =", N)), vjust = -0.5) + theme_minimal() + labs(title = "Poids perdu par régime avec intervalles de confiance", x = "Régime", y = "Poids perdu (kg)") + theme(legend.position = "none")

6 réponses

YEO dit :
18 juin 2024 à 7 h 11 min
Bonjour ! S’il vous plaît puis-je avoir les tables des lois de probabilité tabulées et leur mode d’utilisation bien expliquer ?
Répondre
ZOSSOU FIACRE dit :
18 juin 2024 à 10 h 58 min
Bonjour
Je vous remercie infiniment pour cette publication
Est ce que je peux avoir la version pdf bien détaillé
Merci
Répondre
Rodrigue dit :
18 juin 2024 à 11 h 17 min
Bonjour madame,
Toujours très ému et satisfait quand je lis vos articles. J’en ressors toujours plein le sac. Pas seulement avec des informations mais des connaissances très utiles et applicables dans notre quotidien.
Merci vraiment pour ce que vous faites.
Rodrigue, Québec
Répondre
Kokou Zovodu KOFFI dit :
22 juin 2024 à 12 h 33 min
Merci claire pour ce tuto car elle nous évitera de confondre ces différents paramètres lors de la présentation de résultats sous forme de plot avec les barres d’erreurs.
Répondre
biostat dit :
27 juin 2024 à 16 h 31 min
Bonjour et merci pour cet excellent article qui remet bien les choses à plat.
Une question néanmoins : pourquoi dans l’exemple des régimes, où sd, se et ci sont calculés automatiquement par Rmisc, on n’a pas ci = 1,96*se ?
ci-dessous les valeurs pour le régime A :
se = 0.3582218, ci = 0.7326458, ce qui fait un facteur de 2,05.
Répondre
1. Claire Della Vedova dit :
  27 juin 2024 à 16 h 38 min
  Bonjour Véronique,
  Merci pour cette excellente question.
  Les Ci renvoyés par la fonction sont calculés en employant une distribution de Student. 2,05 devrait correspondre au percentile 97,5% avec n-1 (29) degrès de libertés.
  Vous pouvez vérifier ici https://istats.shinyapps.io/tdist/; dans l’onglet « Find Percentile / Quantile », en choisissant 29 degrees of freedom, « Two -tailed » et Probability =95%.
  Bonne continuation.
  Répondre

Tutoriel : afficher des barres d'erreur sur un graphique

Table des matières

Définitions et calculs des différentes barres d’erreur

L’écart type

L’erreur standard

L’intervalle de confiance

Utilisation des barres d’erreur : Description vs inférence

Représenter des barres d’erreur avec ggplot2

Simulation des données

Calcul des moyennes, sd, erreur standard et intervalles de confiance pour les barres d’erreur

Affichage des barres d’erreur de type sd

Affichage des barres d’erreur de type se

Affichage des barres d’erreur de type intervalle de confiance

Pour aller plus loin

Conclusion

Poursuivez votre lecture

6 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?

Aide mémoire off'R ;)

Tutoriel : afficher des barres d'erreur sur un graphique

Table des matières

Définitions et calculs des différentes barres d’erreur

L’écart type

L’erreur standard

L’intervalle de confiance

Utilisation des barres d’erreur : Description vs inférence

Représenter des barres d’erreur avec ggplot2

Simulation des données

Calcul des moyennes, sd, erreur standard et intervalles de confiance pour les barres d’erreur

Affichage des barres d’erreur de type sd

Affichage des barres d’erreur de type se

Affichage des barres d’erreur de type intervalle de confiance

Pour aller plus loin

Conclusion

Poursuivez votre lecture

6 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?​

Aide mémoire off'R ;)

Vous souhaitez soutenir mon travail ?