Fluctuations d’échantillonnage et biais

options(digits=5) x1 <- rnorm(50,129,2.5) x1 ## [1] 127.43 129.46 126.91 132.99 129.82 126.95 130.22 130.85 130.44 128.24 ## [11] 132.78 129.97 127.45 123.46 131.81 128.89 128.96 131.36 131.05 130.48 ## [21] 131.30 130.96 129.19 124.03 130.55 128.86 128.61 125.32 127.80 130.04 ## [31] 132.40 128.74 129.97 128.87 125.56 127.96 128.01 128.85 131.75 130.91 ## [41] 128.59 128.37 130.74 130.39 127.28 127.23 129.91 130.92 128.72 131.20

x2 <- rnorm(50,129,2.5) x2 ## [1] 126.76 129.46 132.97 126.17 128.80 129.33 130.77 128.40 133.96 128.65 ## [11] 130.04 131.45 128.02 126.40 133.46 123.22 131.20 129.09 131.53 130.08 ## [21] 134.23 126.00 132.97 133.89 129.01 122.87 130.19 127.51 130.98 129.72 ## [31] 130.85 129.80 131.69 128.29 127.06 127.51 124.69 126.74 127.60 128.38 ## [41] 128.04 124.10 126.90 133.76 130.56 133.98 128.24 128.77 128.54 126.00

m_hat_vec <- vector(length=10) for ( i in 1 : 10) { x <-rnorm(50, 129,2.5) m_hat_vec[i] <- mean(x) } m_hat_vec ## [1] 128.67 129.45 128.70 129.47 129.25 129.68 129.89 128.50 128.77 129.61

m_hat_df <- data.frame(m_hat_vec ) library(ggplot2) ggplot(m_hat_df, aes(y=m_hat_vec,x=1 ))+ geom_point(size=3)+ coord_flip()+ scale_y_continuous(limits=c(127,131))+ scale_x_continuous(limits=c(0.975, 1.025), breaks=NULL)+ xlab("")+ geom_point(x=1, y=129, size=5, colour="red")+ theme_bw()

my_m_hat <- mean(x1) my_m_hat ## [1] 129.2511 my_s_hat <- sd(x1) my_s_hat ## [1] 2.078485 n <- 50 binf <- my_m_hat -1.96*my_s_hat/sqrt(50) binf ## [1] 128.675 bsup <- my_m_hat +1.96*my_s_hat/sqrt(50) bsup ## [1] 129.8272

devtools::install_github('jtleek/slipper') library(slipper) taille_df <- data_frame(taille=x1) taille_df %>% slipper_ci(mean(taille),B=100, lower=0.025, upper=0.975) ## ci_low ci_high ## 1 128.6075 129.8037

m_hat_vec3 <- vector(length=10) for ( i in 1 : 10) { x2 <-rnorm(50, 132,2.5) m_hat_vec3[i] <- mean(x2) } m_hat_vec3 ## [1] 132.0925 131.4560 132.2760 132.0532 132.3859 131.2164 131.6312 ## [8] 131.7636 131.8795 131.8276 m_hat_df <- data.frame( m_hat_vec3)

library(ggplot2) ggplot(m_hat_df, aes(y=m_hat_vec3,x=1))+ geom_point(size=3, show.legend = FALSE, colour="blue")+ coord_flip()+ scale_y_continuous(limits=c(127,137))+ scale_x_continuous(limits=c(0.975, 1.025), breaks=NULL)+ geom_point(x=1, y=129, size=5, colour="red", show.legend = FALSE)+ scale_colour_manual(values=c("black", "blue"))+ theme_bw()

6 réponses

abdelli dit :
18 octobre 2019 à 7 h 25 min
merci bon article
Répondre
Dujourdy dit :
18 octobre 2019 à 8 h 42 min
Bonjour,
A propos de la formulation de l’intervalle de confiance à 95%. Je dirais plutôt que 95 intervalles sur 100 contiendront la vraie valeur de la moyenne (fixé et inconnue) et 5 ne la contiendront pas.
Cordialement.
LD
Répondre
1. Claire Della Vedova dit :
  22 octobre 2019 à 0 h 35 min
  Bonjour,
  Vous avez raison, j’ai corrigé.
  Merci
  Répondre
Nacanabo dit :
18 octobre 2019 à 11 h 57 min
Bonjour,
Article très intéressant. Merci pour le temps que vous consacré toujours à nous fournir des articles de très haute qualité.
Cordialement!
Répondre
Ibtissam dit :
18 octobre 2019 à 13 h 00 min
merci bcp pour vos articles très intéressants
Répondre
ABDOUL-OIKIL SAID RIDHOINE dit :
31 octobre 2019 à 6 h 54 min
Merci beaucoup.
Répondre

Fluctuations d'échantillonnage et biais

Fluctuations d'échantillonnage et erreurs aléatoires

Intervalle de confiance

Biais et erreurs systématiques

Les biais en épidémiologie

Continuez votre lecture

6 réponses

Laisser un commentaire Annuler la réponse

Aide mémoire off'R ;)