Introduction à l'analyse de covariance (ANCOVA)

# data : dataset heart_disease du package funModeling, limité aux hommes library(funModeling) mydata <- heart_disease %>% filter(gender=="male") # ajustement du model complet lm_full <- lm(max_heart_rate~age + has_heart_disease + age + has_heart_disease:age, data = mydata)

library(broom) tidy(summary(lm_full)) ## # A tibble: 4 x 5 ## term estimate std.error statistic p.value ## <chr> <dbl> <dbl> <dbl> <dbl> ## 1 (Intercept) 221. 12.6 17.6 1.12e-42 ## 2 age -1.17 0.243 -4.80 3.07e- 6 ## 3 has_heart_diseaseyes -56.2 17.9 -3.15 1.90e- 3 ## 4 age:has_heart_diseaseyes 0.691 0.330 2.09 3.78e- 2

Anova(lm_full) ## Anova Table (Type III tests) ## ## Response: max_heart_rate ## Sum Sq Df F value Pr(>F) ## (Intercept) 123684 1 310.1207 < 2.2e-16 *** ## age 9192 1 23.0466 3.073e-06 *** ## has_heart_disease 3950 1 9.9050 0.001898 ** ## age:has_heart_disease 1743 1 4.3707 0.037813 * ## Residuals 80563 202 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

tidy(summary(lm_same_slope)) ## # A tibble: 3 x 5 ## term estimate std.error statistic p.value ## <chr> <dbl> <dbl> <dbl> <dbl> ## 1 (Intercept) 202. 8.73 23.2 6.60e-59 ## 2 age -0.792 0.166 -4.77 3.46e- 6 ## 3 has_heart_diseaseyes -19.4 2.94 -6.58 3.83e-1

# ajustement du modèle lm_one_line <- lm(max_heart_rate~age,data=mydata) # affichage de l'estimation des paramètres ## # A tibble: 2 × 5 ## term estimate std.error statistic p.value ## <chr> <dbl> <dbl> <dbl> <dbl> ## 1 (Intercept) 208. 9.54 21.8 2.89e-55 ## 2 age -1.10 0.175 -6.31 1.71e- 9

# comparaison des ajustements anova(lm_same_slope, lm_one_line) ## Analysis of Variance Table ## ## Model 1: max_heart_rate ~ age + has_heart_disease ## Model 2: max_heart_rate ~ has_heart_disease ## Res.Df RSS Df Sum of Sq F Pr(>F) ## 1 203 82306 ## 2 204 91545 -1 -9239.2 22.788 3.457e-06 *** ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

# ajustement du model complet lm_full <- lm(max_heart_rate~age + has_heart_disease + age + has_heart_disease:age, data = mydata) Anova(lm_full) ## Anova Table (Type III tests) ## ## Response: max_heart_rate ## Sum Sq Df F value Pr(>F) ## (Intercept) 123684 1 310.1207 < 2.2e-16 *** ## age 9192 1 23.0466 3.073e-06 *** ## has_heart_disease 3950 1 9.9050 0.001898 ** ## age:has_heart_disease 1743 1 4.3707 0.037813 * ## Residuals 80563 202 ## --- ## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

library(emmeans) emmeans(lm_full, specs=pairwise~has_heart_disease) ## $emmeans ## has_heart_disease emmean SE df lower.CL upper.CL ## no 159 2.19 202 154 163 ## yes 139 1.94 202 136 143 ## ## Confidence level used: 0.95 ## ## $contrasts ## contrast estimate SE df t.ratio p.value ## no - yes 19.1 2.92 202 6.518 <.0001

emmip(lm_full, ~ has_heart_disease, CIs=TRUE, linearg=NULL) + geom_jitter(aes(x = has_heart_disease, y = max_heart_rate, colour = has_heart_disease), data = mydata, pch = 4, width = 0.1)+ labs(y = "Estimated marginal mean (max_heart_rate)", y = "Heart_disease")+ theme_bw()+ theme(legend.position = "none")

14 réponses

BAGUMA BALAGIZI Gabriel dit :
14 janvier 2022 à 9 h 13 min
Merci pour ce travail,
Est-il possible de l’avoir en copie PDF?
Merci
Répondre
1. Claire Della Vedova dit :
  15 janvier 2022 à 16 h 21 min
  Bonjour Gabriel,
  non il n’est pas possible d’avoir l’article en pdf, il est uniquement consultables sur le site.
  Bonne continuation
  Répondre
  1. Omar MARIGO dit :
    23 janvier 2023 à 14 h 35 min
    Bonjour Claire,
    Avez vous un code qui permet de tracer un graphe à trois axes sur r
    Merci
    Omar
    Répondre
    1. Claire Della Vedova dit :
      1 février 2023 à 12 h 00 min
      Bonjour Omar,
      je ne vois pas bien de quoi vous parlez, est-ce que vous pouvez, s’il vous plait, compléter votre message avec un lien vers une page internet illustrant votre demande ?
      Merci
      Répondre
Driss dit :
14 janvier 2022 à 13 h 18 min
Excellente
Répondre
Djeban dit :
14 janvier 2022 à 15 h 28 min
Bonjour madame je suis très ravie de ce travail je voulais avoir des codes sur r
Répondre
ZELANE dit :
21 janvier 2022 à 19 h 41 min
Bonsoir madame merci beaucoup pour le travail, je suis ravi de l’avoir reçu. S’il vous plaît est-ce possible d’avoir le pdf
Répondre
1. Claire Della Vedova dit :
  22 janvier 2022 à 9 h 15 min
  Bonjour Odilon,
  aucune version pdf n’est disponible, les articles sont seulement consultables sur le site.
  Bonne continuation
  Claire Della vedova
  Répondre
Péguy kilonga dit :
24 janvier 2022 à 17 h 30 min
Excellent article. Nous espérons connaître encore plus avec vous. 🙏🙏
Répondre
Philippe MICHEL dit :
6 mars 2022 à 0 h 01 min
Dans l’écriture du modèle : lm_full <- lm(…) , la variable "age" apparaît deux fois. C"est volontaire ?
Répondre
Flumian dit :
19 octobre 2022 à 12 h 32 min
Bonjour,
Vous écrivez “L’ajustement du modèle avec une droite de régression linéaire unique se réalise en retirant la variable qualitative du modèle” mais dans le modèle qui suit vous mettez la fréquence cardiaque max et fonction du groupe (pathologie oui ou non) et non pas en fonction de l’age. Donc vous retirez finalement la variable quantitative.
Quelle est donc la bonne formule/formulation ?
Merci,
Clara
Répondre
1. Claire Della Vedova dit :
  2 novembre 2022 à 7 h 40 min
  Bonjour,
  Vous avez raison, c’est une coquille !
  Voici la correction
  lm_one_line <- lm(max_heart_rate~age,data=mydata) tidy(summary(lm_one_line )) ## # A tibble: 2 × 5 ## term estimate std.error statistic p.value ## ## 1 (Intercept) 208. 9.54 21.8 2.89e-55 ## 2 age -1.10 0.175 -6.31 1.71e- 9
  Merci.
  Répondre
Monji dit :
16 mars 2023 à 8 h 38 min
Bonjour,
Merci pour le partage de ce travail.
Dans le code vous utilisez le modele .._full1, moi j’utilise le modele .._full et j’obtiens les memes résultats. S’agit-il d’une erreur?
Par ailleurs vous aviez promis de communiquer un travail plus détaillé d’ANCOVA (avec la verification des hypothèses notamment)
On espere le voir bientôt
Répondre
1. Claire Della Vedova dit :
  17 mars 2023 à 7 h 43 min
  Bonjour,
  oui le full1 était une coquille, c’est full tout court.
  Merci pour la piqure de rappel concernant le tuto, je le fait remonter dans ma litse, mais le temps me manque….
  Bonen continuation
  Répondre

DellaData

Transformez vos données en connaissances

Introduction à l'analyse de covariance (ANCOVA)

Table des matières

Introduction

L’ ANCOVA comme une régression par sous-groupe

L'ANCOVA comme une comparaison de moyennes ajustées

Conclusion

Poursuivez votre lecture

Commentaires

14 réponses

Laisser un commentaire Annuler la réponse

Bonjour !

vous venez souvent ?

Aide mémoire off'R ;)