Introduction à la régression logistique

11 réponses

Dany OTRON dit :
26 février 2020 à 9 h 27 min
Merci Claire de nous éclairer la lanterne au travers de cet article super bien rédigé.
Répondre
Antoine C dit :
26 février 2020 à 9 h 35 min
Merci pour cet article !
Une petite question : Dans la partie ‘Interprétation de l’OR’, > ‘Lorsque que la variable explicative est catégorielle’ = Est-il possible d’avoir plus de détails et des explications quant à la fréquence de réalisation (rare ou pas rare) ? Pourquoi avons nous le droit d’interpréter dans un cas et pas dans l’autre (convention, règle mathématique, logique ?). Le cutoff de 10% est strict ?
Merci pour vos réponses et votre travail !
Répondre
1. Claire Della Vedova dit :
  4 mars 2020 à 13 h 48 min
  Bonjour,
  D’après ma compréhension, on ne peut pas interpréter l’OR comme un RR car on est plutôt dans une situation d’expérimentation cas-témoins, dans laquelle le nombre de sujets malades est contrôlé, ou choisit . Or les RR sont basés sur un ratio d’incidence, et n’ont de sens que lorsque le nombre de sujets malades n’est pas contrôlé.
  Je pense que lorsque la prévalence de la maladie est inférieure à 10%, les estimations des RR et des OR doivent être relativement similaires et donc que l’estimation du RR par l’OR ne soit pas être trop biaisé.
  Si quelqu’un à une meilleure réponse, n’hésitez pas à laisser un commentaire !
  Répondre
Oubaita Mohamed dit :
26 février 2020 à 12 h 30 min
Merci, c’est très instructif.
Lorsque la variable explicative est catégorisée ( sexe par exemple), on peut dire que la probabilité que la maladie récidive est 4 fois plus grande chez les hommes par rapport aux femmes . Ici la catégorie ^femme^ Est prise comme référence, autrement dit un choix du chercheur.
Merci et bien à vous.
Répondre
Maxime Coutable dit :
26 février 2020 à 13 h 37 min
Du coup ma question étant, comme mesuré l’effect size si on ne peut pas vraiment interpréter les odd ratio? D’autant plus que, de mémoire, les R² ne sont pas toujours considéré comme très pertinent pour ce type de model.
Répondre
YAO Lydiane dit :
27 février 2020 à 9 h 47 min
Merci Claire pour ce articles. J’ai beaucoup appris.
Répondre
Kimmoun dit :
27 février 2020 à 12 h 40 min
Excellent !!!
Répondre
Rodrigue Souop dit :
26 avril 2020 à 12 h 22 min
article très intéressant! j’apprends quelques choses de nouveaux tous les jours que je visite cette plateforme.
Répondre
Elisabeth dit :
3 août 2022 à 14 h 50 min
Très intéressant, merci!
Répondre
Colette dit :
22 février 2023 à 16 h 36 min
Bonjour,
Un grand merci pour ces explications très claires !
J’ai une petite question : dans mon analyse univariée, mon OR est de 1.57 [0.97;2.51]. Lorsque je réalise la régression logistique et que j’ajuste sur d’autres variables il passe à 0.81 [0.45;1.46].
Bien que ce ne soit pas significatif dans les deux, il est assez rare qu’un OR « change de sens » ce qui change son interprétation et son effet. Y a-t-il une explication à cela ?
Merci
Répondre
1. Claire Della Vedova dit :
  22 février 2023 à 17 h 02 min
  Bonjour,
  Le changement de direction de l’odds ratio, également appelé inversion de l’effet, peut se produire lorsque des variables de confusion (c’est-à-dire des variables qui sont associées à la fois à l’exposition et au résultat) sont ignorées dans une régression univariée.
  Dans votre cas, la variable explicative ajoutée dans la régression ajustée peut agir comme une variable de confusion. Si cette variable est fortement associée à l’exposition et au résultat, alors elle peut masquer ou biaiser l’effet de l’exposition lorsqu’elle est ignorée dans la régression univariée.
  Supposons que nous étudions l’association entre l’utilisation de contraceptifs oraux (CO) et le risque de cancer du sein chez les femmes, en utilisant les données d’une grande étude cas-témoins.
  Dans un premier temps, nous ajustons un modèle de régression logistique univariée pour évaluer l’association entre l’utilisation de CO et le risque de cancer du sein. Nous obtenons un odds ratio estimé de 1,43, avec un intervalle de confiance à 95% (IC) de 1,29 à 1,59. Ce résultat suggère une association positive entre l’utilisation de CO et le risque de cancer du sein.
  Ensuite, nous ajustons un modèle de régression logistique multivariée, en ajoutant l’âge et l’indice de masse corporelle (IMC) en tant que variables explicatives. L’âge et l’IMC sont des variables de confusion potentielles, car elles sont associées à la fois à l’utilisation de CO et au risque de cancer du sein. Après ajustement pour l’âge et l’IMC, l’odds ratio pour l’utilisation de CO est maintenant de 0,82 (IC à 95%: 0,74 à 0,90).
  Dans cet exemple, l’odds ratio univarié suggère une association positive entre l’utilisation de CO et le risque de cancer du sein. Cependant, l’ajout de l’âge et de l’IMC dans le modèle multivarié révèle que ces variables sont des facteurs de confusion importants, qui masquent l’effet réel de l’utilisation de CO sur le risque de cancer du sein. Après ajustement pour l’âge et l’IMC, l’odds ratio pour l’utilisation de CO est maintenant inférieur à 1, ce qui suggère une association négative ou protectrice.
  J’espère que cela vous aide.
  Bonne continuation.
  Répondre

	Estimate	Std.Error	z value	Pr(>\|z\|)
(Intercept)	-1.05779	0.2321396	-4.556699	5.2e-06
gendermale	1.27220	0.2711647	4.691614	2.7e-06

	Estimate	Std.Error	z value	Pr(>\|z\|)
(Intercept)	-10.496783	3.4901907	-3.007510	0.002634
age	0.194039	0.0665538	2.915519	0.003551

Introduction à la régression logistique

Prérequis

Introduction

Les principaux éléments de la régression logistique

Modélisation de la probabilité

La fonction logistique

La fonction de lien logit

La structure d'erreur

Les coefficients estimés sont des log odds ratio

Exemple avec une variable explicative catégorielle

Exemple avec une variable explicative numérique

Interprétation de l'OR

Règles générales

Lorsque la variable explicative est catégorielle

Lorsque la variable explicative est numérique continue

Conclusion

11 réponses

Laisser un commentaire Annuler la réponse

Aide mémoire off'R ;)