Explorer les variables liées à la réponse d’intéret avec un correlation funnel plot

library(tidyverse) library(correlationfunnel) # simulation de données quantitatives set.seed(1) age <- round(runif(n=30,min=0, max=50),0) df1 <- tibble(age) # affichage des données df1 # A tibble: 30 × 1 age <dbl> 1 13 2 19 3 29 4 45 5 10 6 45 7 47 8 33 9 31 10 3 # ℹ 20 more rows # Binarisation de la variable age df1_bin <- df1 %>% binarize() # affichage des données df1_bin # A tibble: 30 × 4 `age__-Inf_13` age__13_22 age__22_37.5 age__37.5_Inf <dbl> <dbl> <dbl> <dbl> 1 1 0 0 0 2 0 1 0 0 3 0 0 1 0 4 0 0 0 1 5 1 0 0 0 6 0 0 0 1 7 0 0 0 1 8 0 0 1 0 9 0 0 1 0 10 1 0 0 0 # ℹ 20 more rows

# creation d'une variable group group <- rep(c("G1","G2", "G3"), times=10) df2 <- tibble(group) df2 # A tibble: 30 × 1 group <chr> 1 G1 2 G2 3 G3 4 G1 5 G2 6 G3 7 G1 8 G2 9 G3 10 G1 # ℹ 20 more rows # binarisation de la variable group df2_bin <- df2 %>% binarize() df2_bin # A tibble: 30 × 3 group__G1 group__G2 group__G3 <dbl> <dbl> <dbl> 1 1 0 0 2 0 1 0 3 0 0 1 4 1 0 0 5 0 1 0 6 0 0 1 7 1 0 0 8 0 1 0 9 0 0 1 10 1 0 0 # ℹ 20 more rows

library(dplyr) library(funModeling) # creation du jeu de données HD <- heart_disease %>% select(age, gender, chest_pain, max_heart_rate, has_heart_disease) # visualisation des 6 premières lignes head(HD) age gender chest_pain max_heart_rate has_heart_disease 1 63 male 1 150 no 2 67 male 4 108 yes 3 67 male 4 129 yes 4 37 male 3 187 no 5 41 female 2 172 no 6 56 male 2 178 no

HD_binarized <- HD %>% binarize(n_bins = 4, thresh_infreq = 0.01) # visualisation des 6 premières lignes head(HD_binarized) # A tibble: 6 × 16 `age__-Inf_48` age__48_56 age__56_61 age__61_Inf gender__female gender__male <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> 1 0 0 0 1 0 1 2 0 0 0 1 0 1 3 0 0 0 1 0 1 4 1 0 0 0 0 1 5 1 0 0 0 1 0 6 0 1 0 0 0 1 # ℹ 10 more variables: chest_pain__1 <dbl>, chest_pain__2 <dbl>, # chest_pain__3 <dbl>, chest_pain__4 <dbl>, # `max_heart_rate__-Inf_133.5` <dbl>, max_heart_rate__133.5_153 <dbl>, # max_heart_rate__153_166 <dbl>, max_heart_rate__166_Inf <dbl>, # has_heart_disease__no <dbl>, has_heart_disease__yes <dbl>

HD_binarized %>% correlate(has_heart_disease__yes ) # A tibble: 16 × 3 feature bin correlation <fct> <chr> <dbl> 1 has_heart_disease no -1 2 has_heart_disease yes 1 3 chest_pain 4 0.516 4 max_heart_rate -Inf_133.5 0.323 5 chest_pain 3 -0.315 6 max_heart_rate 166_Inf -0.308 7 gender female -0.277 8 gender male 0.277 9 chest_pain 2 -0.249 10 age 56_61 0.234 11 age -Inf_48 -0.203 12 max_heart_rate 153_166 -0.0983 13 chest_pain 1 -0.0888 14 age 48_56 -0.0856 15 max_heart_rate 133.5_153 0.0790 16 age 61_Inf 0.0693

8 réponses

Kaboré Adama dit :
15 juin 2023 à 9 h 14 min
Waaaawooou très intéressant cet article ! Merci
Répondre
Oury SANOU dit :
15 juin 2023 à 12 h 02 min
Bonjours , c’est un tres bon outils aussi pour moi surtout dans les modelisation predictives . je pense qu’avec l’usage on reviendra avec d’autres commentaires ou recommandations .
Merci pour le partage .
Répondre
Jose dit :
15 juin 2023 à 18 h 48 min
Merci pour le partage, c’est très apprécié
Répondre
Sylvain dit :
18 juin 2023 à 11 h 09 min
Intéressant. Ça pourrait effectivement me servir pour certaines enquêtes que mes collègues font.
Merci ! 🙂
Répondre
Cecile dit :
21 juin 2023 à 18 h 26 min
Je trouve que c’est un outil très pratique pour dégager rapidement des corrélations, beaucoup plus facile à utiliser que l’analyse multifactorielle classique avec FactoMiner par exmeple. C’est moins puissant certes, mais beaucoup plus rapide pour avoir un aperçu et ensuite « creuser » un peu plus si besoin est aevc Factominer. Merci Claire !!
Répondre
John dit :
4 juillet 2023 à 5 h 50 min
Très jolie et intéressant ! Vraiment je suis fière de cette lessons.
Répondre
FADE Mariem dit :
5 juillet 2023 à 13 h 30 min
outil très pertinent surtout pour la modélisation
Répondre
OKOU KOUAME ALBERT dit :
26 septembre 2023 à 0 h 26 min
Trop forte Claire. Merci. Je voudrais savoir si je peux utiliser le logiciel R dans l’analyse des marchés en Trading pour prévoir les hausses et les baisse des capitaux.
Répondre

Correlation funnel plot : l'outil idéal pour explorer les relations avec votre variable d'intérêt principal

Table des matières

Principe du correlation funnel plot

Informations complémentaires

Binarisation des variables quantitatives

Binarisation des variables qualitatives

Calcul des corrélations

Mise en application du correlation funnel plot

Installation

Dataset

Conversion des variables quantitatives et qualitatives en variables binaires

Corrélations avec la variables réponse

Visualisation par Correlation Funnel

Recommandations de l’auteur du package

Avant la binarisation

Pendant la binarisation

Avant l’étape de corrélation

Après avoir tracé l’entonnoir de corrélation

Les avantages de la binarisation

Conclusion

8 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?

Continuez votre lecture

Aide mémoire off'R ;)

Correlation funnel plot : l'outil idéal pour explorer les relations avec votre variable d'intérêt principal

Table des matières

Principe du correlation funnel plot

Informations complémentaires

Binarisation des variables quantitatives

Binarisation des variables qualitatives

Calcul des corrélations

Mise en application du correlation funnel plot

Installation

Dataset

Conversion des variables quantitatives et qualitatives en variables binaires

Corrélations avec la variables réponse

Visualisation par Correlation Funnel

Recommandations de l’auteur du package

Avant la binarisation

Pendant la binarisation

Avant l’étape de corrélation

Après avoir tracé l’entonnoir de corrélation

Les avantages de la binarisation

Conclusion

8 réponses

Laisser un commentaire Annuler la réponse

Vous souhaitez vous former à R, ou aux statistiques ?

Vous avez besoin d'un assitance pour analyser vos données ?

Vous souhaitez soutenir mon travail ?​

Continuez votre lecture

Aide mémoire off'R ;)

Vous souhaitez soutenir mon travail ?