News et découvertes d'octobre 2021

TG <- ToothGrowth tapply(TG$len, list(TG$supp, TG$dose), mean) ## 0.5 1 2 ## OJ 13.23 22.70 26.06 ## VC 7.98 16.77 26.14 tapply(TG$len, list(TG$supp, TG$dose), sd) ## 0.5 1 2 ## OJ 4.459709 3.910953 2.655058 ## VC 2.746634 2.515309 4.797731

TG_simul <- read.csv("data/TG-simulated.csv") tapply(TG_simul$y, list(TG_simul$supp, TG_simul$dose), mean) ## 0.5 1 2 ## OJ 13.2299 22.7002 26.0600 ## VC 7.9799 16.7701 26.1401 tapply(TG_simul$y, list(TG_simul$supp, TG_simul$dose), sd) ## 0.5 1 2 ## OJ 4.460140 3.909964 2.660077 ## VC 2.750031 2.519982 4.799992

library(dplyr) # data management des données simulées TG_simul <- TG_simul %>% select(-id) %>% mutate(type="simulation") %>% rename(len=y) %>% relocate(len, supp, dose) # data management des données d'origine TG <- TG %>% mutate(type="origine") # assemblage des 2 datasets TG_all <- bind_rows(TG, TG_simul) # plot library(ggplot2) pd <- position_dodge(0.1) ggplot(TG_all, aes(x=dose, y=len, colour=type))+ geom_point(position = pd)+ facet_grid(~supp)

# creation d'un dossier "data_export" dans le projet R dir.create("data_export") ## Warning in dir.create("data_export"): 'data_export' existe déjà #install.packages("writexl") library(writexl) writexl::write_xlsx( x = list( feuille_Iris = iris, feuille_Airquality = airquality, feuille_anscombe = anscombe ), path = "data_export/mes-dataset.xlsx" )

8 réponses

Philippe %ICHEL dit :
7 novembre 2021 à 11 h 36 min
Quelqu’un qui fait la biblio pour moi je ne vais pas refuser ! Très bonne idée & encore merci pour tout votre travail.
Répondre
Mana dit :
7 novembre 2021 à 22 h 40 min
Merci Madame Della Vedova pour cet autre superbe article, grâce à vous, j’apprends un petit peu plus chaque jour sur la Data science / Data analyse/ Data visualisation et autre.
Vivement un prochain article.
Bien cordialement.
Alain
Répondre
BONNEFOY dit :
8 novembre 2021 à 11 h 48 min
Bonjour,
A part le lien pour la publi Quintana qui n’a pas fonctionné pour moi, l’article est super.
Je vais jeter un oeil aux effect size et aux donnees manquantes qui sont mon lot quotidien! Mais ma préférence va aux couleurs que j’ai d’ores et déjà transférés!
MERCI
Répondre
Roig-Pons dit :
8 novembre 2021 à 12 h 33 min
Très sympa et instructif ce nouveau format d’article, on en redemande ! 🙂
Répondre
Felix dit :
8 novembre 2021 à 16 h 23 min
Merci pour ces infos très variées! Et le format est clair et très agréable à lire.
Répondre
Renaud Mabire dit :
9 novembre 2021 à 20 h 33 min
Très pratique pour parcourir rapidement un nombre important de sujets et approfondir en fonction du temps et de l’intérêt. Super travail merci beaucoup.
Répondre
Cacahuète dit :
10 novembre 2021 à 9 h 42 min
J’adore, j’adore, j’adore !
Utile et bien présenté, un grand merci pour l’ensemble de vos articles !
Répondre
1. Claire Della Vedova dit :
  10 novembre 2021 à 11 h 00 min
  Merci pour votre enthousiasme.
  Rendez-vous début décembre pour les nouveautés de novembre !
  Répondre

News et découvertes d'octobre 2021

Table des matières

Data Visualization

Quelles couleurs utiliser pour les daltoniens ?

Reporting

Création de site ou blog avec le package distill

Biostatistiques

Simuler des données

Gestion des données manquantes

Effects size : seuils théoriques vs réalité

Utilisation de R

Gestion des versions de package avec renv

Exportation de data frame dans un même classeur Excel

Conclusion

Poursuivez votre lecture

8 réponses

Laisser un commentaire Annuler la réponse

Aide mémoire off'R ;)