Matrice de plots avec ggpairs de GGally

Matrice de plots avec ggpairs de GGally Lorsqu’on analyse des données, il est classique, lors d’une première étape, d’étudier la distribution de chacune des variables, ainsi que les liens qu’elles peuvent avoir entre elles. De nombreuses fonctions ont été développées pour répondre à ce besoin. Je vous propose, ici, d’explorer ensemble, les possibilités de la […]

Mise en forme des graphiques ggplot2

Mise en forme des graphiques ggplot2

Mise en forme des graphiques ggplot2 Lorsqu’on commence à employer le package ggplot2 pour visualiser des données, on a rapidement besoin de réaliser quelques mises en forme, comme par exemple modifier les couleurs, ajouter un titre, ajouter du texte, gérer la légende, assembler plusieurs graphiques, ou encore de les exporter.Dans cet article, je vous propose […]

Visualisation des données manquantes

recherche des données manquantes

Visualisation des données manquantes Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données manquantes présentes dans un data frame, en termes de quantité (nombre ou pourcentage), de localisation, ou encore de distribution parmi les variables. Les data Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données […]

Comment modifier l’ordre d’affichage dans un plot ?

modifier l'ordre dans les graphs ggplot2

Comment modifier l’ordre d’affichage d’un plot ? Récemment, j’ai vu passer une question sur un forum dédié à R, qui m’a paru intéressante : une personne demandait comment réarranger un graphique réalisé avec ggplot2. Cette question m’a inspiré cet article. Je vais donc vous montrer, en pas à pas, comment réarranger un graphique ggplot2, en modifiant l’ordre des modalités du facteur […]

Représentez un intervalle de confiance et de prédiction

intervalle

Représentez les intervalles de confiance et de prédiction La semaine dernière, j’ai reçu un commentaire d’un lecteur qui me disait : ” Bonjour, Bravo pour la qualité de l’information. Je souhaiterais faire exactement la même méthode que dans la partie 10 (représentation finale de la régression) [de l’article La régression linéaire simple avec le logiciel […]

Comment représenter une série temporelle avec ggplot2

Comment représenter une série temporelle avec ggplot2 Dans cet article, je vais essayer de répondre à une question que l’on me pose souvent : comment représenter graphiquement une série temporelle avec le package ggplot2 ? C’est vrai que cela n’est pas évident, car il y a trois difficultés à dépasser pour représenter une série temporelle : La variable […]

Ajouter les pvalues sur un ggplot, manuellement

ajouter les pvalues sur un ggplot

Ajouter les pvalues sur un ggplot, manuellement A la fin d’une analyse de données, on réalise généralement un graph pour synthétiser les résultats obtenus. Par exemple, dans le cadre d’une ANOVA à un facteur (qui sert à comparer plusieurs moyennes), on pourrait vouloir réaliser ce genre de graph : J’ai déjà évoqué, ici et là, plusieurs solutions pour ajouter les […]

p-values ajustées : affichez les facilement sur un graph !

p-values ajustées : affichez les facilement sur un graph Contexte Il y a quelque temps, j’ai écrit un article expliquant comment, après une ANOVA, indiquer les  p-values ou les différences significatives sur un graph , en employant le package `ggpubr`.   Accédez à l’article “Comment indiquer les résultats des comparaisons sur un graph ?” Par exemple, pour une ANOVA non […]

Découvrez l’addin Esquisse !

addin R esquisse ggplot2

Découvrez l’addin Esquisse ! Récemment, DreamRs (une entreprise FRANCAISE de conseils et d’expertises en data science spécialisée en R) a développé un addin R, nommé Esquisse, qui permet de créer des graphiques ggplot2 de façon interactive, en cliquer-glisser (ou drag and drop). Outre le fait que cet addin permet à ceux qui débutent avec ggplot2, d’obtenir plus simplement et plus rapidement les […]

Format wide et long : pourquoi, et comment ?

formats wide et long

Format wide et long : pourquoi, et comment ? Les formats wide et long Format wide Je dis très régulièrement que, pour être traités avec le logiciel R, les jeux de données doivent être au format “tidy”, c’est-à-dire avec une ligne par observation, une variable par colonne, et une valeur au croisement d’une ligne et […]