Comment ajouter des données sur un ggplot existant ?
Comment ajouter des données sur un ggplot existant ? C’est une question que l’on me pose fréquemment, notamment lors des formations que j’anime sur ggplot2. Pour aider un maximum d’entre vous, j’ai donc décidé d’écrire cet article pour vous montrer comment faire, assez simplement, avec deux approches différentes. Dans l’exemple ci-dessous, je copie le data […]
Comment afficher automatiquement l’équation d’une droite sur un ggplot ?
Comment afficher automatiquement l’équation d’une droite sur un ggplot2 ? Lorsque j’anime des formations sur la réalisation de graphiques sous R avec le package ggplot2, je me sers du scatterplot pour expliquer le principe et le fonctionnement du package. Parmi les éléments que je montre, il y a la couche geom_smooth(), qui permet ultra rapidement […]
Comment réaliser un spaghetti plot avec R
Comment réaliser un spaghetti plot avec R ? Les spaghetti plots, ou plots en fagot, ou encore line plots sont des outils de visualisation qui permettent de suivre des trajectoires individuelles, au cours du temps, ou au travers de différentes conditions. En voici un exemple : Table des matières Difficultés liées aux formats long et […]
Comment automatiser une palette de couleurs RGB ?
Comment automatiser votre palette de couleurs RGB ? Table des matières Lorsqu’on réalise une représentation graphique avec ggplot2, et que l’on souhaite employer des couleurs bien précises, généralement, soit on les nomme en toute lettre, soit on utilise leur code hexadécimal. Mais comment faire quand on ne dispose que des codes RGB ? Je vous […]
Matrice de plots avec ggpairs de GGally
Matrice de plots avec ggpairs de GGally Lorsqu’on analyse des données, il est classique, lors d’une première étape, d’étudier la distribution de chacune des variables, ainsi que les liens qu’elles peuvent avoir entre elles. De nombreuses fonctions ont été développées pour répondre à ce besoin. Je vous propose, ici, d’explorer ensemble, les possibilités de la […]
Mise en forme des graphiques ggplot2
Mise en forme des graphiques ggplot2 Lorsqu’on commence à employer le package ggplot2 pour visualiser des données, on a rapidement besoin de réaliser quelques mises en forme, comme par exemple modifier les couleurs, ajouter un titre, ajouter du texte, gérer la légende, assembler plusieurs graphiques, ou encore de les exporter.Dans cet article, je vous propose […]
Visualisation des données manquantes
Visualisation des données manquantes Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données manquantes présentes dans un data frame, en termes de quantité (nombre ou pourcentage), de localisation, ou encore de distribution parmi les variables. Les data Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données […]
Comment modifier l’ordre d’affichage dans un plot ?
Comment modifier l’ordre d’affichage d’un plot ? Récemment, j’ai vu passer une question sur un forum dédié à R, qui m’a paru intéressante : une personne demandait comment réarranger un graphique réalisé avec ggplot2. Cette question m’a inspiré cet article. Je vais donc vous montrer, en pas à pas, comment réarranger un graphique ggplot2, en modifiant l’ordre des modalités du facteur […]
Représentez un intervalle de confiance et de prédiction
Représentez les intervalles de confiance et de prédiction La semaine dernière, j’ai reçu un commentaire d’un lecteur qui me disait : ” Bonjour, Bravo pour la qualité de l’information. Je souhaiterais faire exactement la même méthode que dans la partie 10 (représentation finale de la régression) [de l’article La régression linéaire simple avec le logiciel […]
Comment représenter une série temporelle avec ggplot2
Comment représenter une série temporelle avec ggplot2 Dans cet article, je vais essayer de répondre à une question que l’on me pose souvent : comment représenter graphiquement une série temporelle avec le package ggplot2 ? C’est vrai que cela n’est pas évident, car il y a trois difficultés à dépasser pour représenter une série temporelle : La variable […]