Visualisation des données manquantes

recherche des données manquantes

Visualisation des données manquantes Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données manquantes présentes dans un data frame, en termes de quantité (nombre ou pourcentage), de localisation, ou encore de distribution parmi les variables. Les data Dans cet article, je vais vous présenter quelques fonctions particulièrement intéressantes pour visualiser et explorer les données […]

Comment modifier l’ordre d’affichage dans un plot ?

modifier l'ordre dans les graphs ggplot2

Comment modifier l’ordre d’affichage d’un plot ? Récemment, j’ai vu passer une question sur un forum dédié à R, qui m’a paru intéressante : une personne demandait comment réarranger un graphique réalisé avec ggplot2. Cette question m’a inspiré cet article. Je vais donc vous montrer, en pas à pas, comment réarranger un graphique ggplot2, en modifiant l’ordre des modalités du facteur […]

Représentez un intervalle de confiance et de prédiction

intervalle

Représentez les intervalles de confiance et de prédiction La semaine dernière, j’ai reçu un commentaire d’un lecteur qui me disait : ” Bonjour, Bravo pour la qualité de l’information. Je souhaiterais faire exactement la même méthode que dans la partie 10 (représentation finale de la régression) [de l’article La régression linéaire simple avec le logiciel […]

Modélisation dose réponse

Modélisation dose réponse Introduction à la modélisation dose réponse La modélisation dose réponse consiste à modéliser, à l’aide d’une équation mathématique, l’évolution d’une réponse (la taille de racines de plantes par exemple) en fonction de l’augmentation de la dose d’un élément étudié (un herbicide par exemple). Pour réaliser une modélisation dose réponse, il est nécessaire […]

Démonstration du théorème central limite (TCL)

le théorème central limite

Illustration du théorème central limite (TCL) Introduction Le théorème central limite (TCL) est un théorème très important en biostatistique. Ce théorème nous dit que, quelle que soit la distribution d’une variable aléatoire X, la somme de cette variable (S(x)), et par extension, la moyenne (moy(x)), puisque la moyenne est une somme divisée par une constante), […]

Comment représenter une série temporelle avec ggplot2

Comment représenter une série temporelle avec ggplot2 Dans cet article, je vais essayer de répondre à une question que l’on me pose souvent : comment représenter graphiquement une série temporelle avec le package ggplot2 ? C’est vrai que cela n’est pas évident, car il y a trois difficultés à dépasser pour représenter une série temporelle : La variable […]

Créer des séquences et des grilles avec R

Créer des séquences et des grilles avec R Savoir créer des séquences de chiffres ou de chaînes de caractères sous R, ainsi que des grilles, peut être très utile.   J’ai régulièrement besoin de créer des séquences, pour : construire un jeu de données, créer les breaks sur les axes d’un plot avec ggplot2, produire un clée primaire en […]

La méthode des kmeans

visualisation des cluster du kmeans

La méthode des kmeans Quel que soit le domaine dans lequel on travaille, il peut être intéressant de savoir construire des groupes d’observations qui se ressemblent. On appelle cela des clusters. Il existe deux méthodes classiques pour réaliser des clusters : la méthode des kmeans, et celle du clustering hiérarchique. Dans cet article, nous allons nous intéresser à la […]

Introduction aux tests d’équivalence

Equivalence

Introduction aux tests d’équivalence Pré-requis Pour tirer pleinement profit de cet article d’introduction aux tests statistiques d’équivalence, il est nécessaire d’être familier avec le principe des tests statistiques, et notamment connaitre les notions d’hypothèses, de statistique du test, de risque alpha, de p-value, et de conclusion). Si cela n’est pas le cas, vous pourrez trouver […]

La régression logistique par l’exemple

tracé des battement du coeur

La régression logistique par l’exemple Prérequis Dans cet article, nous allons voir comment réaliser, en pratique, une régression logistique avec le logiciel R. Pour tirer pleinement profit de cet article, je vous recommande de lire l’article d’introduction à la régression logistique. Cliquez ici pour accéder à l’article d’introduction à la régression logistique Les données pour […]