Statistiques descriptives dans R avec le table1 Package : un guide
Les statistiques descriptives sont un élément essentiel de l'analyse des données, car elles vous donnent un premier aperçu de vos données. Elles aident à comprendre les caractéristiques importantes des données, telles que les moyennes, les médianes, les écarts-types et les distributions. Il existe de nombreux paquets dans R qui peuvent calculer ces statistiques, et l'un des paquets les plus faciles à utiliser pour cela est le paquet table1. Dans ce billet de blog, je vais vous montrer comment utiliser table1 dans R pour créer des statistiques descriptives.
Installation et chargement du paquet table1
Avant de commencer, vous devez vous assurer que le paquet table1 est installé. S'il n'est pas encore installé, vous pouvez l'installer avec la commande suivante :
install.packages("table1")
Chargez ensuite le paquet avec :
library(table1)
Aperçu des fonctionnalités de table1
Le package table1 est un outil puissant permettant de créer des tableaux clairs et attrayants pour les statistiques descriptives. Il offre la possibilité d'effectuer des comparaisons de groupes et de créer des tableaux personnalisables qui peuvent être facilement intégrés dans des rapports.
Statistiques descriptives simples avec table1
Supposons que nous ayons un ensemble de données df contenant des informations sur les patients, telles que l'âge, le sexe, le poids et le taux de cholestérol. Voici à quoi pourrait ressembler l'ensemble de données :
# Beispiel für einen Datensatz
set.seed(123)
df <- data.frame(
Geschlecht = factor(sample(c("Männlich", "Weiblich"), 100, replace = TRUE)),
Alter = rnorm(100, mean = 50, sd = 10),
Gewicht = rnorm(100, mean = 70, sd = 15),
Cholesterin = rnorm(100, mean = 200, sd = 30)
)
Création d'un tableau de statistiques descriptives
Pour créer un simple tableau de statistiques descriptives, vous pouvez utiliser la commande suivante :
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df)
Cette commande crée un tableau qui résume l'âge, le poids et le taux de cholestérol pour les patients masculins et féminins. Le symbole ~ sépare les variables dépendantes des variables explicatives et le symbole | répartit les données par sexe.
Adaptation de la sortie
Le paquet table1 vous permet de personnaliser la sortie de manière très flexible. Vous pouvez par exemple ajouter des étiquettes et des unités personnalisées :
label(df$Alter) <- "Alter (Jahre)"
label(df$Gewicht) <- "Gewicht (kg)"
label(df$Cholesterin) <- "Cholesterin (mg/dL)"
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df)
Ajout de statistiques de test
L'une des fonctions utiles de table1 est la possibilité d'inclure des statistiques de test telles que le test t ou le test du khi-carré directement dans le tableau afin d'effectuer des comparaisons de groupes. Ceci peut être réalisé de la manière suivante :
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df, overall = "Gesamt", render.missing = NULL, render.categorical = "Frequencies", render.continuous = c(.="Mean (SD)"), test=TRUE)
Ici, test=TRUE ajoute automatiquement des statistiques de test appropriées afin d'évaluer les différences entre les groupes.
Sortie en HTML ou PDF
Les tableaux créés peuvent être facilement exportés vers des documents HTML ou PDF, ce qui facilite leur intégration dans des rapports et des présentations. Pour enregistrer le tableau sous forme de fichier HTML, vous pouvez utiliser htmlTable du package htmlTable :
library(htmlTable)
htmlTable(table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df))
Pour la sortie en PDF, vous pouvez travailler avec knitr ou rmarkdown pour intégrer le tableau directement dans un document RMarkdown.
Conclusion
Le package table1 dans R offre un moyen simple mais puissant de créer et de présenter des statistiques descriptives. Grâce à sa flexibilité de personnalisation et à la possibilité d'ajouter des statistiques de test, c'est un excellent outil pour une première exploration de vos données. Que ce soit pour la recherche académique, les essais cliniques ou les données commerciales, table1 vous aide à communiquer vos données de manière compréhensible.