Deskriptive Statistiken in R mit dem table1 Package: Ein Leitfaden
Deskriptive Statistiken sind ein wesentlicher Bestandteil der Datenanalyse, da sie Ihnen einen ersten Überblick über Ihre Daten geben. Sie helfen, wichtige Merkmale der Daten zu verstehen, wie z.B. Mittelwerte, Mediane, Standardabweichungen und Verteilungen. In R gibt es viele Pakete, die diese Statistiken berechnen können, und eines der benutzerfreundlichsten Pakete dafür ist das table1 Paket. In diesem Blogbeitrag werde ich Ihnen zeigen, wie Sie mit table1 in R deskriptive Statistiken erstellen können.
Installation und Laden des table1 Pakets
Bevor wir beginnen, müssen Sie sicherstellen, dass das table1 Paket installiert ist. Wenn es noch nicht installiert ist, können Sie es mit folgendem Befehl installieren:
install.packages("table1")
Laden Sie das Paket anschließend mit:
library(table1)
Überblick über die Funktionalitäten von table1
Das table1 Paket ist ein leistungsstarkes Werkzeug zur Erstellung von übersichtlichen und ansprechenden Tabellen für deskriptive Statistiken. Es bietet die Möglichkeit, Gruppenvergleiche durchzuführen und anpassbare Tabellen zu erstellen, die sich einfach in Berichte integrieren lassen.
Einfache deskriptive Statistiken mit table1
Angenommen, wir haben einen Datensatz df, der Informationen über Patienten enthält, wie z.B. Alter, Geschlecht, Gewicht, und Cholesterinspiegel. So könnte der Datensatz aussehen:
# Beispiel für einen Datensatz
set.seed(123)
df <- data.frame(
Geschlecht = factor(sample(c("Männlich", "Weiblich"), 100, replace = TRUE)),
Alter = rnorm(100, mean = 50, sd = 10),
Gewicht = rnorm(100, mean = 70, sd = 15),
Cholesterin = rnorm(100, mean = 200, sd = 30)
)
Erstellen einer Tabelle mit deskriptiven Statistiken
Um eine einfache Tabelle mit deskriptiven Statistiken zu erstellen, können Sie den folgenden Befehl verwenden:
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df)
Dieser Befehl erstellt eine Tabelle, die das Alter, das Gewicht und den Cholesterinspiegel für männliche und weibliche Patienten zusammenfasst. Das Symbol ~ trennt die abhängigen Variablen von den erklärenden Variablen, und das | Symbol teilt die Daten nach Geschlecht auf.
Anpassung der Ausgabe
Das table1 Paket erlaubt es Ihnen, die Ausgabe sehr flexibel anzupassen. Zum Beispiel können Sie benutzerdefinierte Beschriftungen und Einheiten hinzufügen:
label(df$Alter) <- "Alter (Jahre)"
label(df$Gewicht) <- "Gewicht (kg)"
label(df$Cholesterin) <- "Cholesterin (mg/dL)"
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df)
Hinzufügen von Teststatistiken
Eine der nützlichen Funktionen von table1 ist die Möglichkeit, Teststatistiken wie den t-Test oder den Chi-Quadrat-Test direkt in die Tabelle aufzunehmen, um Gruppenvergleiche durchzuführen. Dies kann folgendermaßen erreicht werden:
table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df, overall = "Gesamt", render.missing = NULL, render.categorical = "Frequencies", render.continuous = c(.="Mean (SD)"), test=TRUE)
Hier fügt test=TRUE automatisch geeignete Teststatistiken hinzu, um die Unterschiede zwischen den Gruppen zu bewerten.
Ausgabe als HTML oder PDF
Die erstellten Tabellen können einfach in HTML- oder PDF-Dokumente exportiert werden, was die Integration in Berichte und Präsentationen erleichtert. Um die Tabelle als HTML-Datei zu speichern, können Sie htmlTable aus dem htmlTable Paket verwenden:
library(htmlTable)
htmlTable(table1(~ Alter + Gewicht + Cholesterin | Geschlecht, data = df))
Für die Ausgabe in PDF können Sie mit knitr oder rmarkdown arbeiten, um die Tabelle direkt in ein RMarkdown-Dokument einzubinden.
Fazit
Das table1 Paket in R bietet eine einfache und dennoch leistungsstarke Möglichkeit, deskriptive Statistiken zu erstellen und zu präsentieren. Durch seine Flexibilität in der Anpassung und die Möglichkeit, Teststatistiken hinzuzufügen, ist es ein hervorragendes Werkzeug für die erste Exploration Ihrer Daten. Ob für akademische Forschung, klinische Studien oder Geschäftsdaten – table1 hilft Ihnen, Ihre Daten auf verständliche Weise zu kommunizieren.