Erstellen und interpretieren von Boxplot

Um eine schnelle und hilfreiche Übersicht über quantitative Daten zu erhalten bieten sich Boxplots sehr an. Sie zeigen sehr übersichtlich alle primär wichtigen Informationen bzgl. Verteilung und Lage der Daten – und können dadurch einen ersten Eindruck über die Daten vermitteln.

Jedoch soweit ich es beurteilen kann haben Boxplots einen schweren Stand, da viele nicht wissen wie sie erstellt werden und was sie Aussagen. Eine sehr schöne Einführung in die Interpretation von Boxplots hat Christian Reinboth als Lernmodul „Box-Plots selbst erstellen und interpretieren“ auf der e- learning Plattform lernmodule.net gestellt. Dort zu finden unter Mathematik->Hochschule

In dem Modul werden jedoch nur ein Typ von BoxPlots behandelt: den Whisker BoxPlot.
Daneben gibt es noch weitere Spielarten von Boxplots die als Zäune (Whisker) nicht den 1.5 Interquartilsabstand (Abstand 25 Percentile zu 75 Percentile) verwenden. Häufig findet sich auch Boxplots, die als Zäune die Spannweite (Abstand Max und Minima der Daten) darstellen [1]⁠. Seltener finden sich dann noch weitere Spielarten mit unterschiedlichen Whisker Werten oder mit eingekerbten Block die den (notched Boxplots) 95%-Konfidenzintervalle für den Vergleich zweier Median darstellen [2].

Die Erstellung von Boxplots mit R GNU oder auf R basierenden Statistiklabor ist ziemlich einfach:

Whiskerplot:

boxplot(Variable ~ Faktor, range=1.5)

BoxPlot mit Spannweite

boxplot(Variable ~ Faktor, range=0)

notched BoxPlot

boxplot(Variable ~ Faktor, range=1.5, notch=T)

Es gibt noch einige weitere Attribute und Einstellungsmöglichkeiten bei der Boxploterstellung mit R GNU – mehr hier zu deutsche Wiki / engl. Hilfe. Natürlich sind auch für Boxplots die üblichen Grafikatribute xlab, ylab etc. zulässig.
Beim Statistiklabor gibt es auch noch die Möglichkeit BoxPlots mit dem Grafik Wiszard zu erstellen.

Verwendete Offline Quellen:
1. Sachs, L., and Hedderich, J. (2006). Angewandte Statistik, (Springer).
Online Quellen sind im Text verlinkt