Häufigkeitsverteilung

Kenngröße einer Stichprobe.

Sei X eine diskrete Zufallsgröße mit dem Wertebereich \({\mathfrak{X}}=\{{a}_{1},\mathrm{...},{a}_{k}\}\), a₁ >a₂< ··· >a_k, und sei (x₁, …, x_n) eine konkrete Stichprobe von X. Die einfachste statistische Tätigkeit der deskriptiven Statistik besteht darin, auszuzählen, wie oft jedes a_i in der Stichprobe vorkommt. Dabei werden folgende Häufigkeiten berechnet (j = 1, …, n): \begin{eqnarray}\begin{array}{ll}{H}_{n}({a}_{i}) & \text{- Anzahl der}\,{x}_{j}\,\text{mit}\,{x}_{j}={a}_{i},\\ {h}_{n}({a}_{i})=\frac{{H}_{n}({a}_{i})}{n} & \text{- Anteil der}\,{x}_{j}\,\text{mit}\,{x}_{j}={a}_{i},\\ H(i)=\displaystyle {\sum }_{l=1}^{i}{H}_{n}({a}_{l}) & \text{- Anzahl der}\,{x}_{j}\,\text{mit}\,{x}_{j}\le {a}_{i},\\ h(i)=\displaystyle {\sum }_{l=1}^{i}{h}_{n}({a}_{l}) & \text{- Anteil der}\,{x}_{j}\,\text{mit}\,{x}_{j}\le {a}_{i},\end{array}\end{eqnarray}H_n(a_i) und h_n(a_i) werden als absolute und relative Häufigkeit, H(i) und h(i) als absolute und relative Summenhäufigkeit bzw. als kumulative Häufigkeiten bezeichnet. Die Gesamtheit der entsprechenden Häufigkeiten für alle a_i, i = 1, …, k bezeichnet man als Häufigkeitsverteilung. Die tabellarische Darstellung der Häufigkeitsverteilungen liefert die sogenannte Häufigkeitstabelle der Stichprobe:

Abbildung 1 zum Lexikonartikel Häufigkeitsverteilung — © Springer-Verlag GmbH Deutschland 2017
Bild vergrößern

Nach den Gesetzen der großen Zahlen gilt für alle reellen ϵ > 0 \begin{eqnarray}\mathop{\mathrm{lim}}\limits_{n\to \infty }P(|{h}_{n}({a}_{i})-P(X={a}_{i})|\gt \varepsilon )=0,\end{eqnarray} sodaß die relative Häufigkeitsverteilung für hinreichend große n eine gute Schätzung der Wahrscheinlichkeitsverteilung von X ist.

Im Falle einer stetigen Zufallsgröße X ist der Wertebereich \({\mathfrak{X}}\) von X nicht mehr endlich, sondern überabzählbar unendlich groß. Das hat zur Folge, daß in einer Stichprobe (x₁, …, x_n) nicht jeder mögliche Wert von X vorkommt. Um eine bessere Vorstellung über die Gestalt der Wahrscheinlichkeitsverteilung von X durch die Stichprobe zu erhalten, wird der Wertebereich \({\mathfrak{X}}\) in disjunkte Intervalle, sogenannte Klassen, zerlegt und die absoluten, relativen bzw. kumulativen Klassenhäufigkeitsverteilungen bestimmt (Klasseneinteilung).

Lexikon der Mathematik: Häufigkeitsverteilung

Schreiben Sie uns!

Artikel zum Thema

Mathematische Trolley-Probleme: »Ich habe in meinem Leben noch keine irrationale Zahl gebraucht«

»Mathematische Überraschungen«: Mathematik, die Freude macht

Christian Spannagel: Pentagramm und Hexagramm: Winkelsummen in den Ecken

Mathemagischer Advent: Die vielen Unendlichkeiten

Themenkanäle

Die neue Generation von Computern

Quantenphysik

Das Digital-Manifest

SponsoredPartnerinhalte