Direkt zum Inhalt

Lexikon der Mathematik: Häufigkeitsverteilung

Kenngröße einer Stichprobe.

Sei X eine diskrete Zufallsgröße mit dem Wertebereich \({\mathfrak{X}}=\{{a}_{1},\mathrm{...},{a}_{k}\}\), a1 > a2 < ··· > ak, und sei (x1, …, xn) eine konkrete Stichprobe von X. Die einfachste statistische Tätigkeit der deskriptiven Statistik besteht darin, auszuzählen, wie oft jedes ai in der Stichprobe vorkommt. Dabei werden folgende Häufigkeiten berechnet (j = 1, …, n): \begin{eqnarray}\begin{array}{ll}{H}_{n}({a}_{i}) & \text{- Anzahl der}\,{x}_{j}\,\text{mit}\,{x}_{j}={a}_{i},\\ {h}_{n}({a}_{i})=\frac{{H}_{n}({a}_{i})}{n} & \text{- Anteil der}\,{x}_{j}\,\text{mit}\,{x}_{j}={a}_{i},\\ H(i)=\displaystyle {\sum }_{l=1}^{i}{H}_{n}({a}_{l}) & \text{- Anzahl der}\,{x}_{j}\,\text{mit}\,{x}_{j}\le {a}_{i},\\ h(i)=\displaystyle {\sum }_{l=1}^{i}{h}_{n}({a}_{l}) & \text{- Anteil der}\,{x}_{j}\,\text{mit}\,{x}_{j}\le {a}_{i},\end{array}\end{eqnarray}Hn(ai) und hn(ai) werden als absolute und relative Häufigkeit, H(i) und h(i) als absolute und relative Summenhäufigkeit bzw. als kumulative Häufigkeiten bezeichnet. Die Gesamtheit der entsprechenden Häufigkeiten für alle ai, i = 1, …, k bezeichnet man als Häufigkeitsverteilung. Die tabellarische Darstellung der Häufigkeitsverteilungen liefert die sogenannte Häufigkeitstabelle der Stichprobe:

Abbildung 1 zum Lexikonartikel Häufigkeitsverteilung
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Nach den Gesetzen der großen Zahlen gilt für alle reellen ϵ > 0 \begin{eqnarray}\mathop{\mathrm{lim}}\limits_{n\to \infty }P(|{h}_{n}({a}_{i})-P(X={a}_{i})|\gt \varepsilon )=0,\end{eqnarray} sodaß die relative Häufigkeitsverteilung für hinreichend große n eine gute Schätzung der Wahrscheinlichkeitsverteilung von X ist.

Im Falle einer stetigen Zufallsgröße X ist der Wertebereich \({\mathfrak{X}}\) von X nicht mehr endlich, sondern überabzählbar unendlich groß. Das hat zur Folge, daß in einer Stichprobe (x1, …, xn) nicht jeder mögliche Wert von X vorkommt. Um eine bessere Vorstellung über die Gestalt der Wahrscheinlichkeitsverteilung von X durch die Stichprobe zu erhalten, wird der Wertebereich \({\mathfrak{X}}\) in disjunkte Intervalle, sogenannte Klassen, zerlegt und die absoluten, relativen bzw. kumulativen Klassenhäufigkeitsverteilungen bestimmt (Klasseneinteilung).

Schreiben Sie uns!

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren
- Prof. Dr. Guido Walz

Partnerinhalte

Bitte erlauben Sie Javascript, um die volle Funktionalität von Spektrum.de zu erhalten.