Direkt zum Inhalt

Lexikon der Mathematik: Dichteschätzung

empirische Dichte, Methode zur Schätzung der empirischen Dichtefunktion.

Mitunter sind Histogramme keine geeignete Darstellung für die empirische Dichte einer Beobachtungsreihe x1, …, xn, da man hier von etwa gleichverteilten Beobachtungswerten in jeder Klasse ausgeht. Ist eine solche Annahme nicht zu rechtfertigen, so verwendet man die im folgenden vorgestellten Formen einer empirischen Dichtefunktion, die auch als Dichteschätzer oder Kern-schätzer bezeichnet werden.

Bei ihnen wird zunächst ein Wertebereich, der alle Beobachtungen x1, …, xn überdeckt, bestimmt. An endlich vielen äquidistanten Stellen x dieses Wertebereichs wird dann der Wert der Dichteschätzung an der Stelle x wie folgt berechnet: \begin{eqnarray}\hat{f(x)}=\frac{1}{bn}\displaystyle \sum _{i=1}^{n}w\left(\frac{x-{x}_{i}}{b}\right).\end{eqnarray}

Hier bezeichnet b einen frei wählbaren Parameter, der bestimmt, wie breit das Intervall \begin{eqnarray}[x-0,5b,x+0,5b]\end{eqnarray}

ist; Beobachtungswerte xi in diesem Intervall werden zur Bestimmung von \(\hat{f(x)}\) herangezogen. Weiter ist w(u) eine Gewichtsfunktion, ein „Kern“ ähnlich den lag-Spektralfenstern zur Glättung von Stichprobenspektren in der Zeitreihenanalyse (Kern-schätzung).

Für w(u) kann jede beschränkte, symmetrische und nichtnegative Funktion herangezogen werden, für die gilt \begin{eqnarray}\displaystyle \underset{-\infty }{\overset{+\infty }{\int }}w(u)du=1,\\ \displaystyle \underset{-\infty }{\overset{+\infty }{\int }}{w}^{2}(u)du\lt \infty, \end{eqnarray}\begin{eqnarray}\text{und}|\frac{w(u)}{u}|\to 0 \ \ \text{f}\ddot{u}\text{r}\ |u|\to \infty.\end{eqnarray}

Meistens werden folgende Gewichtsfunktionen verwendet.

Boxcar-Funktion: \begin{eqnarray}w(u)=\left\{\begin{array}{ll}1, & \text{falls}\ |u|\le \displaystyle \frac{1}{2}\\ 0, & \text{sonst},\end{array}\right.\end{eqnarray}

„Cosinus“-Funktion: \begin{eqnarray}w(u)=\left\{\begin{array}{ll}1+cos(2\pi u), & \text{falls}\ |u|\le \displaystyle \frac{1}{2}\\ 0, & \text{sonst},\end{array}\right.\end{eqnarray}

Rechteckskern: \begin{eqnarray}w(u)=\left\{\begin{array}{ll}\displaystyle \frac{1}{2}, & \text{falls}\ |u|\le 1\\ 0, & \text{sonst},\end{array}\right.\end{eqnarray}

Dreieckskern: \begin{eqnarray}w(u)=\left\{\begin{array}{ll}1-|u|, & \text{falls}\ |u|\le 1\\ 0, & \text{sonst},\end{array}\right.\end{eqnarray}

Normalkern: \begin{eqnarray}w(u)=\displaystyle \frac{1}{\sqrt{2\pi }}{e}^{-\displaystyle \frac{{\text{u}}^{2}}{2}}.\end{eqnarray}

Die Abbildung zeigt die Gestalt von w(u) für die Boxcar- und die Cosinus-Funktion. Im ersten Fall ist f(x) gerade die Anzahl der Beobachtungswerte im Intervall [x − 0, 5b, x + 0, 5b], dividiert durch bn.

Ein numerisches Beispiel. Wir verwenden die folgenden n = 16 Beobachtungsdaten xi:

Abbildung 1 zum Lexikonartikel Dichteschätzung
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Die Tabelle zeigt die empirischen Dichten \(\hat{{f}_{B}(x)}\) und \(\hat{{f}_{C}(x)}\), die unter Verwendung der Boxcar- bzw. Cosinus-Funktion berechnet wurden, an den Stellen \begin{eqnarray}x=0,25+j\cdot 0,125,j=0,\ldots, 18.\end{eqnarray}

Abbildung 2 zum Lexikonartikel Dichteschätzung
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Gestalt der Boxcar-Funktion (links) und der Cosinus-Funktion (rechts)

Dabei ist in beiden Fällen b = 0, 5 gewählt worden. Zum Beispiel ergibt sich \begin{eqnarray}{f}_{B}(1) & = & \displaystyle \frac{1}{16\cdot 0,5}\displaystyle \sum _{i=1}^{16}w\left(\displaystyle \frac{1-{x}_{i}}{0,5}\right)\\ & = & \displaystyle \frac{1}{8}(0+0+0+w(0,28)+w(0,16)+\\ & & w(-0,10)+w(-0,32)+0+\cdots +0)\\ & = & \displaystyle \frac{1}{8}(0+0+0+1+1+1+1+0+\cdots +0)\\ & = & 0,5.\end{eqnarray}

Abbildung 3 zum Lexikonartikel Dichteschätzung
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Die folgende Abbildung zeigt das Histogramm der 16 beobachteten Werte bei Verwendung der Klassenbreite 0,5 und die Gestalt der beiden Dichteschätzungen. Die berechneten Werte der Dichteschätzungen sind durch einen Polygonzug miteinander verbunden worden.

Abbildung 4 zum Lexikonartikel Dichteschätzung
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Histogramm (links), Boxcar-Dichteschätzung (Mitte) und Cosinus-Dichteschätzung (rechts) zu n=16 Daten bei Klassenbreite 0,5 und b=0,5

Lesermeinung

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren
- Prof. Dr. Guido Walz

Partnervideos