Direkt zum Inhalt

Lexikon der Mathematik: Stichprobe

ein zentraler Begriff der mathematischen Statistik.

Bei praktischen statistischen Überlegungen geht man i. allg. von einer Menge von Objekten aus und interessiert sich für ein bestimmtes zufälliges Merkmal (Zufallsgröße) X (oder einen Merkmalsvektor), genauer gesagt für die Wahrscheinlichkeitsverteilung PX von X in der Menge der betrachteten Objekte.

Es seien also X eine Zufallsgröße über dem Wahrscheinlichkeitsraum [Ω, 𝔄, P] mit dem (meßbaren) Bildraum [M, \({\mathcal{M}}\)] und PX die Wahrscheinlichkeitsverteilung von X auf [M, \({\mathcal{M}}\)]. Als Grundgesamtheit bezeichnet man dann den zu X gehörenden statistischen Grundraum [M, \({\mathcal{M}}\), Px ]. Falls X eine eindimensionale reellwertige Zufallsgröße ist, so sind M = ℝ1 und \({\mathcal{M}}\) = ℬ1 die σ-Algebra der Borel-Mengen aus ℝ1.

Manchmal verwendet man auch die Bezeichnung Grundgesamtheit der Kürze wegen nur für die Menge der zugrundeliegenden Objekte oder für die Verteilung PX, meint aber den gesamten statistischen Grundraum [M, \({\mathcal{M}}\), Px ]. Spricht man beispielsweise von einer normalverteilten Grundgesamtheit, so meint man eine Menge von Objekten, an denen ein zufälliges Merkmal X beobachtet wird, welches in der Menge der Objekte eine Normalverteilung PX = N(µ, σ2) besitzt.

Um Aufschluß über die Wahrscheinlichkeitsverteilung PX des zufälligen Merkmals X zu erhalten, wird an n der Grundgesamtheit nacheinander in zufälliger Weise entnommenen Objekten das interessierende Merkmal gemessen oder beobachtet. Das Tupel (x1, x2, …, xn) der n Realisierungen von X bezeichnet man als konkrete Stichprobe von X, n nennt man Stichprobenumfang. Jede einzelne Realisierung xi heißt Element der Stichprobe. Die einzelnen Elemente xi können als i-te Realisierung der Zufallsgröße X aufgefaßt werden. Betrachtet man sie als zufällig, so gelangt man zum Begriff der mathematischen Stichprobe. Als mathematische Stichprobe bezeichnet man den zufälligen Vektor \(\overrightarrow{X}\) = (X1, X2, …, Xn), wobei alle Xi identisch zu X (alle Xi besitzen den gleichen statistischen Grundraum [M, \({\mathcal{M}}\), PX ]) verteilt und untereinander stochastisch unabhängig sind. Der zu \(\overrightarrow{X}\) gehörende statistische Grundraum [M(n), M(n), \({P}_{\overrightarrow{X}}$] wird auch als Stichprobenraum bezeichnet.

Je nachdem, wie die Stichprobe (x1, …, xn) von X erhoben wird, unterscheidet man verschiedene Typen von Stichproben. Sind die xi der Größe nach geordnet, so spricht man von einer geordneten Stichprobe. Wird die Grundgesamtheit von Objekten vollständig und überlappungsfrei in Teilpopula tionen (Schichten) aufgeteilt, und setzt sich die Gesamtstichprobe aus unabhängigen Stichproben aller Schichten zusammen, so spricht man von einer geschichteten Stichprobe.

Beim Vergleich der Verteilungen zweier Grundgesamtheiten wird aus jeder der beiden Grundgesamtheiten eine Stichprobe (x1, …, xn1) bzw. (y1, …, yn2) entnommen. Sind die Objekte, an denen die Stichprobendaten erhoben wurden, in beiden Stichproben gleich, so spricht man von verbundenen Stichproben, sind sie verschieden, so spricht man von unabhängigen Stichproben. Sind beispielsweise xi und yi die Reaktionszeiten einer Person i vor und nach einem Training (i = 1, …, n, n = n1 = n2), so handelt es sich um zwei verbundene Stichproben. Sind aber xi die Reaktionszeiten von n1 Männern und yi die von n2 Frauen, so handelt es sich um unabhängige Stichproben.

Lesermeinung

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren
- Prof. Dr. Guido Walz

Partnerinhalte