Lexikon der Mathematik: Mischverteilung
Mischung, in der Regel auf der σ -Algebra ℬ(ℝ) der Borelschen Mengen von ℝ definiertes Wahrscheinlichkeitsmaß Q, das eine Darstellung der Form
für alle B ∈ ℬ(ℝ) mit einem Markow-Kern κ von (ℝ, ℬ(ℝ)) nach (ℝ, ℬ(ℝ)) und einem auf ℬ(ℝ) definierten Wahrscheinlichkeitsmaß µ besitzt.
Im allgemeinen faßt man Q und µ als die Verteilungen PX und PY von zwei auf einem Wahrscheinlichkeitsraum (Ω, 𝔄, P) definierten reellen Zufallsvariablen X und Y und k als die bedingte Verteilung (y, B) → P(X ∈ B|Y = y) von X gegeben Y auf. Besitzt die bedingte Verteilung von X gegeben Y = y, d. h. die Abbildung B → P(X ∈ B|Y = y), für jedes y eine bedingte Dichte fX|Y=y bezüglich des Lebesgue-Maßes λ bzw. des Zählmaßes a, so besitzt PX die Dichte
bezüglich λ bzw. a. Im Falle, daß X und Y beide diskret sind, vereinfacht sich dieser Ausdruck zu
und im Falle, daß eine gemeinsamen Dichte von X und Y bezüglich des zweidimensionalen Lebesgue-Maßes existiert, zu
wobei fY die Dichte von PY bezüglich λ bezeichnet. Die Abbildung zeigt fX für eine Situation, in der PY durch PY ({0}) = 0, 3 und PY ({3}) = 0, 7 gegeben sind, sowie fX|Y=y für y ∈ {0, 3} die Dichte einer Normalverteilung mit Erwartungswert µy = y und Varianz σ2 = 1 ist.
In Anwendungen, wie z. B. der Epidemiologie, werden Mischverteilungen häufig zur Modellierung nicht beobachtbarer Heterogenität verwendet. Dabei wird Y als latente, nicht beobachtbare Variable aufgefaßt, welche die Zugehörigkeit zu bestimmten Subgruppen einer interessierenden Population angibt. Die Verteilung der beobachtbaren Variable X in der durch die Realisierung y von Y gekennzeichneten Subgruppe ist die bedingte Verteilung von X gegeben Y = y. Man nimmt nun an, daß diese Verteilung für jedes y zu einer bestimmten Verteilungsfamilie gehört, z. B. Poisson-Verteilung zum Parameter y. Um eine Mischverteilung an unabhängige Realisierungen x1, …, xn von X anzupassen, stellt man die Log-Likelihood-Funktion
auf, welche bei gegebenen x1, …, xn nur von der unbekannten Verteilung PY abhängt, und versucht eine Verteilung \({\hat{P}}_{Y}\) innerhalb einer bestimmten parametrischen oder nichtparametrischen Klasse von Verteilungen zu bestimmen, die diese Funktion maximiert. Siehe auch Mischen von Verteilungsfunktionen.
Schreiben Sie uns!