Direkt zum Inhalt

Lexikon der Mathematik: U-Test

von Mann und Withney 1947 entwickelter verteilungsfreier (nichtparametrische Statistik) Signifikanztest zum Prüfen, ob zwei unabhängige Stichproben aus Grundgesamtheiten mit gleicher Verteilungsfunktion stammen. Er wird angewendet, wenn die Stichproben nichtnormalverteilten Grundgesamtheiten entstammen oder nur ordinalskaliert (Skalentypen) vorliegen.

Seien X und Y zwei Zufallsgrößen mit den Verteilungsfunktionen FX und FY, und seien \(({X}_{1},\ldots,{X}_{{n}_{1}}),\ ({Y}_{1},\ldots,{Y}_{{n}_{2}})\) Stichproben von X und Y vom Umfang n1 und n2. Der U-Test ist ein spezieller Rangtest zum Prüfen ein- und zweiseitiger Hypothesen:

a) zweiseitig :

H0 : FX = FY gegen H1 : FXFY

b) einseitig :

H0 : Fx(x) ≥ Fy (x) gegen

H1 : FX(x) ≤ FY (x)

und < für mindestens ein x

c) einseitig

H0 : FX(x) ≤ FY (x) gegen

H1 : FX(x) ≥ FY (x)

und > für mindestens ein x

Zur Berechnung der Teststatistik des Tests wird zunächst für die vereinigte Stichprobe \(({X}_{1},\ldots,{X}_{{n}_{1}},\ {Y}_{1},\ldots,{Y}_{{n}_{2}})\) eine gemeinsame aufsteigende Rangplatzreihe (geordnete Stichprobe) gebildet. Aus dieser Rangplatzzuordnung werden die beiden Teilsummen Rx und Ry der der Rangplatzzahlen, die zu den Stichprobenelementen von X und Y gehören, gebildet. Die Teststatistik des U-Test ist \begin{eqnarray}T=\min ({U}_{x},{U}_{y})\end{eqnarray} mit \begin{eqnarray}{U}_{x}={R}_{x}-\frac{({n}_{1}+1){n}_{1}}{2},\ {U}_{y}={R}_{y}-\frac{({n}_{2}+1){n}_{2}}{2}.\end{eqnarray}

H0 wird abgelehnt, falls der Wert von T bei vorgegebenen α im Ablehnebereich der U-Verteilung liegt, d. h., die Entscheidungsregeln lauten:

a) H0 wird verworfen, falls \(|T|\ \gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\frac{\alpha}{2})\)

b) H0 wird verworfen, falls \(T\gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\alpha)\)

c) H0 wird verworfen, falls \(T\lt \ {U}_{{n}_{1},\ {n}_{2}}(\alpha)\)

\({U}_{{n}_{1},\ {n}_{2}}(p)\) ist das p-Quantil (Quantil) der U-Verteilung. Diese Quantile sind z.B. in [1] tabelliert.

Es gilt Ux + Uy = n1n2. Wenn H0 gilt, so müssen beide Teilsummen etwa gleich groß sein und folglich \(T\approx \frac{{n}_{1}{n}_{2}}{2}\) gelten. Auf dieser Basis wird häufig anstelle des eben beschriebenen exakten Tests ein approximativer Test durchgeführt. Bei diesem wird anstelle von T die Teststatistik \begin{eqnarray}\tilde{T}=\frac{|T-\frac{{n}_{1}{n}_{2}}{2}|}{\sqrt{\frac{{n}_{1}{n}_{2}({n}_{1}+{n}_{2}+1)}{12}}}\end{eqnarray} verwendet. \(\tilde{T}\) ist approximativ standardnormalverteilt, eine ausreichende Güte der Approximation ergibt sich für n1 + n2 ≥ 20, n1 ≥ 8, n2 ≥ 8. Die Entscheidungsregeln in diesem Fall lauten:

a) H0 wird verworfen, falls \(|\tilde{T}|\ \gt \ {z}_{1-\frac{\alpha}{2}}\)

b) H0 wird verworfen, falls \(\tilde{T}\ \gt \ {z}_{1-\alpha}\)

c) H0 wird verworfen, falls \(\tilde{T}\lt \ {z}_{\alpha}\)

zp ist hierbei das p–Quantil der Standardnormalverteilung. Treten in beiden Stichproben gleiche Werte (Bindungen) auf, dann erhalten alle diese Werte bei der Rangplatzzuordnung den gleichen mittleren Rangplatz zugewiesen. Enthalten solche Bindungen Werte beider Stichproben, dann ist eine Korrektur der Prüfgröße \(\tilde{T}\ \) notwendig, die sich wie folgt berechnet: \begin{eqnarray}\tilde{\tilde{T}}=\frac{|T-\frac{{n}_{1}{n}_{2}}{2}|}{\sqrt{\frac{{n}_{1}{n}_{2}}{12n(n-1)}[{n}^{3}-n-\displaystyle \sum t({t}^{2}-1)]}}\end{eqnarray}

Dabei ist n = n1 + n2, und t bezeichnet die Auftrittshäufigkeit ranggleicher Beobachtungen aus beiden Stichproben.

Die o.g. Hypothesen a) bis c) erstrecken sich auch auf entsprechende Hypothesen über die Gleichheit zentraler Parameter der beiden Verteilungsfunktionen FX und FY, wie z. B. die Gleichheit der Mediane oder der Erwartungswerte von X und Y. In diesen Fällen wird der U-Test analog angewendet. Der so beschriebene Test wird häufig auch als Rangsummentest von Wilcoxon für unabhängige Stichproben bezeichnet. Mann und Whitney haben ursprünglich zur Berechnung der Teststatistik zum Prüfen obiger Hypothesen folgendes Vorgehen vorgeschlagen. Man ordne die gemeinsame Stichprobe in aufsteigender Reihenfolge, und verwende als Teststatistik U = Anzahl aller Paare (xi, yj) in der gemeinsamen geordneten Stichprobe, für die gilt: xi < yj. Ein solches Paar (xi, yj) mit xi < yj bezeichnet man auch als Inversion. Die U-Test-Statistik ist also gleich der Summe aller Inversionen. U heißt Mann-Whitney Teststatistik. Man kann aber zeigen, daß \begin{eqnarray}U=\min \{{U}_{x},{U}_{y}\}\end{eqnarray} gilt, d. h., die Teststatistik U ist gleich der Statistik T, sodaß sich der gleiche Test ergibt. Der U-Test findet aufgrund seiner einfachen Durchführbarkeit auch häufig bei normalverteilten Grundgesamtheiten Anwendung. Die asymptotische Effizienz (Testtheorie) des U-Tests gegenüber dem t-Test liegt bei 95%. Dies bedeutet, daß die Anwendung des U-Tests bei n = 100 Werten etwa die gleiche Teststärke aufweist wie die Anwendung des t-Tests bei 0, 95 · 100 = 95 Werten, wenn in Wirklichkeit die Normalverteilung vorliegt.

Beispiel. An zwei Prüfgeräten werden Werkstücke gleichen Materials Dehnungsversuchen unterzogen. Es soll ermittelt werden, ob beide Prüfgeräte gleichmäßig arbeiten, d. h., ob die von beiden Geräten ermittelten Meßwerte gleichen Grundgesamtheiten entstammen. An jedem Gerät werden n1 = n2 = 10 Messungen durchgeführt, und wir erhalten folgende Tabelle der gemessenen Dehnungen und ihrer zugehörigen Rangplätze der gemeinsamen Stichprobe:

Abbildung 1 zum Lexikonartikel <i/>U-Test
© Springer-Verlag GmbH Deutschland 2017
 Bild vergrößern

Mit diesen Daten ergibt sich: \begin{eqnarray}{U}_{x}=80-55=25,\ {U}_{y}=130-55=75\end{eqnarray}

Wir wollen den approximativen Test anwenden. Das Zeichen * markiert eine Bindung im Wert 20, 2, die vierfach in beiden Stichproben auftaucht. Wir verwenden deshalb die korrigierte approximative Testgröße \(\mathop{T}\limits^{\approx}\), für die sich ergibt: \begin{eqnarray}\tilde{\tilde{T}}=\frac{|25-\frac{10\cdot 10}{2}|}{\sqrt{\frac{10\cdot 10}{12\cdot 20\cdot 19}[{20}^{3}-20-4({4}^{2}-1)]}}=1,9.\end{eqnarray}

Mit α = 0.05 und dem Quantil \({z}_{1-\frac{\alpha}{2}}=1,96\) ist \begin{eqnarray}\tilde{\tilde{T}}\lt {z}_{1-\frac{\alpha}{2}},\end{eqnarray} folglich kann H0 nicht abgelehnt werden.

[1] Sachs, L.: Angewandte Statistik. Springer Verlag Berlin Heidelberg New York, 1992.

Lesermeinung

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren
- Prof. Dr. Guido Walz

Partnervideos