U-Test

Lexikon der Mathematik: U-Test

von Mann und Withney 1947 entwickelter verteilungsfreier (nichtparametrische Statistik) Signifikanztest zum Prüfen, ob zwei unabhängige Stichproben aus Grundgesamtheiten mit gleicher Verteilungsfunktion stammen. Er wird angewendet, wenn die Stichproben nichtnormalverteilten Grundgesamtheiten entstammen oder nur ordinalskaliert (Skalentypen) vorliegen.

Seien X und Y zwei Zufallsgrößen mit den Verteilungsfunktionen F_X und F_Y, und seien \(({X}_{1},\ldots,{X}_{{n}_{1}}),\ ({Y}_{1},\ldots,{Y}_{{n}_{2}})\) Stichproben von X und Y vom Umfang n₁ und n₂. Der U-Test ist ein spezieller Rangtest zum Prüfen ein- und zweiseitiger Hypothesen:

a) zweiseitig :

H₀ : F_X = F_Y gegen H₁ : F_X ≠ F_Y

b) einseitig :

H₀ : F_x(x) ≥ F_y (x) gegen

H₁ : F_X(x) ≤ F_Y (x)

und < für mindestens ein x

c) einseitig

H₀ : F_X(x) ≤ F_Y (x) gegen

H₁ : F_X(x) ≥ F_Y (x)

und > für mindestens ein x

Zur Berechnung der Teststatistik des Tests wird zunächst für die vereinigte Stichprobe \(({X}_{1},\ldots,{X}_{{n}_{1}},\ {Y}_{1},\ldots,{Y}_{{n}_{2}})\) eine gemeinsame aufsteigende Rangplatzreihe (geordnete Stichprobe) gebildet. Aus dieser Rangplatzzuordnung werden die beiden Teilsummen R_x und R_y der der Rangplatzzahlen, die zu den Stichprobenelementen von X und Y gehören, gebildet. Die Teststatistik des U-Test ist \begin{eqnarray}T=\min ({U}_{x},{U}_{y})\end{eqnarray} mit \begin{eqnarray}{U}_{x}={R}_{x}-\frac{({n}_{1}+1){n}_{1}}{2},\ {U}_{y}={R}_{y}-\frac{({n}_{2}+1){n}_{2}}{2}.\end{eqnarray}

H₀ wird abgelehnt, falls der Wert von T bei vorgegebenen α im Ablehnebereich der U-Verteilung liegt, d. h., die Entscheidungsregeln lauten:

a) H₀ wird verworfen, falls \(|T|\ \gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\frac{\alpha}{2})\)

b) H₀ wird verworfen, falls \(T\gt \ {U}_{{n}_{1},\ {n}_{2}}(1-\alpha)\)

c) H₀ wird verworfen, falls \(T\lt \ {U}_{{n}_{1},\ {n}_{2}}(\alpha)\)

\({U}_{{n}_{1},\ {n}_{2}}(p)\) ist das p-Quantil (Quantil) der U-Verteilung. Diese Quantile sind z.B. in [1] tabelliert.

Es gilt U_x + U_y = n₁n₂. Wenn H₀ gilt, so müssen beide Teilsummen etwa gleich groß sein und folglich \(T\approx \frac{{n}_{1}{n}_{2}}{2}\) gelten. Auf dieser Basis wird häufig anstelle des eben beschriebenen exakten Tests ein approximativer Test durchgeführt. Bei diesem wird anstelle von T die Teststatistik \begin{eqnarray}\tilde{T}=\frac{|T-\frac{{n}_{1}{n}_{2}}{2}|}{\sqrt{\frac{{n}_{1}{n}_{2}({n}_{1}+{n}_{2}+1)}{12}}}\end{eqnarray} verwendet. \(\tilde{T}\) ist approximativ standardnormalverteilt, eine ausreichende Güte der Approximation ergibt sich für n₁ + n₂ ≥ 20, n₁ ≥ 8, n₂ ≥ 8. Die Entscheidungsregeln in diesem Fall lauten:

a) H₀ wird verworfen, falls \(|\tilde{T}|\ \gt \ {z}_{1-\frac{\alpha}{2}}\)

b) H₀ wird verworfen, falls \(\tilde{T}\ \gt \ {z}_{1-\alpha}\)

c) H₀ wird verworfen, falls \(\tilde{T}\lt \ {z}_{\alpha}\)

z_p ist hierbei das p–Quantil der Standardnormalverteilung. Treten in beiden Stichproben gleiche Werte (Bindungen) auf, dann erhalten alle diese Werte bei der Rangplatzzuordnung den gleichen mittleren Rangplatz zugewiesen. Enthalten solche Bindungen Werte beider Stichproben, dann ist eine Korrektur der Prüfgröße \(\tilde{T}\ \) notwendig, die sich wie folgt berechnet: \begin{eqnarray}\tilde{\tilde{T}}=\frac{|T-\frac{{n}_{1}{n}_{2}}{2}|}{\sqrt{\frac{{n}_{1}{n}_{2}}{12n(n-1)}[{n}^{3}-n-\displaystyle \sum t({t}^{2}-1)]}}\end{eqnarray}

Dabei ist n = n₁ + n₂, und t bezeichnet die Auftrittshäufigkeit ranggleicher Beobachtungen aus beiden Stichproben.

Die o.g. Hypothesen a) bis c) erstrecken sich auch auf entsprechende Hypothesen über die Gleichheit zentraler Parameter der beiden Verteilungsfunktionen F_X und F_Y, wie z. B. die Gleichheit der Mediane oder der Erwartungswerte von X und Y. In diesen Fällen wird der U-Test analog angewendet. Der so beschriebene Test wird häufig auch als Rangsummentest von Wilcoxon für unabhängige Stichproben bezeichnet. Mann und Whitney haben ursprünglich zur Berechnung der Teststatistik zum Prüfen obiger Hypothesen folgendes Vorgehen vorgeschlagen. Man ordne die gemeinsame Stichprobe in aufsteigender Reihenfolge, und verwende als Teststatistik U = Anzahl aller Paare (x_i, y_j) in der gemeinsamen geordneten Stichprobe, für die gilt: x_i< y_j. Ein solches Paar (x_i, y_j) mit x_i< y_j bezeichnet man auch als Inversion. Die U-Test-Statistik ist also gleich der Summe aller Inversionen. U heißt Mann-Whitney Teststatistik. Man kann aber zeigen, daß \begin{eqnarray}U=\min \{{U}_{x},{U}_{y}\}\end{eqnarray} gilt, d. h., die Teststatistik U ist gleich der Statistik T, sodaß sich der gleiche Test ergibt. Der U-Test findet aufgrund seiner einfachen Durchführbarkeit auch häufig bei normalverteilten Grundgesamtheiten Anwendung. Die asymptotische Effizienz (Testtheorie) des U-Tests gegenüber dem t-Test liegt bei 95%. Dies bedeutet, daß die Anwendung des U-Tests bei n = 100 Werten etwa die gleiche Teststärke aufweist wie die Anwendung des t-Tests bei 0, 95 · 100 = 95 Werten, wenn in Wirklichkeit die Normalverteilung vorliegt.

Beispiel. An zwei Prüfgeräten werden Werkstücke gleichen Materials Dehnungsversuchen unterzogen. Es soll ermittelt werden, ob beide Prüfgeräte gleichmäßig arbeiten, d. h., ob die von beiden Geräten ermittelten Meßwerte gleichen Grundgesamtheiten entstammen. An jedem Gerät werden n₁ = n₂ = 10 Messungen durchgeführt, und wir erhalten folgende Tabelle der gemessenen Dehnungen und ihrer zugehörigen Rangplätze der gemeinsamen Stichprobe:

Abbildung 1 zum Lexikonartikel <i/>U-Test — © Springer-Verlag GmbH Deutschland 2017
Bild vergrößern

Mit diesen Daten ergibt sich: \begin{eqnarray}{U}_{x}=80-55=25,\ {U}_{y}=130-55=75\end{eqnarray}

Wir wollen den approximativen Test anwenden. Das Zeichen * markiert eine Bindung im Wert 20, 2, die vierfach in beiden Stichproben auftaucht. Wir verwenden deshalb die korrigierte approximative Testgröße \(\mathop{T}\limits^{\approx}\), für die sich ergibt: \begin{eqnarray}\tilde{\tilde{T}}=\frac{|25-\frac{10\cdot 10}{2}|}{\sqrt{\frac{10\cdot 10}{12\cdot 20\cdot 19}[{20}^{3}-20-4({4}^{2}-1)]}}=1,9.\end{eqnarray}

Mit α = 0.05 und dem Quantil \({z}_{1-\frac{\alpha}{2}}=1,96\) ist \begin{eqnarray}\tilde{\tilde{T}}\lt {z}_{1-\frac{\alpha}{2}},\end{eqnarray} folglich kann H₀ nicht abgelehnt werden.

[1] Sachs, L.: Angewandte Statistik. Springer Verlag Berlin Heidelberg New York, 1992.

Lexikon der Mathematik: U-Test

Schreiben Sie uns!

Artikel zum Thema

Freistetters Formelwelt: Wo beginnt der Norden?

Christian Spannagel: Der Thaleskreis mit Geogebra

Informatik: Bahnbrechender Beweis entkräftet bisherige Annahmen über Speicherplatz

Topologische Materialien: Exotischer Quantenzustand alltäglicher als gedacht

Themenkanäle

Das Digital-Manifest

Die neue Generation von Computern

Quantenphysik

SponsoredPartnerinhalte