Direkt zum Inhalt

Lexikon der Mathematik: Pearsonscher Korrelationskoeffizient

ein Maß für die Stärke des linearen Zusammenhangs zwischen zwei proportionalitätsskalierten zufälligen Merkmalen X und Y.

Der Pearsonsche Korrelationskoeffizient basiert auf der Kovarianz cov(X, Y) und ist wie folgt definiert: \begin{eqnarray}{\varrho }_{xy}=\frac{{cov}(X,Y)}{\sqrt{V(X)}\sqrt{V(Y)}}.\end{eqnarray}ϱxy wird auch als einfacher oder totaler Korrelationskoeffizient zwischen X und Y bezeichnet. Es gilt −1 ≤ ϱxy ≤ 1. Das Vorzeichen deutet auf einen positiven (gleichläufigen) oder negativen (gegenläufigen) Zusammenhang hin. Ist ϱxy = 1, so liegen alle Beobachtungen von (X, Y) auf einer Geraden mit positivem Anstieg, ist ϱxy = −1, so liegen alle Beobachtungen von (X, Y) auf einer Geraden mit negativem Anstieg. ϱxy sagt nichts über die Art des Zusammenhangs zwischen X und Y aus, falls er nicht linear ist.

Ist ϱxy = 0, so bezeichnet manX und Y als unkorreliert. Für stochastisch unabhängige Merkmale gilt wegen cov(X, Y) = 0 auch ϱxy = 0. Dagegen folgt aus ϱxy = 0 nicht die stochastische Unabhängigkeit von X und Y.

Es sei ((X1, Y1),…,(Xn, Yn)) eine mathematische Stichprobe von (X, Y). Eine Punktschätzung für die Korrelation ϱxy zwischen X und Y liefert der sogenannte empirische Korrelationskoeffizient bzw. Stichprobenkorrelationskoeffizient \begin{eqnarray}\hat{\varrho }=\frac{\displaystyle {\sum }_{i=1}^{n}({X}_{i}-\bar{X})({Y}_{i}-\bar{Y})}{\sqrt{\displaystyle {\sum }_{i=1}^{n}{({X}_{i}-\bar{X})}^{2}\displaystyle {\sum }_{i=1}^{n}{({Y}_{i}-\bar{Y})}^{2}}}\end{eqnarray} mit \(\bar{X}=\frac{1}{n}\displaystyle {\sum }_{i=1}^{n}{X}_{i}\) und \(\bar{Y}=\frac{1}{n}\displaystyle {\sum }_{i=1}^{n}{Y}_{i}\), der ebenfalls üblicherweise als Pearsonscher Korrelationskoeffizient bezeichnet wird. Auf der Basis von \(\hat{\varrho }\) ist ein t-Test zum Prüfen der Hypothese \begin{eqnarray}\begin{array}{rl}{H}_{o} & :{\varrho }_{xy}=0\,\,\,\,(X\,\text{und}\,Y\,\text{sind}\,\text{unkorreliert})\\ \text{gegen}\,{H}_{1} & :{\varrho }_{xy}\ne 0\end{array}\end{eqnarray} entwickelt worden. Ist mindestens eine der beiden Zufallsgrößen X und Y nicht proportionalitäts-, sondern nur ordinalskaliert (Skalentypen), so verwendet man als Schätzung für den einfachen Korrelationskoeffizienten ϱxy anstelle des Pearsonschen Korrelationskoeffizienten einen Rangkorrelationskoeffizienten, zum Beispiel den Spearmanschen Korrelationskoeffizienten.

(Siehe hierzu auch Korrelationsanalyse, Korrelationskoeffizient, Rangkorrelationsanalyse).

Lesermeinung

Wenn Sie inhaltliche Anmerkungen zu diesem Artikel haben, können Sie die Redaktion per E-Mail informieren. Wir lesen Ihre Zuschrift, bitten jedoch um Verständnis, dass wir nicht jede beantworten können.

  • Die Autoren
- Prof. Dr. Guido Walz

Partnervideos