Korrelation interpretieren

Liebe Community,

ich habe zu meinem Anliegen bereits 2 Experten angeschrieben, doch leider keine Antwort erhalten. Daher versuche in es diesmal im Forum, in der Hoffnung das mir jemand helfen kann.

Zu meinem Anliegen: Ich habe eine Umfrage durchgeführt und bin nun dabei die Daten auszuwerten. Gerade habe ich eine Korrelation (bivariat) in SPSS durchgeführt und bekomme auch angezeigt, dass die Korrelation auf dem Niveau von 0,01 (einseitig) signifikant ist.

Ich habe jedoch nun noch Probleme die folgenden Daten zu interpretieren:

Die Korrelation nach Pearson ist ,173
Die Signifikanz ist ,005

Ich habe Probleme mit den Zahlen ,173 und ,005. Was genau heißt das nun? Ich weiß beispielsweise das ein Korrelationskoeffizient von 0,7 eine starke Korrelation aufweist. Ich habe aber 0,173, wenn ich das so richtig interpretiere, oder? Warum sagt mir SPSS dann, dass dies signifikant ist?

Vielen Dank für Eure Hilfe!

Hossa :smile:

Bei einer Korrelation werden zwei gleich große Datenreihen x und y miteinander verglichen:

x_1, x_2, x_3, \ldots, x_n\quad;\quad y_1, y_2, y_3, \ldots, y_n

Im ersten Schritt wird der Mittelwert der Reihen berechnet:

\overline x=\frac{1}{n}\sum\limits_{i=1}^nx_i\quad;\quad\overline y=\frac{1}{n}\sum\limits_{i=1}^ny_i

Dann wird von allen Einzelwerten der Mittelwert subtrahiert und beide Reihen als Vektoren aufgefasst:

\vec x=\left(\begin{array}{c}x_1-\overline x\x_2-\overline x\x_3-\overline x\ \cdots\ x_n-\overline x\end{array}\right)\quad;\quad\vec y=\left(\begin{array}{c}y_1-\overline y\y_2-\overline y\y_3-\overline y\ \cdots\ y_n-\overline y\end{array}\right)

Nun tut man so, als gingen beide Vektoren vom selben Punkt aus und berechnet den Cosinus des Winkels zwischen diesen Vektoren. Dies ist gleich dem Korrelationskoeffizienten r:

r=\cos\angle(\vec x,\vec y)=\frac{\vec x\cdot \vec y}{\left|\vec x\right|\cdot\left|\vec y\right|}=\frac{\sum\limits_{i=1}^n\left(x_i-\overline x\right)\left(y_i-\overline y\right)}{\sqrt{\sum\limits_{i=1}^n\left(x_i-\overline x\right)^2}\cdot\sqrt{\sum\limits_{i=1}^n\left(y_i-\overline y\right)^2}}

Die Korrelation zwischen den beiden Datenreihen ist nun umso höher, je stärker die beiden Datenvektoren in dieselbe Richtung zeigen. Wenn sie parallel sind, ist r=1. Sind sie antiparallel, ist r=-1. Stehen sie senkrecht aufeinander, zeigen sie alles andere als in dieselbe Richtung und korrelieren überhaupt nicht miteinander (r=0).

Die Korrelation nach Pearson ist ,173
Die Signifikanz ist ,005

Dein Korrelationskoeffizient bedeutet, dass der Winkel zwischen den beiden Daten-Vektoren folgenden Wert hat:

\varphi=\angle(\vec x,\vec y)=\arccos®=80.0^o

Die Vektoren stehen also fast senkrecht aufeinander, so dass ihre Korrelation verschwindend gering ist.

Mit anderen Worten, deine Datenreihen korrelieren nur minimal, aber diese minimale Korrelation ist immerhin signifikant :smile:

Viele Grüße

Hasenfuß

Hallo Hasenfuß,

vielen Dank für Deine ausführliche Antwort. Dann habe ich es doch richtig interpretiert, dass die Korrelation nur minimal ist. Wieso sagt mir dann aber SPSS, dass es signifikant ist?

Ich denke, ich habe einfach nicht verstanden, was signifikant bedeutet. Könntest Du mir das kurz erklären?

PS: Eine kurze Frage noch: Wenn ich beispielsweise eine Korrelation von ,755 habe - dann ist das ein Anzeichen dafür, dass es stark korreliert, oder?

Hi,

vielen Dank für Deine ausführliche Antwort. Dann habe ich es
doch richtig interpretiert, dass die Korrelation nur minimal
ist. Wieso sagt mir dann aber SPSS, dass es signifikant ist?

Weil der p-wert (bei dir 0.01) nicht nur von der Stärke der Korrelation abhängt, sondern (u.a.) auch von der Fallzahl: Je größer der Effekt oder je größer die Fallzahl umso wahrscheinlicher erhält man ein signifikantes Ergebnis.

PS: Eine kurze Frage noch: Wenn ich beispielsweise eine
Korrelation von ,755 habe - dann ist das ein Anzeichen dafür,
dass es stark korreliert, oder?

Korrekt. Das Maximum für eine Korrelaton ist 1, da wäre also noch Spielraum nach oben.
Grüße,
JPL

Stell dir vor, du hast zwei Stichproben. Solange die nicht den gleichen Wert aufweisen, ergibt sich immer eine Korrelation von 1 oder -1.

Also eine starke Korrelation, da du aber so eine geringe Stichprobenanzahl hast, kann das ja nicht statistisch signifikant (also eine gesicherte Aussage) sein. Denn, nimm ein paar weitere Stichproben dazu und du bekommst völlig andere Werte für die Korrelation raus.

Was SPSS dir also sagen will ist, dass es nur ein sehr sehr geringe Korrelation gibt und dass die Aussage eben gesichert ist. Also auch wenn du deinen Stichprobenumfang wesentlich erhöhst, wirst du keine großen Änderungen in Korrelation feststellen.

Gruß

Ah, jetzt wird so einiges klar.

Vielen lieben Dank für Eure Hilfe!