Interpretation von Chi²-Test

Guten Tag,

ich schreibe gerade meine Diplomarbeit und bin gelinde gesagt was Statistik betrifft leider ziemlich ahnungslos.
Für meine Arbeit muß ich aber leider sehr viele Auswertungen mit SPSS machen.

Ich habe folgende Auswertung und würde Hilfe bei der Interpretation der Ergebnisse benötigen (Der erste Wert ist Chi, der zweite Wert des assympotischen Signifikanztest aSt, der dritte das Cramersche Assoziationsmaß CA.):

Chi2- Test Zusammenhang zwischen Eigenschaft „Familienunternehmen“ und „Risikobereitschaft“

Frage 15: CHI: 8,544 aSt: 0,201 CA: 0,131
Frage 16: CHI: 2,036 aSt: 0,916 CA: 0,064
Frage 17: CHI: 6,337 aSt: 0,387 CA: 0,113
Frage 18: CHI: 13,460 aSt: 0,036 CA: 0,165

H0 es besteht kein Zusammenhang zwischen Familienunternehmen und Risikobereitschaft
H1 das Gegenteil

Für mich würden die Werte bedeuten, dass es grundsätzlich einen Zusammenhang zwischen den einzelnen Fragen und der Familienunternehmeneigenschaft gibt, weil Chi > 0.
Jetzt muß aber ja noch überprüft werden, ob dieser Zusammenhang echt ist, oder ein Zufall.
Bei einem Signifikanzniveau von 5% für Frage 15,16,17 würde ich meinen, dass H0 gilt und für Frage 18 H1, weil 0,036 kleiner 0,05.
Dem Cramerschen Assoziationsmaß nach besteht aber ein relativ schwacher Zusammenhang.

Stimmt das so, oder ist das vollkommener Blödsinn?

Für jegliche Hilfe bin ich jetzt schon wahnsinnig dankbar!

lG J

Guten Tag,

Frage 15: CHI: 8,544 aSt: 0,201 CA: 0,131
Frage 16: CHI: 2,036 aSt: 0,916 CA: 0,064
Frage 17: CHI: 6,337 aSt: 0,387 CA: 0,113
Frage 18: CHI: 13,460 aSt: 0,036 CA: 0,165

Für mich würden die Werte bedeuten, dass es grundsätzlich
einen Zusammenhang zwischen den einzelnen Fragen und der
Familienunternehmeneigenschaft gibt, weil Chi > 0.

Der Wert von Chi wurde ja anhand empirischer Daten ermittelt. Der theoretisch minimal mögliche Wert con Chi ist Null. Jedes Rauschen in den Daten macht Chi größer. Ein Chi > 0 sagt dir also keinesfalls, dass ein Zusammenhan besteht, sondern nur, dass die Daten wenigstens nicht EXAKT dem theoretischen Modell entsprechen (dazu müßten mitunter zB. GENAU 21.342 Personen in einer Gruppe sein usw., was real ja nicht möglich ist!).

Jetzt muß aber ja noch überprüft werden, ob dieser
Zusammenhang echt ist, oder ein Zufall.

der p-Wert („aSt“) gibt dir die Wahrscheinlichkeit, Chi-Werte, die wenigstens so groß sind wie der beobachtete Wert, zu finden, wenn es eigentlich keinen Zusammenhang gibt und Du nur „Pech“ hattest mit der Stichprobe.

Bei einem Signifikanzniveau von 5% für Frage 15,16,17 würde
ich meinen, dass H0 gilt und für Frage 18 H1, weil 0,036
kleiner 0,05.

Du kannst nie annehmen, dass H0 gilt. H0 ist eine abstraktes Voraussetzung, unter der man einen p-Wert ermitteln kann. Diesen p-Wert kannst Du als Maß für die (empirische) Evidenz GEGEN H0 benutzen, wenn er sehr klein ist. Du kannst ihn aber NICHT als Evidenz für H0 werten, wenn er groß ist. Das liegt daran, dass der p-Wert bei wahrer H0 gleichverteilt ist. Wenn H0 stimmt, dann bekommst Du einen p-Wert zwischen 0.01 und 0.02 mit der SELBEN Wahrscheinlichkeit wie zwischen 0.91 und 0.92.

Sehr simple Allegorie: Unter der Nullhypothese, alle Menschen seinen weiblich, wäre die Nullhypothese abzulehnen, wenn eine männliche Person beobachtet wird. Führt der Test nicht zur Ablehnung von H0 (weil eben tatsächlich eine Frau beobachtet wurde), darf man eben noch lange nicht davon ausgehen, dass nun tatsächlich alles Frauen sind da draußen! An dem Beispiel wird sogar auch klar, dass die Menge an Vertrauen in die Richtigkeit von H0 davon abhängt, wie groß die Stichprobe ist. Beobachtest du 1000 Passanten, und alle 1000 sind weiblich, dann ist das schonmal ein gutes Indiz dafür, dass zumindest die überwiegende Mehrzahl der Menschen weiblich sind.

Für Frage 18 kann man die Nullhypothese auf dem 5%-Signifikanzniveau verwerfen (d.h., die Wahrscheinlichkeit, eine so starke Assoziazion, wie sie in der Stichprobe vorliegt, rein ausgrun von „Stichprobenfehlern“ zu erhalten, ohne dass es tatsächlich eine Assoziation gäbe, ist kleiner als 5%). Das erachtet man i.A. als hinreichende Evidenz H0 zu verwerfen.

Für die anderen Fragen reicht die Evidenz der Daten nicht aus, um die H0’s zu verwerfen.

Dem Cramerschen Assoziationsmaß nach besteht aber ein relativ
schwacher Zusammenhang.

Ja.

Stimmt das so, oder ist das vollkommener Blödsinn?

Eine Sache ist evtl. noch zu beachten:

Wenn jede Frage auf dem 5%-Niveau geprüft wird, dann erwartet man (im Mittel) MINDESTENS 5% signifikannte Ergebnisse (eben WEIL die p-Werte unter H0 ja gleichverteilt sind!). Die Wahrscheinlichkeit, MINDESTENS ein signifikantes Ergebnis zu bekommen, selbst wenn alle H0’s wahr sind (es also nirgendwo enie Assoziention gibt!) ist damit sehr viel größer als 5%!

Wenn die Fragen verschiedene Aspekte abgreifen, ohne dass zu jeder Frage eine wohl-definierte, mit einem Modell begründbare Hypothese vorliegt, dann kann man damit leben.

Wenn die Tests aber so eine Art screening darstellen (irgendeine Assoziation zwischen irgendwas wird doch zu finden sein…), dann ist das inakzeptabel. In diesem Fall musst du gegen multiples Testen korrigieren. Am einfachsten geht das, indem du die H0 nur dann verwirfst, wenn der p-Wert kleiner ist als 0.05 geteilt durch die Anzahl der Tests (->„Bonferroni“).

LG
Jochen