Hallo!
Ich möchte jetzt wissen, ob das Ergebnis signifikant ist oder
nicht und woran ich das erkenne!
Was heist denn „signifikant“?
Du hast eine Fragestellung, die du als Hypothese formulieren kannst. Bein Chi²-Test ist das die Hypothese, dass die verglichenen Häufigkeitsverteilungen irgendwie unterschiedlich sind.
Eigentlich interessiert dich dabei die „Ursache“ der beobachteten Häufigkeitsverteilungen. Also: Sind da unterschiedliche Prozesse am Werk, die eben unterschiedliche Häufigkeitsverteilungen erzeugen?
Die Prozesse selbst kannst du nicht direkt sehen. Aber du kannst Stichproben nehmen, die durch diese Prozesse entstanden sind. Leider sind Stichproben aber fast nie identisch, wegen ihrer zufälligen Natur unterscheiden sich zwei Stichproben wahrscheinlich auch dann mehr oder weniger, selbst wenn der zugrunde liegende Prozess derselbe war.
Jetzt kommt die Statistik ins Spiel: Die erlaubt es nähmlich, abzuschätzen, wie wahrscheinlich es ist, dass sich zwei zufällige Stichproben mindestens so stark voneinander unterscheiden wie die tatsächlich beobachteten, WENN der zugrunde liegende Prozess tatsächlich DERSELBE ist.
Diese Wahrscheinlichkeit nennt der Statistiker mitunter auch „Signifikanz“. Das ist also eine Wahrscheinlichkeit, mind. so „extreme“ Ergebnisse zu bekommen wie die, die gemessen/beobachtet wurden, rein wegen ZUFÄLLIGER Schwankungen („Stichprobenfehler“). Die Hypothese, dass alle beobachteten unterschiede/Effekte rein zufällig sind und NICHTS mit echten Unterschieden in den Prozessen zu tun haben, nennen Statistiker auch „Null-Hypothese“.
Ein statistischer Test berechnet die Wahrscheinlichkeit, die beobachteten Daten (oder noch „extremere“) unter der Null-Hypothese zu erhalten. Diese Wahrscheinlichkeit wird „Signifikanz“ genannt.
Hohe Werte bedeuten, dass man SEHR WAHRSCHEINLICH solche Ergebnisse bekommt, wenn die Nullhypothese wahr ist (also wenn die Prozesse gleich sind, wenn sich die Populationen, aus denen die Stichproben genommen wurden, NICHT unterscheiden). Niedrige Werte sagen, dass es eben unwahrscheinlich ist, bei in Wahrheit gleichen Populationen derart unterschiedliche Stichproben zu bekommen.
Nun musst du dich aufgrund dieser Wahrscheinlichkeit/Signifikanz entscheiden, ob du die Nullhypothese aufgrund deiner Daten verwirfst (zugunsten der alternativen Hypothese, dass sich die Populationen/Prozesse tatsächlich unterscheiden). Wenn du das IMMER machst (also die Nullhypothese verwerfen), wenn diese Wahrscheinlichkeit kleiner ist als, sagen wir mal 5%, dann wird im ungünstigsten Fall jede 20. Entscheidung gegen die Nullhypothese falsch sein. Diese „5%“ (oder ein anderer festgelegter Wert) nennen sich dann das „Signifikanzniveau“ und immer, wenn die vom Test ermittelte Wahrscheinlichkeit (auch „p-Wert“ genannt von probability) unter diesem Wert liegt, wird das Ergebnis als „statistisch Signifikant“ ausgewiesen, was bedeutet, dass die Nullhypothese auf dem angegebenen Signifikanznievau verworfen wurde.
In den Sozialwissenschaften und der bio- u. medizinischen Forschung sind diese 5% das übliche Signifikanzniveau. In seltenen Fällen sieht man die Sache lockerer und setzt sich 10% als Grenze. In wichtigen Sachen wie Arzneimittelprüfungen usw. wird das Niveau strenger gesetzt, bis in den Promille-Bereich.
Dieses „zweiseitig“, wass SPSS für den Chi²-Test dazuschreibt, kannst du ignorieren. Es ist beim Chi²-Test nicht sinnvoll, „einseitige“ und „zweiseitige“ Signifikanzen zu vergleichen.
„Asymptotisch“ steht da, weil die Signifikanzen nicht exajkt berechnet wurden, sondern es wurde ein mathematisches Modell verwendet, welches die echte Verteilung nur so ungefähr beschreibt. Das passt ganz gut, solange ein paar Bedingungen erfüllt sind. Eine davon ist zB. dass die „erwarteten Häufigkeiten“ in allen Zellen größer sind als 5. Das ist bei dir nicht der Falll, darum warnt dich SPSS mit dem letzten Sprüchlein. Man kann das verhindern, indem man Zellen mit wenigen Werten zusammenfasst.
Noch besser wäre es, Fishers Exakten Test zu verwenden. Der rechnet zum einen nicht asymptotisch und zum anderen funktioniert der auch korrekt, wenn Zellen mit wenigen oder gar keinen Werten in den Tabellen sind.
VG
Jochen