SPSS: Chi-Quadrat Homogenitätstest?

Hallo Zusammen,

Ich sitze gerade an meiner Diplomarbeitsauswertung vor einem Problem und würde mich freuen, wenn mir jemand da weiterhelfen könnte. Ich habe in meinem experimentellen Design Probanden auf zwei Manipulationsgruppen aufgeteilt und möchte nun untersuchen, ob die Gruppen sich in bestimmten Ausgangswerten (u.a.demographischen Variablen)unterscheiden. Für alle intervallskalierten Variablen berechne ich t-Tests für unabhängige Stichproben, aber was mache ich mit den nominalskalierten (Geschlecht, Schulabschluss usw.)? Da müsste ich doch prinzipiell einen Chi-Quadrat-Homogenitätstest rechnen, da Mann-Whithney U und K-S-Test stetige Verteilungsfunktionen voraussetzen, oder? In SPSS kann man den nicht rechnen, oder? Gibt es eine Alternative?

Liebe Grüße!

Hi Teresa

Ich sitze gerade an meiner Diplomarbeitsauswertung vor einem
Problem und würde mich freuen, wenn mir jemand da weiterhelfen
könnte. Ich habe in meinem experimentellen Design Probanden
auf zwei Manipulationsgruppen aufgeteilt und möchte nun
untersuchen, ob die Gruppen sich in bestimmten Ausgangswerten
(u.a.demographischen Variablen)unterscheiden. Für alle
intervallskalierten Variablen berechne ich t-Tests für
unabhängige Stichproben, aber was mache ich mit den
nominalskalierten (Geschlecht, Schulabschluss usw.)? Da müsste
ich doch prinzipiell einen Chi-Quadrat-Homogenitätstest
rechnen, da Mann-Whithney U und K-S-Test stetige
Verteilungsfunktionen voraussetzen, oder? In SPSS kann man den
nicht rechnen, oder? Gibt es eine Alternative?

ich hoffe, andere haben verstanden, was du meinst. Ich verstehe nur Bahnhof, ich habe mich allerdings auch kaum mit Statistik befasst.
Gut gemeinter Rat: wenn du hier keine zielführende Antwort bekommst, versuch mal dein Glück in einem auf Statistik spezialisierten Forum, zB
http://statistikforum.foren-city.de/forum,19,-spss.html
http://www.forumromanum.de/member/forum/forum.php?ac…
http://spssforum.com/

Gruss
ExNicki

Hallo,

Für alle
intervallskalierten Variablen berechne ich t-Tests für
unabhängige Stichproben,

Evtl. prüfen, ob die Varianzen grob unterschiedlich sind -> Welsh t-Test.

aber was mache ich mit den
nominalskalierten (Geschlecht, Schulabschluss usw.)? Da müsste
ich doch prinzipiell einen Chi-Quadrat-Homogenitätstest
rechnen,

Ja. Bei ausreichenden Stichprobenumfängen (Erwartungswert pro Zelle >= 5) hat der z-Test („approximativer Binomialtest“) auf Unterschiede in Anteilswerten eine höhere Power (s. http://www.stat.uni-muenchen.de/stablab/Biometrie_Ve…, Seite 8f.).

Es ginge auch Fischers exakter Test, der dem Chi²-Test sehr ähnliche Ergebnisse liefert, allerdings bei sehr kleinen Stichproben zuverlässiger ist.

da Mann-Whithney U und K-S-Test stetige
Verteilungsfunktionen voraussetzen, oder?

Ja. Der MWU-Test ist das Äquivalent zum t-Test, wenn die Voraussetzung der Normalverteilung der Mittelwerte nicht gegeben ist, die zwei Stichproben aber bis auf den Lageparameter die gleichen Verteilungen haben). Der KS-Test ist das Äquivalent zum Chi²-Test.

Achtung:
Du untersuchst mehrere (viele) Variablen auf mögliche Unterschiede. Das ist ein „screening“. Je mehr Variablen Du untersuchst, desto wahrscheinlicher wirst Du rein zufällig mal ein signifikantes Ergebnis erhalten. Das muss man unbedingt berücksichtigen. Die wohl einfachte Möglichkeit für Dich, dem rechnung zu tragen, ist die Korrektur der p-Werte ("Adjustierung für multiples Testen). Am einfachsten ist die Methode nach Bonferroni. Die ist aber sehr konservativ, insbesondere, wenn die Zahl der Tests groß ist. Besser ist Bonferroni-Holm. Siehe zB. http://webber.physik.uni-freiburg.de/~jeti/studenten… oder http://www.computerbase.de/lexikon/Alphafehler-Kumul… oder http://www.biostat.uzh.ch/teaching/master/methods200… oder selbst suchen.

Alternativ kann man auch eine multivariate Analyse über allgemeine Lineare Modelle machen. Damit wäre auch die Untersuchung von Korrelationsstrukturen, wechselseitigen Abhängigkeiten und Interaktionen zwischen den verschiedenen Variablen möglich bzw. integriert.

In SPSS kann man den
nicht rechnen, oder?

Ich habe SPSS nicht, aber es würde mich wundern, wenn’s damit nicht ginge.

Gibt es eine Alternative?

Freilich. R zum Bleistift (http://r-project.org).

Liebe Grüße!

Dito,
Jochen

Hi Teresa,

zu den schon sehr ausführlichen anmerkungen von Jo - die du auf jeden Fall beherzigen solltest, bevor du mein Geschreibsel „anwendest“ - noch ein paar (statistisch) theoretische:

Du musst dir neben der Methode die du anwendest auch den Sinn dahinter klar machen. Was ist die Konsequenz, wenn Baselinewerte sich unterscheiden? Das kommt vor allem auf die zu untersuchende Variable an. Wenn z.B. das Musik-Konsumverhalten von Menschen untersucht wird und der Unterschied ist 1.5 Jahre, dann wäre dies immer relevant (egal ob stat. signigofkant), wenn die eine Altersgruppe im Mittel 12 und die andere 13.5 Jahre alt ist. Immer irrelevant wäre es (egal ob auch stat. signigfikant), wenn die eine Gruppe 30 und die andere 31.5 Jahre alt ist.
Ein sign. Ergebnis zeigt dir aber immer, dass deine Randomisierung nicht funktioniert hat. Demzufolge hast du einen möglichwerweise stat. entscheidenden Faktor indentifiziert, der bei Nichteinschluß in dein späteres Modell dir deinen treatment-Effekt nicht mehr signifikant macht [die Hinzunahme eines weiteren Faktors reduziert die Streuung der Residuen, wodurch der Anteil der der erklärten Streuung durch dein treatment größer wird].
Jetzt kannst du natürlich alle Faktoren, in denen sich die Baseline unterscheidet mit in das Modell aufnehmen. Das muss aber nicht notwendigerweise den treatment-Effekt sig. machen und kann sogar inhaltlich totaler Quatsch sein (dann würde aber eigentlich schon das testen der Bseline-Werte sinnlos sein).
Das Spielchen und die Konsequenezne sind also keineswegs so einfach, wie es aussieht.
Da du eine experimentelle Studie machst, kannst du sie auch zur Modellwahl verwenden, was aber nicht unbedingt eine leichte Aufagabe ist.
Viele Grüße,
JPL