Hallo,
Für alle
intervallskalierten Variablen berechne ich t-Tests für
unabhängige Stichproben,
Evtl. prüfen, ob die Varianzen grob unterschiedlich sind -> Welsh t-Test.
aber was mache ich mit den
nominalskalierten (Geschlecht, Schulabschluss usw.)? Da müsste
ich doch prinzipiell einen Chi-Quadrat-Homogenitätstest
rechnen,
Ja. Bei ausreichenden Stichprobenumfängen (Erwartungswert pro Zelle >= 5) hat der z-Test („approximativer Binomialtest“) auf Unterschiede in Anteilswerten eine höhere Power (s. http://www.stat.uni-muenchen.de/stablab/Biometrie_Ve…, Seite 8f.).
Es ginge auch Fischers exakter Test, der dem Chi²-Test sehr ähnliche Ergebnisse liefert, allerdings bei sehr kleinen Stichproben zuverlässiger ist.
da Mann-Whithney U und K-S-Test stetige
Verteilungsfunktionen voraussetzen, oder?
Ja. Der MWU-Test ist das Äquivalent zum t-Test, wenn die Voraussetzung der Normalverteilung der Mittelwerte nicht gegeben ist, die zwei Stichproben aber bis auf den Lageparameter die gleichen Verteilungen haben). Der KS-Test ist das Äquivalent zum Chi²-Test.
Achtung:
Du untersuchst mehrere (viele) Variablen auf mögliche Unterschiede. Das ist ein „screening“. Je mehr Variablen Du untersuchst, desto wahrscheinlicher wirst Du rein zufällig mal ein signifikantes Ergebnis erhalten. Das muss man unbedingt berücksichtigen. Die wohl einfachte Möglichkeit für Dich, dem rechnung zu tragen, ist die Korrektur der p-Werte ("Adjustierung für multiples Testen). Am einfachsten ist die Methode nach Bonferroni. Die ist aber sehr konservativ, insbesondere, wenn die Zahl der Tests groß ist. Besser ist Bonferroni-Holm. Siehe zB. http://webber.physik.uni-freiburg.de/~jeti/studenten… oder http://www.computerbase.de/lexikon/Alphafehler-Kumul… oder http://www.biostat.uzh.ch/teaching/master/methods200… oder selbst suchen.
Alternativ kann man auch eine multivariate Analyse über allgemeine Lineare Modelle machen. Damit wäre auch die Untersuchung von Korrelationsstrukturen, wechselseitigen Abhängigkeiten und Interaktionen zwischen den verschiedenen Variablen möglich bzw. integriert.
In SPSS kann man den
nicht rechnen, oder?
Ich habe SPSS nicht, aber es würde mich wundern, wenn’s damit nicht ginge.
Gibt es eine Alternative?
Freilich. R zum Bleistift (http://r-project.org).
Liebe Grüße!
Dito,
Jochen