Hallo,
Es geht um einen t-test bei einer unabhängigen Stichprobe.
Ich möchte einen Unterschied prüfen.
Wenn du EINE Stichprobe hast, macht es keinen Sinn, un „Unabhängigkeit“ zu sprechen. Unabhängigkeit kann nur zwischen verschiedenen Stichproben bestehen.
Wenn du EINE Stichprobe hast, hannst du testen, ob der Mittelwert der Population, aus dem die Stichprobe stammt, verschieden ist zu einem gegebenen Wert.
Wenn du ZWEI Stichproben hast, kannst du testen, ob beide Stichproben aus Populationen mit verschiedenen Mittelwerten stammen.
Jetzt muss ja für den t - test die Normalverteilung gegeben
sein.
Die Anforderung ist etwas schächer: Die Verteilung der Daten soll nicht stark von einer Normalverteilung abweichen. Bei sehr großen Stichproben ist auch das praktisch egal.
Was genau bedeutet das denn?
Die Population (von Werten), aus denen deine Stichprobe stammt, besteht aus (unendlich vielen) verschiedenen Werten. Die Werte streuen mit einer bestimmten (aber unbekannten) Varianz um einen bestimmten (aber unbekannten) Mittelwert. Diese Verteilung läßt sich mathematisch durch ein Verteilungsmodell (hier: die Normalverteilung) beschreiben. Würde man ein Histogramm der Daten erstellen, dann ist es glockenförmig und symmetrisch um den Mittelwert, 63% aller Werte liegen zwischen dem Mittelwert plusminus eine Standardabweichung, 95% liegen zwischen Mittelwert plusminus zwei Standardabweichungen. Für kontinuierliche Werte wird so ein Histogramm durch die Wahrscheinlichkeitsdichte beschrieben (das ist für die Normalverteilung diese besagte Glockenkurve). Die Formel dafür findest du in allen möglichen Statistikbüchern, Statistik-Seiten und natürlich bei Wikipedia.
Was teste ich auf Normalverteilung?
Die Verteilung deiner Daten (aus deinen Stichproben).
Das Problem beim Test ist aber: Bei KLEINEN Stichproben kann man keine statistisch abgesicherte Aussage darüber treffen, ob evtl. beobachtete Abweichungen zur Normalverteilung prinzipieller oder zufälliger natur sind und bei zu GROSSEN Stichproben schafft man fast immer den statistischen Nachweis, dass die (meist vernachlässigbar kleinen) Abweichungen prinzipieller Natur sind (die Daten also nicht aus einer Normalverteilten Population stammen).
Angenommen ich habe als unabhängige Variable das Geschlecht.
Dan nehme ich an, du hast ZWEI Stichproben: a) Weiblein und b) Männlein.
(Gruppenvariable) und will schauen ob sich hinsichtlich
irgendeiner metrisch skalierten Variable (mir fällt gerade
nichts ein) unterschieden?
ZB. die Körpergröße, oder Blutduck, oder Gewicht, oder Zeit im 100m-Lauf, oder …
Was gebe ich in SPSS dann in dem KS test ein? (Mit dem sollen
wir auf NV prüfen?)
Die Werte, die du hast.
gucke ich dann ob die abhängige variable normalverteilt ist?
Ja.
Oder füge ich die unabhängige (Gruppenvariable) in den KS Test
ein?
Nein. Die UV dient ja „nur“ dazu, die Werte in (zwei) Gruppen einzuteilen. Du müsstest den KS-Test für die (beiden) Gruppen getrennt machen.
Was genau muss für den T Test metrisch skaliert sein?
die abhängige Variable ist mir klar.
Ja.
Aber muss die unabhängige wie zb zwischen Geschlechtern auch
metrisch skaliert sein? Weil geschlecht ist ja nominal…
Die UV *IST* das Geschlecht. Diese Variable ist hier zB. nominal skaliert und kann die Werte „Weiblich“ und „männlich“ annehmen.
Wenn deine UV auch metrisch skaliert ist, dann kannst du keinen t-Test mache, weil du anhand einer metrischen UV keine Gruppen einteilen kannst (höchstens durch Klassifikation, mit der du die metrische UV aber nur wieder in eine nominale runterbrichst; Bsp. Einkommen in € [=metrisch], aber eingeteilt in die Gruppen „wenig“ und „viel“ [=nominal]), sondern stattdessen zB. eine Korrelation testest oder eine Regression machst.
VG
Jochen