T-Test bei Excel unklar !?

Guten Tag,
eine Frage zum T-Test in Excel in Verbindung mit einer Regressionsanalyse:
Ich habe zwei Datenmengen A und B und habe mir die Regressionsgerade dazu ermittelt. Mein Bestimmtheitsmaß R2 ist nur mäßig (~0,3) und jetzt wollte ich mir die Signifikanz der Regression ermitteln.
Warum bekomme ich mit Ttest(A;B;2;2) nahezu das gleiche Ergebnis heraus wie bei Ttest (A;B;2;3) ?
Wie lautet denn die Nullhypothese (in Worten) für die beiden Fälle ?

Vielen Dank im voraus !

Hallo,

was ich nicht verstehe:

zum einen machst du eine Regressionsanalyse (-> linearer Zusammenhang zw. A und B) und dann machst du einen t-Test (-> Unterschiede in den Mittelwerten von A und B). Das passt nicht zusammen! Es kann natürlich sein, dass du das wohl machen willst, dass also sowohl ein linearer Zusammenhang als auch Mittelwertunterschiede von Interesse sind. Ich vermute aber, du wolltest mit dem Test prüfen, ob der beobachtete Zusammenhang (die Korrelation) überzufällig ist (und eben nicht der beobachtete Unterschied der Mittelwerte). Wenn ich recht habe, dann solltest du Pearson’s Korrelationstest verwenden. Das ist im Prinzip ein t-Test (daher vlt. die Verwechlung), aber der t-Wert wird anders berechnet:

t = r*Wurzel((n-2)/(1-r²))

wobei n die Zahl der Datenpaare ist und r² das Bestimmtheitsmaß. Dieser t-Wert ist t-Verteilt mit n-2 Freiheitsgraden. Für einen gegebenen t-Wert samt Freiheitsgraden kann man in Excel mit der Funktion TVERT den zugehörigen p-Wert berechnen.

Warum bekomme ich mit Ttest(A;B;2;2) nahezu das gleiche
Ergebnis heraus wie bei Ttest (A;B;2;3) ?
Wie lautet denn die Nullhypothese (in Worten) für die beiden
Fälle ?

Typ=2 -> Annahme gleicher (Populations-)Varianzen in A und B („Homoskedastizität“)

Typ=3 -> Annahme gleicher Varianzen wird nicht getroffen (Varianzen in A und B dürfen auch ungleich sein, „Heteroskedastizität“)

Der Unterschied in den p-Werten ist relativ gering. Für Typ=3 sind die Werte immer etwas größer. Der Unterschied wird kleiner, wenn die Stichprobenumfänge groß sind.

VG
Jochen

Hi Jochen,

vielen Dank für Deine schnelle Antwort !

Noch eine Frage zum Ergebnis beim Pearson-Test (in excel):
Je näher mein Ergebnis bei Null liegt, desto weniger korrelieren die Werte A und B und desto „nichts-sagender“ ist daher auch meine Regressionsgerade ? (+1 dementsprechend: sehr gute Korrelation und zutreffende Gerade ?)

Und dann noch eine Frage zum T-Test:
Teste ich bei Typ 2 (Annahme gleiche Varianz) und bei Typ 3 (Annahme ungleiche Varianz) evtl. gar nicht die Annahme, sondern die Nullhypothese „Die Datenmengen haben den gleichen Mittelwert !“ ?

Gruß
P.

Tach,

vielen Dank für Deine schnelle Antwort !

Gerne.

Noch eine Frage zum Ergebnis beim Pearson-Test (in excel):
Je näher mein Ergebnis bei Null liegt, desto weniger
korrelieren die Werte A und B und desto „nichts-sagender“ ist
daher auch meine Regressionsgerade ? (+1 dementsprechend: sehr
gute Korrelation und zutreffende Gerade ?)

Meinst du das R² ? Das ist das Bestimmtheitsmaß. R² sagt dir, wie stark A und B korrelieren („Effektstärke“-Maß). Mathematisch sagt es, um wieviel Prozent die Varianz der Y-Werte um die Ausgleichsgerade herum kleiner ist als um einen fixen Mittelwert („Varianzaufklärung durch das lineare Modell“).

Ein Test hingegen berechnet, wie wahrscheinlich man mindestens so große Werte für R² man bei zufälligen Stichproben rein zufällig bekommen würde - unter der Annahme, dass die Variablen in Wahrheit garnicht korreliert sind (das ist die Nullhypothese). Ergebnis ist der p-Wert (p für probability). Ist diese Wahrscheinlichkeit klein, spricht das gegen die Nullhypothese. Liegt sie unterhalb eines festgelegten Signifikanzniveaus, lehnt man die Nullhypothese zu diesem Niveau ab zugunsten der Annahme, dass die Variablen tatsächlich korrelieren (und eben nicht nur -zufälligerweise- die beobachtete Stichprobe).

Und dann noch eine Frage zum T-Test:
Teste ich bei Typ 2 (Annahme gleiche Varianz) und bei Typ 3
(Annahme ungleiche Varianz) evtl. gar nicht die Annahme,
sondern die Nullhypothese „Die Datenmengen haben den gleichen
Mittelwert !“ ?

Es werden immer nur die Nullhypothesen getestet.

Der Pearson-Test testet die Hypothese „die wahre Korrelation ist Null“; der Zweistichproben-t-Test testet die Hypothese „die wahre Differenz der Mittelwerte ist Null“; die Hypothese „die Differenz der Varianzen ist Null“ kann man mit dem F-Test testen. Damit ist auuch hoffentlich klargeworden, warum die Hypothesen immer „Nullhypothesen“ genannt werden :wink:

Jeder Test macht noch mehr oder weniger wichtige Annahmen über die Art der Daten. Beim t-Test und noch wichtiger beim F-Test ist das Ergebnis nur dann sinnvoll, wenn die Daten normalverteilt sind. Kann man das nicht annehmen, so muss man andere Tests nehmen, welche diese Annahmen nicht benötigen. Beim Zweistichproben-t-Test ist eine weitere Annahme, dass die Varianzen gleich sind. Kann man das nicht annehmen, kann man den Test modifizieren. Das ist dann der Welsh-t-Test, was du Excel mit „Typ=3“ sagst.

VG
Jochen

1 „Gefällt mir“

Hi Jochen,

vielen Dank - bin wunschlos glücklich !!

P.