Hallo,
beim t-Test nutzt man die Schätzung der Standardabw. s aus der(den) Stichprobe(n). Man verwendet dann eine t-Verteilung mit entsprechender Anzahl an Freiheitsgraden (d.f.), um den kritischen t-Wert zu ermitteln.
Wenn nun eine Serie gleichartiger oder sehr ähnlicher Experimente gemacht wurden (und die Varianzen zB. lt. F-Test immer gleich sind), kann man für einen neuen Test doch die Schätzungen für s verwenden, die sich aus dem größeren Pool aller Werte ergeben. Damit sollte sich auch die Zahl der d.f. für den Test vergrößern.
Beispiel: Wenn ich einen „normalen“ (einstichproben) t-Test einer Stichprobe vom Umfang n mache, habe ich d.f.=n-1. Schätze ich s aber nicht nur aus dieser Stichprobe, sondern auch noch aus anderen Werten (vom Umfang N [N>n]), dollte d.f. doch größer sein. Für N=unendlich ist die „Schätzung“ von s ja keine mehr und man macht den „Gauss-Test“, was ja im Prinzip ein t-Test mit d.f.=unendlich ist.
Frage: Ist d.f. im Beispiel gleich N-1 oder ist das komplizierter zu berechnen?
LG & Danke schonmal
Jochen
Hi,
plotte mal die t-Verteilung für df=30 und die Normalverteilung.
Du wirst kaum einen Unterschied sehen.
Ich würde sagen, ab n oder N = 30 kann man zur Normalverteilung übergehen.
Gruss,
Hallo Jochen,
Schätze ich s aber nicht nur aus dieser Stichprobe, sondern
auch noch aus anderen Werten (vom Umfang N [N>n]), dollte
d.f. doch größer sein.
das ist der Grund, warum man Kontraste statt t-Tests rechnen sollte. Die Fehlervarianzschätzung beruht auf einer größeren Stichprobe, der Test hat mehr Power und wird eher signifikant.
Frage: Ist d.f. im Beispiel gleich N-1 oder ist das
komplizierter zu berechnen?
df=N-J
J: Anzahl der Gruppen
im Fall der Einstichproben-ANOVA.
Beste Grüße,
Oliver Walter
Hallo Oliver,
Hintergrund ist folgender:
Im Labor wird eine Stichprobe gemessen. Jetzt will man wissen, ob man hinreichend guten Gewissens behaupten kann, ob der Mittelwert von Null verschieden ist.
Aus alten Aufzeichnungen gleicher Messungen an anderen Stichproben findet man deren Stichprobenumfänge und Standardabweichungen. Diese zusätzliche Information soll einfach genutzt werden, um bei der aktuellen Stichprobe die Nullhypothese zu testen.
Wenn also die Ergebnisse von 3 alten Messungen mit je n=5 vorliegen, kann ich dann die gepoolte Varianz der 3 alten plus der aktuellen Messung (mit N = (3+1)*5 = 20) nehmen und ist d.f. = N-J = 20 - (3+1) = 16 die Anzahl der Freiheitsgrade für den Test?
Herzliche Grüße,
Jochen
Hallo Jochen,
so einen Fall habe ich noch nicht gehabt. Spontan würde ich sagen, daß man die Daten der drei Stichproben zusammenwerfen sollte, so daß auch die Mittelwertsberechnung auf allen Daten beruht.
Beste Grüße,
Oliver
Hallo nochmal,
so einen Fall habe ich noch nicht gehabt. Spontan würde ich
sagen, daß man die Daten der drei Stichproben zusammenwerfen
sollte, so daß auch die Mittelwertsberechnung auf allen Daten
beruht.
Die Stichproben haben alle (begründbar) unterschiedliche Mittelwerte. Ein Zusammenwerfen der Stichproben für die gemeinsame Mittelwertbildung macht hier keinen Sinn (siehe PS, wenn’s interessiert). Es geht nur darum, die Power des Tests für _eine bestimmte_ Stichprobe zu erhöhen, indem die Information über die (bei allen Stichproben ähnliche) Varianz von mehreren Stichproben verwendet wird.
Also, ist die Erhöhung der d.f. auf N-J oder gar auf N möglich/gerechtfertigt oder sollte man es ganz anders machen oder gar besser sein lassen? Was sagt der Fachmann?
Danke schonmal für die Hilfe!!
Liebe Grüße,
Jochen
PS: Es geht konkret um die Messung der Genexpression. Man misst Werte bei n Individuen pro interessierendes Gen, relativ zu einer Referenz. Jetzt will man wissen, ob dieses Gen (im Mittel) anders exprimiert wird als bei der Referenz. Die Messwerte sind etwa normalverteilt und natürlich abhängig vom betrachteten Gen. Die inter-individuelle Varianz (inkl. Messvarianz) ist für jedes Gen etwa gleich. Es ist also unsinnig, eine mittlere Expression für ein Sammelsurium unterschiedlicher Gene zu bestimmen. Trotzdem sollte aber doch die Information über die Varianz von allen Genen gemeinsam genutzt werden können, um die Power für die einzelnen Tests zu erhöhen. Oder? Und wenn ja, wie?
Hallo Jochen,
Also, ist die Erhöhung der d.f. auf N-J
ja, in dem Fall würde ich die Varianzschätzung auf Basis aller Stichproben durchführen und die Zahl der Freiheitsgrade mit N-J annehmen.
Beste Grüße,
Oliver
1 „Gefällt mir“