Ich habe aus einer Umfrage nun verschiedene Werte zu bestimmten Items, welche ich nach Altersgruppen erhoben habe.
Vier Altersgruppen habe ich Stichprobenhaft in der Umfrage erfasst, eine fünfte habe ich voll erhoben. Wie kann ich nun statistisch beweisen, inwieweit sich die Ergebnisse der Vollerhebung mit denen aus der Stichprobe decken oder von dieser Abweichen?
Das musst Du denjenigen fragen, der die Studie geplant hat. Am Anfang der Planung stehen die Fragen, dann die Methoden und mithin die Art der Daten. Dementsprechend wird das Verfahren festgelegt, nach dem die erhobenen Daten auszuwerten sind um die Fragen beantworten zu können und es werden die notwendigen Stichprobenumfänge berechnet.
vielen Dank, dass Du mir helfen möchtest. Dummer bzw. glückliche Weise bin ich der Initiator der Umfrage
Die Umfrage selbst wurde für eine recht kleine Grundgesamtheit (
vielen Dank, dass Du mir helfen möchtest. Dummer bzw.
glückliche Weise bin ich der Initiator der Umfrage
-.-
Die Umfrage selbst wurde für eine recht kleine Grundgesamtheit
(Mittelwerte der Scores in den Stichproben oder sind es die (Häufigkeits-)Verteilungen der Scores in den Stichproben? Oder die Mediane oder was ganz anderes? (Wenn ja: was GENAU?)
i.A. kann man statistische Unterschiede zw. Stichproben mit sog. Nullhypothesentests prüfen. Soche Tests berechnen eine Prüfgröße aus den Daten, deren Verteilung für den Fall bekannt ist, dass es sich um Zufallsstichproben handelt aus Grundgesamtheiten, die oft bestimmte, definierte Eigenschaften haben und sich hinsichlich des zu testenen Parameters (zB. dem Mittelwert) NICHT unterscheiden. Anhand dieses bekannten Verteilungsmodells kann berechnet werden, wie wahrscheinlich man unter den gegebenen Bedingungen eine Prüfgröße wie die aus den Stichproben bestimmte erhalten würde. Wenn das hinreichend unwahrscheinlich ist, entscheidet man sich dafür, davon auszugehen, dass die den Stichproben zugrundeliegenden Grundgesamtheiten eben hinsichtlich des getesteten Parameters nicht gleich sind.
Beispiel 1:
Du willst zwei Stichproben hinsichtlich ihres Mittelwertes vergleichen. Sofern die Daten etwa normalverteilt sind, kann man den t-Test nehmen. Der berechnet als Prüfgröße den t-Wert aus dem Quotient „Mittelwertunterschied geteilt durch Standardfehler der Mittelwertdifferenz“ (den Nenner bekommt man über die Standardabweichungen und die Umfänge der Stichproben). Dieser Wert ist unter der Nullhypothese (also: die Stichproben stammen aus Grundgesamtheiten mit dem selben Mittelwert; Unterschiede in den Stichproben sind nur zufallsbedingt [„Stichprobenfehler“]) t-Verteilt mit n1+n2-2 Freiheitsgraden (n1 und n2 sind die beiden Stichprobenumfänge). Für die vorliegenden Daten kann man nun einen empirischen t-Wert berechnen und den unter der Nullhypothese zugehörigen Wahrscheinlichkeitswert („p-Wert“). Wenn p nun hinreichend klein ist (oft
Hi Jochen,
ich hätte auch an einen Permutationstest gedacht, wenn es der Vergleich zweier Stichproben sein soll. ansonsten hast du Recht dass es nur ein 1 Stichprobenfall gegen einen festen Wert ist (ermittelt aus der GG) dieses Konzeot lässt sich aber auch auf andere Tests anwenden.
ansonsten gibt es noch die Endlichkeitskorrektur, die aber wohl nur in der hypergeometrischen Verteilung zum tragen kommt.
als letztes gibt es natürlich das bootstrapping …
Grüße,
JPL