Von einer Zufallsprobe auf eine Grundgesamtheit

enrie · 12. Dezember 2010 um 10:06

Hallo

ich habe folgendes Problem:

Ich habe eine Zufallsstichprobe aus einer Grundgesamtheit genommen. Diese Probe wurde quantifiziert (gut, schlecht, keine aussage möglich). Wie kann ich nun von dieser Stichprobe auf die Grundgesamtheit Rückschlüsse ziehen?

Grundgesamtheit: 1430 Stück
Stichprobe: 280 Stück
Davon gut: 50 Stück
schlecht: 190 Stück
keine aussage: 40 Stück

Grüße

Jo1_a88223 · 12. Dezember 2010 um 12:10

Hallo,

ganz banal:

basiersend auf der gegebenen (Zufalls-)Stichprobe ist die beste Schätzung für die Grundgesamtheit, dass die Anteile (gut, schlecht, k.A.) dort genauso groß sind wie in der Stichprobe.

D.h.: Wenn von 280 Daten in der Stichprobe 50 „gut“ sind, so ist das ein Anteil von 50/280 = 17,86%. Genau dieser Anteil ist die beste Schätzung für den Anteil für „gut“ in der Grundgesamtheit. Wenn diese 1430 umfasst, so entspricht das 1430*17,86% = 255.

Neben dieser „Punktschätzung“ kann man auch noch angeben, wei gut, also wie genau die Schätzung ist, d.h., welchen Schätzfehler man im Mittel so erwarten kann. Das macht man am besten über die Angabe eines sog. Konfidenzintervalls (KI). Ein solches Interval steckt einen Bereich ab, für den man mit einer gegebenen Sicherheit (meist 95%; das 95%-KI) sagen kann, dass der wahre Anteilswert irgendwo in diesem Bereich liegt.

Um das 95%-KI zu bestimmen, muss man den Standardfehler und die Verteilungsfunktion kennen. Der Standardfehler eines Anteilswertes p aus einer Stichprobe vom Umfang n ist

SE = WURZEL( p*(1-p) / n )

Wenn n hinreichend groß ist (n>30, das ist hier der Fall), dann entspricht die Verteilungsfunktion ganz gut der Normalverteilung. Bei der Normalverteilung liegen 95% der Werte im Bereich von plusminius 1,96 Standardabweichungen um den Mittelwert. Mit der Punktschätzung als Mittelwert und dem Standardfehler als Standardabweichung der Verteilungsfunktion folgt daraus für das 95%-KI:

p +/- 1,96*SE

Zum Beispiel:

n = 280
p = 17,86% = 0,1786 (die 50 "gut"en)
SE = WURZEL( 0,1786*(1-0,1786) / 280 ) = 0.023

95%-KI = 0,1786 +/- 1.96*0.023 = 0,1337 … 0,2234

Der Anteilswert für „gut“ in der GG liegt also mit 95%iger Sicherheit zwischen 13,37% und 22,34%, die beste Schätzung ist 17,86%.

Willst du statt 95%iger Sicherheit eine 99%ige Sicherheit, dann mußt du statt mit 1,96 mit 2,58 multiplizieren.

Ich würde das so für die drei Klassen (gut/schlecht/k.A.) machen. Das ist gut genug. Mathematisch ganz korrekt ist es aber nicht. Hier könnte man noch berücksichtigen, dass die GG endlich groß ist und dass die Stichprobenfehler für die drei Anteilswerte korreliert sind. Das ist aber echt Kleinkram. So wie beschrieben bekommst du „konservative“ Schätzungen, d.h., die tatsächliche Genauigkeit ist (im Mittel) noch etwas größer als die berechnete. Von daher bist Du auf der „sicheren Seite“.

VG
Jochen

enrie · 13. Dezember 2010 um 08:43

Danke für deine Antwort…war sehr hilfreich und ich muss mich gerade selbst wundern, dass ich da nicht drauf gekommen bin!
Noch eine Frage nebenbei: was ist denn eigentlich wenn die Probe n

Jo1_a88223 · 13. Dezember 2010 um 09:03

Noch eine Frage nebenbei: was ist denn eigentlich wenn die
Probe n