Stichprobenumfang

Hallo Statistik-Cracks,

ich stehe vor einem Problem:

Grundgesamtheit von z.B. 5.000 Studenten,
davon hat ein Teil die Ausleihfristen der Bücher überschritten, der andere Teil nicht.

Wie groß muß ich die Stichprobe wählen???

Damit ich mit z. B. 95%-iger Wahrscheinlichkeit das richtige Ergebnis bekomme (in einem Konvidenzintervall von +/- 5 %).

Welche Formel ist hier richtig?
Hab das schon ewig nichtmehr gemacht und brauche jetzt dringend eine Antwort. Wäre suuuuuuuuper nett, wenn mir jemand helfen könnte!!!

Habe schon gesucht und bin an dieser Formel hängengeblieben. Ist diese Formel die richtige?

n>=z²O(1-O)N / (delta O)²(N-1)+z²O(1-O)

wobei O eigentlich einen waagrechten Strich in der Mitte haben müsste, aber das habe ich leider nicht hinbekommen…

Ich wäre sehr dankbar für Hilfe!!
Danke
Sandra

Hi,

keine Ahnung, ob deine Formel richtig ist. Ich nehme an, das O steht für den Anteilswert. Warum rechts nochmal N auftaucht und was das bedeutet, weiß ich nicht.

Leiten wir es mal her:

Anteilswerte hinreichend großer Stichproben vom Umfang n sind etwa normalverteilt mit dem Mittelwert \pi (der wahre Anteilswert in der GG; wird durch p geschätzt) und der Standardabweichung (=„Standardfehler“)

s=\sqrt{\frac{p\cdot(1-p)}{n}}.

Das \alpha-Konfidenzintervall der Schätzung ist gegeben durch

p \pm {\mathbf{z}}_{\alpha}\cdot s

wobei {\mathbf{z}}_{\alpha} die \alpha-Quantile der Standard-Normalverteilung ist. So ist z.B. {\mathbf{z}}_{0.95}=1.96 oder {\mathbf{z}}_{0.99}=2.57.

Die Breite des Konfidenzintervalls spiegelt die Genauigkeit wieder. Je schmaler das Intervall, desto genauer die Schätzung. Es ist praktisch, die Genauigkeit hier als Halbbreite des Intervals anzugeben. Das ist gerade der Term

{\mathbf{z}}_{\alpha}\cdot s

der ja einmal zum Punktschätzwert p addiert und subtrahiert wird, um die Grenzen des Konfidenzintervals zu berechnen. Wenn man nun eine Genauigkeit von \pm\Delta erreichen möchte, dann muss dieser Term genau so groß sein, also:

\Delta = {\mathbf{z}}_{\alpha}\cdot s

und nun s eingesetzt:

\Delta = {\mathbf{z}}_{\alpha}\cdot \sqrt{\frac{p\cdot(1-p)}{n}}

und nach n aufgelöst:

\Delta^{2} = {\mathbf{z}}_{\alpha}^{2}\cdot \frac{p\cdot(1-p)}{n}
n = {\mathbf{z}}_{\alpha}^{2}\cdot \frac{p\cdot(1-p)}{\Delta^{2}}

Den Wert für n sollte man dann auf die nächste ganze Zahl aufrunden.

Die Formel verlangt nun noch, dass man schon einen Schätzwert p hat. Wenn man keinen hat, sollte man einen möglichst ungünstigen Wert nehmen. Der ungünstigtste Wert ist 0.5, denn dafür ist der Ausdruck p(p-1) maximal, nämlich 0.25; da wird das Interval also maximal breit bzw. der nötige Stichprobenumfang maximal groß. Ohne weitere Angaben zu p kann man die Formel also vereinfachen zu

n = {\mathbf{z}}_{\alpha}^{2}\cdot \frac{0.25}{\Delta^{2}}

bzw.

n = \frac{{\mathbf{z}}_{\alpha}^{2}}{4\Delta^{2}}

In deinem Beispiel ist ja \alpha=0.95 also {\mathbf{z}}_{\alpha}=1.96 und ich nehme an \Delta=5%=0.05. Mithin ist

n = \frac{1.96^{2}}{4\cdot0.05^{2}}=385

Ich hoffe, ich habe mich nirgends vertan :smile:

VG
Jochen

Guten Morgen Jochen,

vielen lieben Dank für Deine ausführliche Hilfe.
Ich hätte noch eine Frage:

ist das Ganze völlig unabhängig von der Größe der Grundgesamtheit?

Was, wenn diese z.B. nur aus 100 Stück bestehen würde?

Wäre sehr nett, wenn Du mir weiter helfen könntest.
Vielen Dank schon mal!!!
Schönen Tag
Sandra

Moin Sandra,

ist das Ganze völlig unabhängig von der Größe der
Grundgesamtheit?

Na, denk mal nach!

Wenn die Größe n der Stichprobe im Vergleich zur Größe N der GG nicht vernachlässigbar ist, so wird entscheidend, ob man die Stichprobe mit oder ohne „Zurücklegen“ zieht. Wenn du „mit Zurücklegen“ ziehst, tust du im Prinzip so, als hättest du eine unendlich große GG (du kannst ja unendlich große Stichproben ziehen). Dabei kann man dann alle Formeln verwenden, die man für unendlich große GG anwendet - man behält aber auch immer den Stichprobenfehler bei. Zieht man „ohne Zurücklegen“, dann habe ich irgendwann eine Vollerhebung und kenne den wahren Anteilswert (das ist also keine Schätzung mehr!). Der Stichprobenfehler erreicht tatsächlich Null, wenn n=N. Man kann das berücksichtigen, indem man die Maßzahl für den Stichprobenfehler (hier: s) mit einem Korrekturfaktor multipliziert, der für n\sqrt{\frac{N-n}{N-1}}

Schönen Tag

Dito.
Jochen

1 Like

Hallo Jochen,
Du bist mein Held!!! vielen Dank!

Wie groß muß den eine Stichprobe mindestens sein, dass sie hinreichend groß ist und man von der Normalverteilung der Anteilswerte ausgehen kann?

Viele Grüße
Sandra

Du bist mein Held!!! vielen Dank!

:smile:

Wie groß muß den eine Stichprobe mindestens sein, dass sie
hinreichend groß ist und man von der Normalverteilung der
Anteilswerte ausgehen kann?

Man sagt so üblicherweise >30.

Viele Grüße
Jochen

1 Like

Danke!!!