Erforderlicher Stichprobenumfang bei Anteilen

Hallo zusammen,

ich habe eine Verständnisfrage zur Formel: n = (z/h)² * p * (1-p)
Nach dieser Formel, die den erforderlichen Stichprobenumfang bei Anteilen an einer Grundgesamtheit beschreibt (oder liegt hier schon der Fehler?) erhalte ich (bei unveränderten Werten für z und h) ein größeres n, wenn die Zahl möglicher Ausgänge geringer ist. Bei z = 1,96 und h = 0,2 ist - beim Prüfen der beiden Seiten einer Münze, also p = 0,5 das resultierende n = 24! Ich müsste also 24 Mal die Münze werfen, um herauszufinden, ob es sich um eine „faire“ Münze handelt - ist das so weit richtig. Oder besseres Beispiel: Der Würfel: Hier ist p = 0,1666 und n=13 (nur!) Die Ergebnisse Im Vergleich widersprichen doch gesundem Menschenverstand, oder nicht? Beim Würfel hat ja jede Zahl bei n=13 nur (rechnerisch) 2x die Chance gehabt, zu fallen. Wie soll man daraus ermitteln können, ob es ein fairer Würfel ist? Wo liegt mein Denkfehler?

Hi Spanier,

ich habe eine Verständnisfrage zur Formel: n = (z/h)² * p * (1-p)

Ich schätze mal, die ist in anlehnung zu Hamann/Erichson?

Nach dieser Formel, die den erforderlichen Stichprobenumfang bei :Anteilen an einer Grundgesamtheit beschreibt (oder liegt hier :schon der Fehler?)

Lässt sich so nicht feststellen, ob du da einen Fehler hast. Die Aussage dahinter ist folgende: Zu einer gegebenen Irttumsw’keit (z), einer gegebenen Genauigkeit (h) und einem bekannten (in der Grundgesamtheit existierenden) Anteil p benötigt man n>=(z/h)² * p * (1-p) samples um den vorliegenden Anteil p in seiner Stichprobe mit einer Genauigkeit h vorliegen zu haben.
Wichtig ist das „>=“, bei deinem Münzbsp kommt 24.x raus, also brauchst du eh 25.

erhalte ich (bei unveränderten Werten für z und h) ein größeres n, :wenn die Zahl möglicher Ausgänge geringer ist.

Äh, irgendwie erschließt sich mir deine Herleitung des h nicht. Warum ist h=0.2 bei einer Münze?

Ich müsste also 24 Mal die Münze werfen, um herauszufinden, ob es :sich um eine „faire“ Münze handelt - ist das so weit richtig.

Nein. Das obige n gibt dir an, welchen Stichprobenumfang du brauchst, um den Anteil in der Grundgesamtheit repräsentativ in deiner Stichprobe abzubilden.
Für die Münze ist das eine Umkehrung des tests auf eine bestimmte W’keit (fair=0.5). Da fliesst dann noch die Power ein und der Unterscheid, den du entdecken möchtest.
Die Formel dazu ist

n\geq\frac{(z_{1-\alpha}*\sqrt{p_0*(1-p_0)}+z_{1-\beta}*\sqrt{p_1*(1-p_1)})^2}{(p_1-p_0)^2}

Die Ergebnisse Im Vergleich widersprichen doch gesundem :Menschenverstand, oder nicht? […] Wo liegt mein :smiley:enkfehler?

Meistens hat Statistik/Stochastik nichts mit gesundem Menschernverstand zu tun, weil wir uns eben schwer tun in W’keiten zu denken. Dein Fehler liegt darin, eine Methode falsch angewendet zu haben.

Grüße,
JPL

Hallo JPL,

danke für die schnelle Antwort.
Zur Formel: Die ist aus Wikipedia. Die zitierten Mathematiker als Urheber… - mag sein!
Warum h=0,2? Beim erlaubten Fehler war ich mir unschlüssig, was ich einsetzen sollte. Ich kann „h“ verändern - das ändert aber nichts Grundsätzliches am Ergebnis.

„Falsche Methode“ - ja, das scheint das Problem zu sein. Deswegen schildere ich, was ich eigentlich will: Ich möchte rechnerisch ermitteln, wie viele „Spins“ (Drehungen mit Ergebnis) ich beim Roulette beobachtet haben muß, bis ich mathematisch ermitteln kann, ob das Rad einen Kesselfehler hat oder nicht. (Falls nicht, kommt jede Zahl mit einer Wahrscheinlichkeit von 1/37 vor. Es geht mir nur um die Formel, nicht um die Frage, ob ein „Kesselfehler“ überhaupt realistisch ist.)

Danke und Gruß,
Wolfram

Hallo Wolfram,

„Falsche Methode“ - ja, das scheint das Problem zu sein.
Deswegen schildere ich, was ich eigentlich will: Ich möchte
rechnerisch ermitteln, wie viele „Spins“ (Drehungen mit
Ergebnis) ich beim Roulette beobachtet haben muß, bis ich
mathematisch ermitteln kann, ob das Rad einen Kesselfehler hat
oder nicht. (Falls nicht, kommt jede Zahl mit einer
Wahrscheinlichkeit von 1/37 vor. Es geht mir nur um die
Formel, nicht um die Frage, ob ein „Kesselfehler“ überhaupt
realistisch ist.)

Wenn Du insgesamt prüfen willst, of das Roulette fair ist, dann ist die Frage doch:

Weicht die Haufigkeitsverteilung für die Zahlen 0-36 von der Gleichverteilung ab?

Das würde man mit einem Chi²-Test prüfen können (@JPL: ist das state-of-the-art oder gibt’s was besseres?). Dazu lassen sich auch Stichprobenumfänge berechnen. UM das zu tun, braucht man:

  • das gewünschte Signifikanzniveau
  • den gewünschten Mindesteffekt (Stärke der Abweichung von der Gleichverteilung)
  • die gewünschte Power

Wenn Du NUR prüfen willst, ob EINE bestimmte Zahl im Mittel nicht mit einer Häufigkeit von 1/37stel auftritt, kann man natürlich den von Dir vorgeschlagegen Weg gehen.

LG
Jochen

Hi Wolfram,

dann nimm die von mir angegebene Formel her, setze p0 = 1/37 (nominelle W’keit), p1=2/37 (z.B.), alpha=0.05 => z_0.95=1.644, beta = 0.2 => power=0.8 => z_0.8 = 0.841 ergibt 286.
genaugenommen testest du damit aber, ob ein bestimmtes Feld seine W’keit einhält. Ein Kesselfehler würde wohl aber auch die schwarz/rot Ausgänge beeinflussen.
Mit p0 = 0.5, p1=0.55, alpha=0.05, beta = 0.2 ergibt sich 617,
mit p0 = 0.5, p1=0.6, alpha=0.05, beta = 0.2 ergibt sich 153 und
mit p0 = 0.5, p1=0.51, alpha=0.05, beta = 0.2 ergibt sich 15455.

Hoffe, das hilft dir weiter, viele Grüße,
JPL

Sorry JPL, ich steh noch auf dem Schlauch.
Was bedeutet: „z_0.95=1.644“. Die Formel, die Du zitierst, fragt nur nach z1.
Und was genau hat es mit p1 (2/37) auf sich, wenn ich auf p0 teste?
Gruß,
Wolfram
P.S: Wie heisst diese Formel genau? Dann kann ich selbst recherchieren. Möchte nicht Deine Zeit zu sehr strapazieren.

Hi Wolfram,

dann hab ich das schlecht erklärt.
Die Formel verwendet z1-alpha, wobei alpha die Irrtumsw’keit ist, i.a. 5% = 0.05. z ist das zu dem im subscript stehende Quantil der Standardnormalverteilung, d.h. es trennt die Standardnormalverteilung an der Stelle z1-alpha so auf, dass 95% der Werte kleiner sind als das Quantil (-> http://de.wikipedia.org/wiki/Quantil).
beta ist der Fehler 2.Art und 1-beta die Power oder Trennschärfe (-> http://de.wikipedia.org/wiki/Power), i.a. 20%, also eine power von 0.8.
Die jeweilgen Quantile kannst du entsprechenden Tabellen entnehmen (oder geeigenter Statistiksoftware) und ergeben sich als
z_0.95 = 1.644854 und z_0.8 = 0.8416212.

die 2/37 für p1 sind nur ein Vorschlag. du musst das angeben, was Jo schon als relevanter Unterscheid ansprach. Wahlweise kannst du auch auf eine Abweichung von p% testen und dann p1 als (1+p)*p0 ausrechnen.

Einen Namen hat duie Formel nicht, es ist die Fallzahlplanung zu einem Binomialtest auf einen vorgegebenen Anteil (-> http://people.richland.edu/james/lecture/m170/ch09-p… & http://webport.cgc.maricopa.edu/published/l/ce/lcent…)

Grüße,
JPL

Hi Jochen,

man könnte chi² verwenden, aber ich habe noch keine Fallzahlplanung dazu gefunden.
Grüße,
JPL

Hi Jochen,

man könnte chi² verwenden, aber ich habe noch keine
Fallzahlplanung dazu gefunden.

Oh, dann kann ich Dir mal was helfen:

in R geht das zB. mit der Funktion „chisq.sample.size“ aus der Library „haplo.stats“ (die braucht einen non-centrality parameter) sowie mit der Funktion „pwr.chisq.test“ aus der Library „pwr“ (die geht über die effect size w).

Grüße,

dito
Jochen

Hallo JPL,

vielen Dank für die ausführliche Antwort. Dann werde ich mich mal nach Feierabend eingehend damit beschäftigen.

Gruß,
Wolfram