Prozentangaben => Stichprobengröße

Hallo!

Ich bräuchte eine Methode / einen Algorythmus, um anhand von Pronzentangabe die Stichprobengröße abzuschätzen, d.h. eine Möglichkeits/Wahrscheinlichkeits-Tabelle zu erstellen, wie die Größenordnung der Erhebung war, wenn ich lediglich Prozent-Werte habe.

Wenn z.B. im einfachsten Fall genau 10% grün sind, 20% rot und 70% blau, dann halte ich es nach einem naiven Urteil für recht wahrscheinlich, daß lediglich 10 VPN/Dinge erfasst wurden. Aber wie sieht das rechnerisch aus?

Danke!

Hi,
(…)

Wenn z.B. im einfachsten Fall genau 10% grün sind, 20% rot und
70% blau, dann halte ich es nach einem naiven Urteil für recht
wahrscheinlich, daß lediglich 10 VPN/Dinge erfasst wurden.

Du suchst glaub ich die Mindest-Stichprobengrösse, mit der die Prozentangaben „genau aufgehen“.

Eine allgemeine Formel hab ich zwar nicht, aber mit Excel geht das ganz einfach.
Teile alle gegebenen Prozentwerte durch 1, 2, 3,…bis meinetwegen 50.
Bei 3 gegebenen Prozentwerten erhältst du also 3 Reihen mit immer kleiner werdenden Zahlen.
Nun suchst du diejenige GRÖSSTE Zahl, die in allen 3 Reihen vorkommt.
Schliesslich teilst du 100 durch diese grösste Zahl und erhältst die kleinstmögliche Stichprobengrösse.

Gruss,

Erstmal danke!

Aber was ich suche, geht noch ein Bisschen darüber hinaus… Um bei meinem Beispiel zu bleiben: 10% rot, 20%grün, 70% blau. Das könnten 10 gewesen sein. Aber z.B. auch 20 oder 100. Wie hoch ist die Wahrscheinlichkeit, daß es 10 waren und wie hoch, daß so ein „auffälliges“ Ergebnis mit 100 zustande kam?

Hab schon probiert, mir das irgendwie aus den verschiedenen Prinzipien die man anwenden kann, um zu bestimmen, mit welcher Wahrscheinlichkeit eine Stichprobe aus einer Population stammt, herzuleiten - bin was solche Sachen angeht wenn’s abstrakt wird aber nicht so fit.

Hallo!

Aber was ich suche, geht noch ein Bisschen darüber hinaus…
Um bei meinem Beispiel zu bleiben: 10% rot, 20%grün, 70% blau.
Das könnten 10 gewesen sein. Aber z.B. auch 20 oder 100. Wie
hoch ist die Wahrscheinlichkeit, daß es 10 waren und wie hoch,
daß so ein „auffälliges“ Ergebnis mit 100 zustande kam?

Solche Rückschlüsse sind nur möglich, wenn die Verteilung des Merkmals in der Grundgesamtheit bekannt ist und man davon ausgeht, dass die Stichprobe zufällig gezogen wurde.
Der Ansatz zur Lösung deines Problems ist es die Ziehung der Stichprobe als ein Zufallsexperiment zu betrachten. Je nach dem Verhältnis von Stichprobe zu Grundgesamtheit solltest du von Ziehen mit Zurücklegen oder Ziehen ohne Zurücklegen ausgehen. Mit der entsprechenden Formel kannst du dann aufstellen, wie wahrscheinlich eine Ziehung mit den angegebenen Verhältnissen in Abhängigkeit von der Stichprobengröße ist. Wenn du das Minimum dieser Funktion ermittelst, hast du die Stichprobengröße bestimmt, bei der die Abweichung am wahrscheinlichsten ist. Um das Minimum zu bestimmen musst du die 1. Ableitung der Funktion bilden, sie 0 setzen und lösen. Anschließend musst du kontrollieren, ob die gefundene Lösung wirklich ein Minimum ist (wenn 2. Ableitung > 0). Wenn die Funktion mehrere lokale Minima hat, musst du die so erhaltenen Werte miteinander vergleichen. Sollte sie gar keines haben, liegt der geringste Funktionswert an einer der Grenzen des Definitionsbereichs.
Da das alles ziemlich kompliziert ist, fragst du am besten im Matheboard nach der Lösung eines konkreten Beispiels.

Falk

Is es nicht einfacher?
Hi,

Wie
hoch ist die Wahrscheinlichkeit, daß es 10 waren und wie hoch,
daß so ein „auffälliges“ Ergebnis mit 100 zustande kam?

Solche Rückschlüsse sind nur möglich, wenn die Verteilung
des Merkmals in der Grundgesamtheit bekannt ist und man davon
ausgeht, dass die Stichprobe zufällig gezogen wurde.

oder wenn das Stichprobenergebnis mit einem Vertrauensintervall angegeben wird, aber das nur am Rande.

Der Ansatz zur Lösung deines Problems ist es die Ziehung der
Stichprobe als ein Zufallsexperiment zu betrachten. Je nach
dem Verhältnis von Stichprobe zu Grundgesamtheit solltest du
von Ziehen mit Zurücklegen oder Ziehen ohne Zurücklegen
ausgehen.

Nehmen wir oBdA an, die GG sei sehr gross.

Mit der entsprechenden Formel kannst du dann
aufstellen, wie wahrscheinlich eine Ziehung mit den
angegebenen Verhältnissen in Abhängigkeit von der
Stichprobengröße ist.

Ich glaube, die kleinste Stichprobe ist immer die Wahrscheinlichste, unabhängig sonstiger Umstände.
Mit wachsender Stichprobengrösse wird nämlich die Wahrscheinlichkeit eine ganz bestimmte Kombination zu ziehen, kleiner.
Das gilt für "halbwegs repräsentative Stichproben, und erst recht für Stichproben mit „extremer“ Zusammensetzung.

Um beim Beispiel zu bleiben:
1,2,7 zu ziehen ist in jedem Fall wahrscheinlicher, als 10,20,70 zu ziehen, egal wie die (sehr grosse) Grundgesamtheit zusammengesetzt ist.

Gruss,