Statistik-Hilfe: Größe des Stichprobenumfangs?

Hallo allerseits,

ich habe eine Frage zum Thema repräsentativer Stichprobenumfang :

Im Studuim (lang lang is her) habe ich mal gelernt (so denke ich), dass die Stichprobe prozentuale gesehen umso kleiner sein kann, je größer die Gesamtmenge ist. Gibt es dafür eine Formel? Also, wie groß muss bspw. der Rücklauf bei einer Befragung sein, wenn die Gruppe 50, 100, 500, 1.000 oder 10.000 Menschen umfasst? D. h wieviel % (z.B. der Mitarbeiter eines Unternehmens) müssten sich in Abhängigkeit von der Unternehmesngröße beteilligen, damit man von „repräsentativ“ sprechen kann?

Dabke für Eure Hilfe!!!

Viele Grüße

Jürgen

Hallo,

Du liegst einem populären Missverständnis über die Bedeutung des Wortes „repräsentativ“ auf.

Jede Stichprobe ist repräsentativ, denn sie repräsentiert eine Erwartungswert (von was auch immer) der Grundgesamtheit. Alleine die Eigenschaft der Repräsentativität hilft also überhaupt nicht weiter. Interessant wird es erst, wenn man definiert, welche Eigenschaften die Repräsentativität haben soll. Dazu gibt es keine generelle Regel. Sicher sollte sie meistens erwartungstreu sein. Es mag aber auch Fälle geben, in denen Erwartungstreue nicht so wichtig ist. Abgesehen davon nutzt man eine Stichprobe ja, um einen Schätzwert für eine Statistik der Grundgesamtheit zu bekommen. Durch die Art und Weise, wie die Stichprobe gezogen wird, ergibt sich ein Stichprobenfehler. Mit den Regeln der Statistik kann man diesen Fehler quantifizieren. Er hängt von der Art der Stichprobenziehung und natürlich vom Stichprobenumfang ab. Man kann natürlich auch den Fehler vorgeben und den nötigen Stichprobenumfang ermitteln.

Du hast Recht, dass bei endlichen Grundgesamtheiten auch noch ein Zusammenhang zur Populationsgröße besteht. Besteht die Grundgesamtheit aus 50 Einheiten, dann bekommt man mit einem Stichprobenumfang von 50 schon eine sehr gute Schätzung. Erfolgt die Stichprobennahme „ohne Zurücklegen“, dann hat man hier eine Vollerhebung und überhaupt keinen Stichprobenfehler mehr.

Die Angabe wie „eine repräsentative Stichprobe ergab einen Anteil von 17% Rauchern bei Mitarbeitern der bla bla bla“ ist wissenschaftlich wenig sinnvoll, weil der Fehler nicht angegeben ist. Wenn das Wort „repräsentativ“ benutzt wird, um zu zeigen, dass die Stichprobe nach den Regeln der Statistik gezogen wurde, dann steht die Untersuchung in meinen Augen sowieso schon im Zweifel, weil das Selbstverständlichkeiten sind, die sich zudem auch aus der Beschreibung der Methode ergeben. Als Satz im Ergebnisteil ist daher eine Aussage wie „Die Untersuchung ergab einen Mittleren Raucheranteil von 17% (95%-Konfidenzintervall: 15%-19%) bei…“ wesentlich besser.

Deine Frage sollte also sein: Wie groß darf dein 95%-Konfidenzintervall sein? Von da ausgehend und unter Berücksichtigung der Stichprobenziehung (zB. stratifiziert(nicht-startifiziert, usw.) und des Populationsumfangs sowie Schätzungen über die Streuung des Zielparameters in der Population (zB. aus Pilotstudien ermittelt, der Literatur entnommen oder von vergleichbaren Analysen) lässt sich dann der nötige Stichprobenumfang berechnen.

LG
Jochen

Hallo,
wenn ich den Resten meines Wissens aus dem Studium trauen kann, hast du vollkommen Recht Jochen!

Rein gefühlsmäßig würde ich sagen, dass Jürgen damit nicht wirklich geholfen ist.

Er will doch wissen, wieviele Rückläufer er bei einer Umfrage haben muss, damit die Ergebnisse als „gültig“ angesehen werden können.

Wenn er 50 MA fragt, ob das Kantinenessen ok ist und 2 antworten (einer mit „ist ok“ einer mit „ist nicht ok“) kann er ja nicht sagen: „Wir haben eine Umfrage gemacht und 50% der Mitarbeiter sind zufrieden mit dem Kantinenessen“. Wenn alle 50 antworten (und wieder halbe halbe) ist die Aussage ok.
Kann man also berechnen, wieviele Rückläufer er braucht, dass er sagen kann: „mit einer Wahrscheinlichkeit von X% halten 50% der MA das Kantinenessen für ok“.
Soweit ich mich an unsere Statistikvorlesungen erinnere, hat man immer eine Fehlerwahrscheinlichkeit (zumindest bei Stichproben), d.h. eine 100% richtige Lösung bekommt er nur, wen alle antworten. Aber wie viele Rückläufer muss er haben, dass die Antwort z.B. mit einer 10% Wahrscheinlichkeit richtig ist (oder 1% oder 5%).
Wäre schon spannend… würde vermutlich die ein oder andere „representative Umfrage“ als wenig valide entlarven :wink:

Gruss
Michael

Hallo,

Rein gefühlsmäßig würde ich sagen, dass Jürgen damit nicht
wirklich geholfen ist.

Das sehe ich auch so. Wenn er’s richtig machen will, muss er wohl mehr Statistik lernen und den dornigen Weg gehen. Wenn er’s halt irgendwie machen will, ist’s doch auch egal. Dann soll er halt eine Stichprobe von machbarem Umfang hernehmen und die empirischen Fehler angeben. Mag der Leser entscheiden, ob ihm der Fehler dann klein genug ist.

Er will doch wissen, wieviele Rückläufer er bei einer Umfrage
haben muss, damit die Ergebnisse als „gültig“ angesehen werden
können.

Dieses „gültig“ entbehrt einer allgemeinen Definition. Er muss festlegen, was er als „gültig“ ansieht und er muss es beschreiben. Demnach kann er den nötigen Stichprobenumfang doch ausrechnen. Wie genau das zu machen ist, hängt von vielen Faktoren ab, die ich nicht kenne. Man muss sich schon genau mit der Studie, dem Design usw. auseinandersetzten, um da was vernünftiges zu zu sagen. Wenn es wichtig ist, sollte er damit eben zu einem Profi gehen.

Wenn er 50 MA fragt, ob das Kantinenessen ok ist und 2
antworten (einer mit „ist ok“ einer mit „ist nicht ok“) kann
er ja nicht sagen: „Wir haben eine Umfrage gemacht und 50% der
Mitarbeiter sind zufrieden mit dem Kantinenessen“.

GENAU! Und darum sage ich ja, dass immer die Fehler mit angegeben werden müssen. In diesem Falle könnte das so aussehen:

„Wir haben eine Umfrage gemacht und 50% der Mitarbeiter sind zufrieden mit dem Kantinenessen (95%-KI: 2%-98%)“

Wer sich das Konfidenzintervall für die Schätzung ansieht, erkennt, dass die Studie keinen Wissensgewinn gebracht hat.

Wäre schon spannend… würde vermutlich die ein oder andere
„representative Umfrage“ als wenig valide entlarven :wink:

Sicher das. Meistens ist die Art der Stichprobenziehung schon nicht in Ordnung, weil die Teilnehmer nicht wirklich zufällig gezogen werden oder diese Nicht-Zufälligkeit bei der Auswertung nicht berücksichtigt wird.

LG
Jochen

Hi Michael,

wenn ich den Resten meines Wissens aus dem Studium trauen
kann, hast du vollkommen Recht Jochen!

Stimmt.

Er will doch wissen, wieviele Rückläufer er bei einer Umfrage
haben muss, damit die Ergebnisse als „gültig“ angesehen werden
können.

Der Unterschied liegt zwischen „Fallzahlplanung“ und „Repräsentativ“.
Das erste verarbeitet die Informationen Fallzahl, Power, Signifikanzniveau, Unterschied und Streuung des Unterschiedes. Kennt man bel. 4 dvon, kann man die 5. ausrechnen. In diesem Fall wäre das die Fallzahl, und die Aussage ist dann :
Es werden n samples (pro Gruppe) benötigt, um ein stat. signifikanten Unterschied von a Einheiten mit einer Streuung von b Einheiten bei einer Power von y% nachzuweisen.

Das 2. bedeutet: Wieviele Personen einer bestimmten Gruppe müssen vorhanden sein, damit man von der Stichprobe auf die Gesamtheit schließen kann?
Das Problem ist hier die Definition der „Gruppe“. Unterschiedet man die Personen nicht weiter, kann man keine Aussage über Untergruppen machen, ist aber letzlich immer repräsentativ. Das klappt natürlich i.a. nicht, denn MA einer süddeutschen Firma würden gg. anders antworten als die einer südafrikanischen. Weiß man um solche Einflussfaktoren, sollte man sie auch berücksichtigen. REpäsentativ ist man dann, wenn die Verteilungsstruktur der Gesamtheit sich in der Stichprobe wiederfindet, da es dann ein Abbild ist.

Wenn er 50 MA fragt, ob das Kantinenessen ok ist und 2
antworten (einer mit „ist ok“ einer mit „ist nicht ok“) kann
er ja nicht sagen: „Wir haben eine Umfrage gemacht und 50% der
Mitarbeiter sind zufrieden mit dem Kantinenessen“.

Der Fehler ist einfach: Zuerst muss man beschreiben, was man gefunden hat. Und das ist: 50% der MA, die geantwortet haben, finden das Essen schlecht.

Wenn alle
50 antworten (und wieder halbe halbe) ist die Aussage ok.

Warum? Dann kann man auch nur eine Aussage über die MA der Firma machen. Wieso soll man Ergebnisse einer Firma auf eine andere übertragen können? Was snd denn alles MA? Essen die denn alle in einer Kantine? In derselben Kantine? Zum selben Preis? Wer hat welche Nahrungsgewohnheiten? Was kann noch alles die Angabe beeinflussen?
Eine Methode, dieses Dilemma umgeen zu können ist einfach, sich auf die untersuchte Menge zu beschränken.
Eine andere Methode ist zu randomiseren. Bei guter Randomiserung erhält man schon für relativ kleine sampels ein gutes Abbild der Gesamtmenge. Im Falle der MA müsste man also alle MA z.B. Deutschlands in einen pool tun und dann randomisiert die die Befragung durchführen. Dann könnte man eine Aussage über alle MA in D machen (wenn die Fallzahl groß genug ist).

Kann man also berechnen, wieviele Rückläufer er braucht, dass
er sagen kann: „mit einer Wahrscheinlichkeit von X% halten 50%
der MA das Kantinenessen für ok“.

Das ist sinngemäß die Aussage: Wenn man weitere MA befragen würde, wie hoch ist die W’keit, dass die „ok“ antworten. Das ist erstmal der naive Schätzer, der sich als Anteil der sich der positiv äusserden getilt duch die Anzahl der sich überhaupt ausserden ergibt. Gefragt ist aber, wie sicher die Aussage von 50% ist. und hier kommt das Konfidenzinzervall ins Spiel.

Soweit ich mich an unsere Statistikvorlesungen erinnere, hat
man immer eine Fehlerwahrscheinlichkeit (zumindest bei
Stichproben), d.h. eine 100% richtige Lösung bekommt er nur,
wen alle antworten. Aber wie viele Rückläufer muss er haben,
dass die Antwort z.B. mit einer 10% Wahrscheinlichkeit richtig
ist (oder 1% oder 5%).

„Richtig“ lässt sich stat. nicht fassen. welcher Wert ist denn richtig? Wenn man einen Wert vorgibt, von dem man aus welchen Gründen auch immer ausgeht, dass er richitig ist, kann man diese W’keit angeben. Sonst nicht. Zentral ist da auch wieder das KI.

Wäre schon spannend… würde vermutlich die ein oder andere
„representative Umfrage“ als wenig valide entlarven :wink:

Valide und repräsentativ ist wieder etwas anderes. Zwar kann eine Studie repäsentativ unter den o.g. Umständen sein, aber nicht valide, weil z.B. eine falshe Methode verwendet wurde.
Es gibt viele Fehlerquellen dabei, die man machen kann, angefangen von der Fragestellung über die Planung, die Durchführung bis hin zur Auswertung. Leider iste s aber usus, dass sich viele mal bemüssigt fühlen, ohne das nötige Vorwissen eine Umfrage zu machen.
Von daher gehe ich davon aus, dass eine Vielzahl der Umfragen nicht repäsentativ oder valide ist.

Grüße,
JPL

Hallo Jochen und Michael,
zunächst: VIELEN DANK für Eure Antworten und Eure Mühe!! Aber ganz ehrlich, bin ich jetzt immer noch etwas ahungslos. Gibt es denn eine Formel, mit dem man bei einer Befragung berechnen kann, wieviele Rückläufer einer festen Grundmenge (=Unternehmensgröße in Mitarbeiter-Zahlen, also z. B. 50 MA oder 100, 500, 1000, 5000, 10000) man bei einer Mitarbeiterbefragung bekommen muss, damit man davon ausgehen kann, dass die Ergebnisse representativ (= im Volksmund ungefähr genauso ausfallen würden, wenn alle antworten würden)??
Bei Umfragn in Deutschland (Grundmenge = ca. 82 Mio) werden gant oft 1.000 Menschen befragt und die Ergebnisse werden akzeptiert. Wieviele MA muss ich also befragen = wie hoch muss die Anzahl der Rückläufer bei einer Befragung sein), dass die Ergbnisse valide sind?
Wie lautet denn eine solche Formel oder gibt es die nicht?
Nochmals Danke und viele Grüße
Jürgen

Hallo,

wahrscheinlich gibt es für bestimmte Befragungen Faustregeln. Ich kenne aber keine.

An sich macht eine so allgemeine Aussage wie „man braucht Rücklauf von x MA wenn die Firma y MA hat“ überhaupt keinen Sinn, weil - wie gesagt - die Größe von x von dem Typ und der Struktur der Daten abhängt und von der Größe des Konfidenzintervalls, das man anstrebt.

Das Wort „Rücklauf“ macht mich auch etwas skeptisch. Das Ergebnis sollte nicht davon abhängen, ob eine Person in der Stichprobe antworten mag oder nicht. Wenn sich das nicht anders lösen läßt, muss man die Möglichkeit in Betracht ziehen, dass das Ergebnis nicht erwartungstreu ist. Bsp: Wenn man Personen fragt, ob sie Alkoholiker sind, werden gerade Alkoholiker nicht antworten oder häufiger eine gezielte Falschaussage machen; das Ergebnis wird den Anteil an Alkoholikern unterschätzen.

LG
Jochen

Hallo Jochen,
hm, da hast Du sicherlich Recht - trotzdem vielen Dank für Deine Mühe. Ich weiß nur, dass bei Umfragen in Deutschland nur 1.000 Menschen der 82 Mio befragt werden und die Ergebnisse scheinen halbwegs repräsentativ zu sein…
Naja, dan „forsche“ ich mal weiter…
Viele Grüße
Jürgen

Hallo,

Ich weiß nur, dass bei Umfragen in Deutschland nur
1.000 Menschen der 82 Mio befragt werden und die Ergebnisse
scheinen halbwegs repräsentativ zu sein…

Mal zum Mitdenken: Nehmen wir mal an, du wolltest herausfinden, welcher Anteil der Bevölkerung in D Masern hat, zB. um zu sehen, ob es in den letzten Jahren wieder mehr Masernfälle gegeben hat. 2006 war die Masern-Inzidenz etwa bei 3 von 100000 Einwohnern, das sind 0.003%. Nun fragst du 1000 Leute, ob sie Masern haben. Die Anzahlen der Ja-Antworten sind binomialverteilt, und unter einer wahren Inzidenz von 0.003% ergeben sich folgende Wahrscheinlichkeiten:

Anzahl pos. Antworten - W’keit dafür:
0 - 97,04%
1 - 2,91%
2 - 0,04%

Fast jede solcher Umfragen wird zum Ergebnis haben, dass alle Befragten mit „nein“ antworten. Das 95%-Konfidenzintervall für diesen Fall geht von 0% bis 0.383%. Du kannst dann mit 95%iger W’keit davon ausgehen, dass die wahre Inzidenz zwischen 0% und 0.38% liegt. Das ist viel zu ungenau, um eine Aussage über die Zu- oder Abnahme von Masernfällen machen zu können.

Solltest Du das seltene Glück haben, in Diener Umfrage eine positive Antwort zu erhalten, wäre das Konfidenzintervall zwischen 0.018% und
0.564%. Auch nicht besser.

Nehmen wir an, eine Verdoppelung(!) der Inzidenz wäre bedeutend zu erkennen, dann sollte die Umfrage mind. 1082166 Personen umfassen, um diesen Unterschied mit 95%iger Sicherheit und 5%iger Fehlerwahrscheinlichkeit zu erkennen, wenn er denn da ist.

Für diese Fragestellung und diese geringe Inzidenz in der Grundgesamtheit und dem binominalen Charakter der Daten ist eben eine Umfrage erst hinreichend repräsentativ, wenn mehr als 1 Mio Leute befragt werden.

Naja, dan „forsche“ ich mal weiter…

Viel Spaß!

LG
Jochen

Hi Jürgen,
die Frage ist aber eher, WEN man in Bezug auf die Frage(n) befragt, nicht wie viele, um repäsentativ zu sein.
Die ersten 1000 Besucher des KDW nach der Finanzkreise zu befragen ergibt bestimmt ein deutlich anderes Ergebnis als 1000 Leute randomisiert per Telefoninterview.

Grüße,
JPL

Hallo Jochen,
und schon wieder hast Du Recht! :wink:
Allerdings suche ich ja eine Formel für Mitarbeiterbefagungen in Unternehmen - hm, wer da antwortet (die Meckerer oder die Veränderer oder die Beharrer oder die Jungen, Alten…) hat man nicht im Blick. Dennoch bin ich sicher, muss der Rücklauf nicht 100% wenn das Unternehmen 100 oder mehr Mitarbeiter hat…
Viele Grüße
Jürgn

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]