Hi Michael,
wenn ich den Resten meines Wissens aus dem Studium trauen
kann, hast du vollkommen Recht Jochen!
Stimmt.
Er will doch wissen, wieviele Rückläufer er bei einer Umfrage
haben muss, damit die Ergebnisse als „gültig“ angesehen werden
können.
Der Unterschied liegt zwischen „Fallzahlplanung“ und „Repräsentativ“.
Das erste verarbeitet die Informationen Fallzahl, Power, Signifikanzniveau, Unterschied und Streuung des Unterschiedes. Kennt man bel. 4 dvon, kann man die 5. ausrechnen. In diesem Fall wäre das die Fallzahl, und die Aussage ist dann :
Es werden n samples (pro Gruppe) benötigt, um ein stat. signifikanten Unterschied von a Einheiten mit einer Streuung von b Einheiten bei einer Power von y% nachzuweisen.
Das 2. bedeutet: Wieviele Personen einer bestimmten Gruppe müssen vorhanden sein, damit man von der Stichprobe auf die Gesamtheit schließen kann?
Das Problem ist hier die Definition der „Gruppe“. Unterschiedet man die Personen nicht weiter, kann man keine Aussage über Untergruppen machen, ist aber letzlich immer repräsentativ. Das klappt natürlich i.a. nicht, denn MA einer süddeutschen Firma würden gg. anders antworten als die einer südafrikanischen. Weiß man um solche Einflussfaktoren, sollte man sie auch berücksichtigen. REpäsentativ ist man dann, wenn die Verteilungsstruktur der Gesamtheit sich in der Stichprobe wiederfindet, da es dann ein Abbild ist.
Wenn er 50 MA fragt, ob das Kantinenessen ok ist und 2
antworten (einer mit „ist ok“ einer mit „ist nicht ok“) kann
er ja nicht sagen: „Wir haben eine Umfrage gemacht und 50% der
Mitarbeiter sind zufrieden mit dem Kantinenessen“.
Der Fehler ist einfach: Zuerst muss man beschreiben, was man gefunden hat. Und das ist: 50% der MA, die geantwortet haben, finden das Essen schlecht.
Wenn alle
50 antworten (und wieder halbe halbe) ist die Aussage ok.
Warum? Dann kann man auch nur eine Aussage über die MA der Firma machen. Wieso soll man Ergebnisse einer Firma auf eine andere übertragen können? Was snd denn alles MA? Essen die denn alle in einer Kantine? In derselben Kantine? Zum selben Preis? Wer hat welche Nahrungsgewohnheiten? Was kann noch alles die Angabe beeinflussen?
Eine Methode, dieses Dilemma umgeen zu können ist einfach, sich auf die untersuchte Menge zu beschränken.
Eine andere Methode ist zu randomiseren. Bei guter Randomiserung erhält man schon für relativ kleine sampels ein gutes Abbild der Gesamtmenge. Im Falle der MA müsste man also alle MA z.B. Deutschlands in einen pool tun und dann randomisiert die die Befragung durchführen. Dann könnte man eine Aussage über alle MA in D machen (wenn die Fallzahl groß genug ist).
Kann man also berechnen, wieviele Rückläufer er braucht, dass
er sagen kann: „mit einer Wahrscheinlichkeit von X% halten 50%
der MA das Kantinenessen für ok“.
Das ist sinngemäß die Aussage: Wenn man weitere MA befragen würde, wie hoch ist die W’keit, dass die „ok“ antworten. Das ist erstmal der naive Schätzer, der sich als Anteil der sich der positiv äusserden getilt duch die Anzahl der sich überhaupt ausserden ergibt. Gefragt ist aber, wie sicher die Aussage von 50% ist. und hier kommt das Konfidenzinzervall ins Spiel.
Soweit ich mich an unsere Statistikvorlesungen erinnere, hat
man immer eine Fehlerwahrscheinlichkeit (zumindest bei
Stichproben), d.h. eine 100% richtige Lösung bekommt er nur,
wen alle antworten. Aber wie viele Rückläufer muss er haben,
dass die Antwort z.B. mit einer 10% Wahrscheinlichkeit richtig
ist (oder 1% oder 5%).
„Richtig“ lässt sich stat. nicht fassen. welcher Wert ist denn richtig? Wenn man einen Wert vorgibt, von dem man aus welchen Gründen auch immer ausgeht, dass er richitig ist, kann man diese W’keit angeben. Sonst nicht. Zentral ist da auch wieder das KI.
Wäre schon spannend… würde vermutlich die ein oder andere
„representative Umfrage“ als wenig valide entlarven 
Valide und repräsentativ ist wieder etwas anderes. Zwar kann eine Studie repäsentativ unter den o.g. Umständen sein, aber nicht valide, weil z.B. eine falshe Methode verwendet wurde.
Es gibt viele Fehlerquellen dabei, die man machen kann, angefangen von der Fragestellung über die Planung, die Durchführung bis hin zur Auswertung. Leider iste s aber usus, dass sich viele mal bemüssigt fühlen, ohne das nötige Vorwissen eine Umfrage zu machen.
Von daher gehe ich davon aus, dass eine Vielzahl der Umfragen nicht repäsentativ oder valide ist.
Grüße,
JPL