Hallo,
ganz banal:
basiersend auf der gegebenen (Zufalls-)Stichprobe ist die beste Schätzung für die Grundgesamtheit, dass die Anteile (gut, schlecht, k.A.) dort genauso groß sind wie in der Stichprobe.
D.h.: Wenn von 280 Daten in der Stichprobe 50 „gut“ sind, so ist das ein Anteil von 50/280 = 17,86%. Genau dieser Anteil ist die beste Schätzung für den Anteil für „gut“ in der Grundgesamtheit. Wenn diese 1430 umfasst, so entspricht das 1430*17,86% = 255.
Neben dieser „Punktschätzung“ kann man auch noch angeben, wei gut, also wie genau die Schätzung ist, d.h., welchen Schätzfehler man im Mittel so erwarten kann. Das macht man am besten über die Angabe eines sog. Konfidenzintervalls (KI). Ein solches Interval steckt einen Bereich ab, für den man mit einer gegebenen Sicherheit (meist 95%; das 95%-KI) sagen kann, dass der wahre Anteilswert irgendwo in diesem Bereich liegt.
Um das 95%-KI zu bestimmen, muss man den Standardfehler und die Verteilungsfunktion kennen. Der Standardfehler eines Anteilswertes p aus einer Stichprobe vom Umfang n ist
SE = WURZEL( p*(1-p) / n )
Wenn n hinreichend groß ist (n>30, das ist hier der Fall), dann entspricht die Verteilungsfunktion ganz gut der Normalverteilung. Bei der Normalverteilung liegen 95% der Werte im Bereich von plusminius 1,96 Standardabweichungen um den Mittelwert. Mit der Punktschätzung als Mittelwert und dem Standardfehler als Standardabweichung der Verteilungsfunktion folgt daraus für das 95%-KI:
p +/- 1,96*SE
Zum Beispiel:
n = 280
p = 17,86% = 0,1786 (die 50 "gut"en)
SE = WURZEL( 0,1786*(1-0,1786) / 280 ) = 0.023
95%-KI = 0,1786 +/- 1.96*0.023 = 0,1337 … 0,2234
Der Anteilswert für „gut“ in der GG liegt also mit 95%iger Sicherheit zwischen 13,37% und 22,34%, die beste Schätzung ist 17,86%.
Willst du statt 95%iger Sicherheit eine 99%ige Sicherheit, dann mußt du statt mit 1,96 mit 2,58 multiplizieren.
Ich würde das so für die drei Klassen (gut/schlecht/k.A.) machen. Das ist gut genug. Mathematisch ganz korrekt ist es aber nicht. Hier könnte man noch berücksichtigen, dass die GG endlich groß ist und dass die Stichprobenfehler für die drei Anteilswerte korreliert sind. Das ist aber echt Kleinkram. So wie beschrieben bekommst du „konservative“ Schätzungen, d.h., die tatsächliche Genauigkeit ist (im Mittel) noch etwas größer als die berechnete. Von daher bist Du auf der „sicheren Seite“.
VG
Jochen