Hallo Hans,
ich dachte das hätte etwas mit Stichprobe (n-1) oder
Grundgesamtheit zu tun (n). Liege ich da falsch?
Nein, du liegst richtig.
Du schreibst „wenn die Mittelwertsinformation „von aussen“
zugeführt wird“ Was bedeutet das?
Das bedeutet, dass der Populationsmittelwert bekannt ist und nicht aus der Stichprobe berechnet werden muss (Population=Grundgesamtheit). Üblicherweise ist der wahre Mittelwert genau dann bekannt, wenn ALLE Werte der Population bekannt sind, womit sich dann natürlich auch die Populations-Standardabweichung berechnen läßt.
Nochmal alles zusammen:
Eine statistische Population hat üblicherweise unendlich viele Werte. Diese unendlich vielen Werte haben einen wohldefinierten (meist unbekannten) Mittelwert (M) und eine Standardabweichung (S, bzw. die Varianz S²), die als Populations-M bzw. -S² bezeichnet werden.
Betrachten wir zunächst den Mittelwert:
Der Mittelwert ist der Erwartungswert der Werte X: M=E(X), wobei der Erwartungswert die (unendliche) Summe aller Einzelwerte (xi) ist, geteilt durch die (unendliche) Anzahl der Werte (N). Wenn N endlich ist, kann man M wirklich ermitteln, jedoch ist auch dann N oft noch zu groß oder man kommt aus praktischen Gründen nicht an alle Werte ran. In aller Regel muss M daher anhand endlicher, praktisch handhabbarer Stichproben (vom Umfang n) durch das arithmetische Mittel m geschätzt werden (beachte: Kleinbuchstabe -> Schätzung des Großbuchstabens). Das arithmetischen Mittel wird ja im Prinzip genau so berechnet wie der Erwartungswert (E(X)=M), nur eben mit einer endlich großen Stichprobe.
Nun kann man überlegen, wie gut diese Schätzung von M durch m ist. Ein wichtiges Kriterium für die Güte ist die Erwartungstreue, d.h., die Eigenschaft des Schätzers, im Mittel vieler Solcher Schätzungen den wahren Wert M als Erwartungswert zu haben (anders gesagt: dass man im Mittel erwarten kann, den korrekten Wert zu bekommen). Mathematisch ist das der Erwartungswert der Mittelwerte: E(m) = E(E(X)). Man kann zeigen, dass E(E(X)) = E(X), also dass der Erwartungswert der m’s gleich dem Erwartungswert der Werte selbst ist. Der Schätzer ist also erwartungstreu.
Wenn das klar ist, können wir mit der Standardabweichung bzw. der Varianz weitermachen:
Analog dem Populations-M ist die Populations-S² definiert als der Erwartungswert der quadrierten Abweichungen der Werte zu ihrem Erwartungswert: S² = E( (X-E(X))² ) = E((X-M)²). Und richtig: Wenn man nur eine Stichprobe hat, ist M nicht bekannt und muss ebenfallst aus der Stichprobe geschätzt werden. Man könnte S² anhand der Formel s² = 1/n * Summe((xi-m)²) schätzen. Dieser Schätzer ist aber nicht erwartungstreu. Man kann zeigen, dass der Erwartungswert des Schätzers nicht gleich S² ist. Vielmehr gilt E(s²) = (n-1)/n * S². Um das zu korrigieren, kann man den Schätzer also schlicht mit n/(n-1) multiplizieren. Der erwartungstreue Schätzer berechnet sich dann zu n/(n-1) * 1/n * Summe((xi-m)²) = 1/(n-1) * Summe((xi-m)²).
Je größer der Umfang der Stichprobe (n) ist, desto geringer ist der Fehler. Bei sehr großen Stichproben ist es praktisch egal, ob der winzige Fehler korrigiert wird (Formel für die Stichprobenvarianz) oder nicht (Formel für der Populationsvarianz).
Die Korrektur bezieht sich auf die Schätzung der Varianz einer unendlich großen Population anhand einer Strichprobe. Wenn man keine Stichprobe hat, sondern schlicht die Varianz der Werte berechnen will, dann muss (darf) man nicht korrigieren, d.h., man muss die Formel für die Populationsvarianz nahmen. Die paar Werte _sind_ dann die Population.
LG
Jochen