Stichprobenvarianz

Wann benutzt man bei der Varianz
(I): 1/n *summe(xi-xquer)²
und wann benutzt man
(II): 1/(n-1) *summe(xi-xquer)² ?
Bei grossen Stichproben ist das wohl egal - aber bei kleinen spielt dies eine Rolle.
Warum steht in manchen Büchern die Formal (I)
und in anderen die Formel (II) ?
Gibt es da irgendwelche Regeln bzw. wie begründet man diese unterschiedliche Herangehensweise?

Grundgesamtheitsabweichung vs. Standardabweichung
Hi,

Wann benutzt man bei der Varianz
(I): 1/n *summe(xi-xquer)²
und wann benutzt man
(II): 1/(n-1) *summe(xi-xquer)² ?

(I) nimmt man, wenn der Mittelwert BEKANNT ist. Der Mittelwert muss also nicht aus den Daten geschätzt werden, somit stehen alle n Freiheitsgrade zur Berechnung der Standardabweichung zur Verfügung.

(II) nimmt man, wenn der der Mittelwert UNBEKANNT ist.
Somit muss man ihn erst einmal aus den n Daten schätzen und verliert einen Freiheitsgrad, deshalb n-1.

Ein paar Anmerkungen, vielleicht hilft es:
Wenn man statt n Werten nur n-1 Werte und den Mittelwert der n Werte angibt, dann hat man exakt die gleiche Menge an Information.
Durch die Angabe des Mittelwertes wird man hinsichtlich der freien Wahl der Originaldaten (Freiheitsgrade) um 1 eingeschränkt.
Wenn man also n-1 Daten frei wählt, dann ergibt sich der n-te Wert zwangsläufig aus der Information des Mittelwertes. Der n-te Wert ist also nicht mehr frei wählbar.
Gruss,

Vielen Dank helge - für die schnelle und genaue Beantwortung meiner Frage. Es hat mir sehr geholfen.

Hallo,

Warum steht in manchen Büchern die Formal (I)
und in anderen die Formel (II) ?
Gibt es da irgendwelche Regeln bzw. wie begründet man diese
unterschiedliche Herangehensweise?

Formel (I) ist die Stichprobenvarianz, Formel (II) ist dagegen nicht die Stichprobenvarianz, sondern eine erwartungstreue Schätzung der Populationsvarianz.

siehe http://www.wer-weiss-was.de/cgi-bin/forum/showarchiv…

Grüße,

Oliver Walter