Standardabweichung

Hallo,
vielleicht eine einfache Frage…
Ist der Wert der Standardabweichung abhaengig
von der Anzahl der Messwerte? (ich denke ja)
Ein Mittelwert pendelt sich ja auch erst mit der Zeit um seinen ‚wahren‘ Wert herum ein.
Wieviele Messwerte braucht man also um den wahren Wert (bzw die Standardabw.) innerhalb einer vorgegebenen Grenze benennen zu koennen,
bzw. dass ein weiterer Messwert den Wert der Standardabweichung
nur noch minimal aendert.

Beispiel:
Messwert Mittelwert Standardabweichung
5
4 4.5 0.7071
1 3.3 2.0817
5 3.8 1.8930
4 3.8 1.6432
3 3.7 1.5055

Danke fuer Eure Antworten
Arthur

Ich denke die Standartabweichung als solche zeigt nur einen bestimmten Toleranzwert gegenüber einer Vorgabe ( Messung)

egal wie oft Du eine Semmel wiegst, die Gewichtsabweichung darf ein bestimmtes Limit nun mal nicht (über) unterschreiten!
Ich denke in diesem Fall geht es um Messvorgaben die eine bestimmte festgelegte Toleranz zulassen.

Oder???

Silvio

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo,

vielleicht eine einfache Frage…

vielleicht eine schwierige Antwort…

Ist der Wert der Standardabweichung abhaengig
von der Anzahl der Messwerte? (ich denke ja)

Ja.

Ein Mittelwert pendelt sich ja auch erst mit der Zeit um
seinen ‚wahren‘ Wert herum ein.

Genauer: mit zunemhendem Umfang der Stichprobe. Diese Anmerkung von Dir macht klar, daß du hier von einer Schätzung der Standardabweichung (SD) sprichst. Du gehst also davon aus, daß es eine Population (Grundgesamtheit) gibt, deren SD dich eigentlich interessiert. Die SD (wie auch der Mittelwert und jede andere statistische Kenngröße) einer Population ist natürlich eine fixe Größe und hat einen bestimmten Wert. Den bekommst du aber nur, wenn du alle Einzelwerte zur Berechnung nimmst. Und, wie du korrekt anmerkst: Je größer der Stichprobenumfang, desto kleiner der Bereich um den aus der Stichprobe berechneten Schätzer, in dem der (unbekannte) Wert der Population mit gegebener Wahrscheinlichkeit liegen wird.

Diesen Bereich nennt man Konfidenzintervall (KI, engl. confidence interval CI oder auch Vertrauensintervall). Das 95%-KI zB ist dasjenige Intervall, welches den „wahren“ Wert (der Population) mit einer Wahrscheinlichkeit von 95% enthält. Näheres hier: http://de.wikipedia.org/wiki/Vertrauensintervall.

Um das zu berechnen, muß man die Verteilung des betreffenden Wertes (hier zB von der SD) kennen. Die Standardabweichung berechnet sich aus der Summe von Abweichungsquadraten, und Abweichungsquadrate sind Chi²-verteilt. Die genaue Form dieser Verteilung hängt in der Tat ab von der „Zahl der Freiheitsgrade“, was im Prinzip ein Maß für die Anzahl der Werte ist. Nachlesen kannst du das hier: http://de.wikipedia.org/wiki/Chi-Quadrat-Verteilung. Eine Quantilentabelle gibt’s hier: http://www.dkfz-heidelberg.de/epi/StatMeth/bioskrip/….

Wieviele Messwerte braucht man also um den wahren Wert (bzw
die Standardabw.) innerhalb einer vorgegebenen Grenze benennen
zu koennen,

Dazu mußt du von einem gegeben KI auf den Stichprobenumfang schließen. Das übersteigt meine Fähigkeiten deutlich, da bin ich aber auch dankbar, wenn mir das jemand zeigen könnte, wie man das macht.

Eine Näherungslösung habe ich aber: Die Breite des 95%-KI für die SD läßt sich durch die Funktion DeltaKI = sigma * e*n^(-0.53) ganz gut beschreiben. Dabei ist sigma die (idR unbekannte) SD der Population. Hier beißt sich die Katze etwas in den Schwanz, aber als Richtwert kann man ja eine angenommene oder auch die geschätzte SD nehmen. Die Formel läßt sich für ein DeltaKI bene nach n auflösen.

Grüße,
Jochen

1 „Gefällt mir“

hallo arthur

ab einer gewissen mindest-grundmenge ist die standardabweichung, sowie auch der mittelwert nicht mehr von der anzahl der elemente abhängig. deshalb kann man in der statistik von auszügen aus der gesamtmenge auf die gesamtemenge selbst schliessen.

eine exakte bestimmung der mindest-grundmenge kenne ich selber nicht. auf jeden fall sollten, wie oben erwähnt, dann mittelwert und standardabweichung konstant sein. vielleicht kennt jemand ja noch eine formel dazu.

würd mich jetzt noch wundernehmen: hast du als meteorologe probleme mit zuwenig messdaten?

grüssli
coco

Hallo,

soweit wie Jo war ich auch schon…
echt peinlich, weil ich Statistik studiert habe…

Also, das Problem bei dem Konfidenzintervall ist, dass man die Quantile der Chi^2(n) und die Chi^2(n+1)-Verteilung, die du bei einem Messwert mehr brauchst, nicht ineinander umrechnen kannst. Wenn du in das Konfidenzintervall für die Standardabweichung aber die Approximationsformel für die Chiquadrat-Verteilung einsetzt (über eine Varianz stabilisierende Transformation: chi^2(n)_(1-alpha) = 1/2 [z_(1-alpha) + sqrt(2n)]^2 ), kannst du zumindest nach n auflösen.

Für die Bestimmung des Mindeststichprobenumfangs brauchst du dann üblicherweise noch einen Fehler, den du zu tolerieren bereit bist. Also das, was du unter „zu vernachlässigender Änderung“ verstehst.

Analytisch ist es ziemlich verzwickt. Wahrscheinlich geht es numerisch um einiges schneller.

Andererseits - warum sollte sich eigentlich die Mindeststichprobengröße für die Varianz/Stabw von der für den Erwartungswert unterscheiden? Dann wäre es erheblich einfacher (dafür gibt’s eine Formel).

Gruß
Katharina

Hi,

noch eine Idee:

für die Differenz D von 2 Zufallsgrößen S_1^2/sigma^2 ~ Chi^2(n) und S_2^2/sigma^2 ~ Chi^2(n-1) gilt D ~ Chi^2(n-(n-1))=Chi^2(1). Aber nur, wenn S_1^2 und S_2^2 unabhängig sind - sind sie hier ja nicht!!!

Also, dich interessiert ja, wie wahrscheinlich noch ein Wert gemessen wird, der so extrem ist, dass sich S merklich verändert. Jeder neue Wert x_n geht also mit dem Gewicht 1/n ein. Nimmt man für die Messwerte vereinfacht eine Normalverteilung an mit S^2 als Varianzschätzer, so ist das Problem mE identisch mit der „ganz normalen“ Suche nach dem Mindeststichprobenumfang:

Andererseits - warum sollte sich eigentlich die
Mindeststichprobengröße für die Varianz/Stabw von der für den
Erwartungswert unterscheiden? Dann wäre es erheblich einfacher
(dafür gibt’s eine Formel).

Die Formel lautet:
(n-1) >= [z_1-alpha]^2/Epsilon * S^2 (Epsilon ist der absolute Fehler)
Sieht man übrigens ziemlich schnell im Konfidenzintervall für den Mittelwert my, wenn man x_quer-my=Epsilon setzt und das Ganze umformt.

Ich hoffe, das war’s.

Gruß
Katharina

1 „Gefällt mir“

Hallo Zusammen,
vielen Dank fuer das rege Interesse an meiner Frage
und die wirklich hilfreichen Antworten.
Ich mache mich nun mal daran das alles zu probieren und zu
analysieren und wenn ich noch Fragen habe, dann weiss ich ja
wer mir helfen kann.

Danke nochmal
Arthur