Hallo,
vielleicht eine einfache Frage…
vielleicht eine schwierige Antwort…
Ist der Wert der Standardabweichung abhaengig
von der Anzahl der Messwerte? (ich denke ja)
Ja.
Ein Mittelwert pendelt sich ja auch erst mit der Zeit um
seinen ‚wahren‘ Wert herum ein.
Genauer: mit zunemhendem Umfang der Stichprobe. Diese Anmerkung von Dir macht klar, daß du hier von einer Schätzung der Standardabweichung (SD) sprichst. Du gehst also davon aus, daß es eine Population (Grundgesamtheit) gibt, deren SD dich eigentlich interessiert. Die SD (wie auch der Mittelwert und jede andere statistische Kenngröße) einer Population ist natürlich eine fixe Größe und hat einen bestimmten Wert. Den bekommst du aber nur, wenn du alle Einzelwerte zur Berechnung nimmst. Und, wie du korrekt anmerkst: Je größer der Stichprobenumfang, desto kleiner der Bereich um den aus der Stichprobe berechneten Schätzer, in dem der (unbekannte) Wert der Population mit gegebener Wahrscheinlichkeit liegen wird.
Diesen Bereich nennt man Konfidenzintervall (KI, engl. confidence interval CI oder auch Vertrauensintervall). Das 95%-KI zB ist dasjenige Intervall, welches den „wahren“ Wert (der Population) mit einer Wahrscheinlichkeit von 95% enthält. Näheres hier: http://de.wikipedia.org/wiki/Vertrauensintervall.
Um das zu berechnen, muß man die Verteilung des betreffenden Wertes (hier zB von der SD) kennen. Die Standardabweichung berechnet sich aus der Summe von Abweichungsquadraten, und Abweichungsquadrate sind Chi²-verteilt. Die genaue Form dieser Verteilung hängt in der Tat ab von der „Zahl der Freiheitsgrade“, was im Prinzip ein Maß für die Anzahl der Werte ist. Nachlesen kannst du das hier: http://de.wikipedia.org/wiki/Chi-Quadrat-Verteilung. Eine Quantilentabelle gibt’s hier: http://www.dkfz-heidelberg.de/epi/StatMeth/bioskrip/….
Wieviele Messwerte braucht man also um den wahren Wert (bzw
die Standardabw.) innerhalb einer vorgegebenen Grenze benennen
zu koennen,
Dazu mußt du von einem gegeben KI auf den Stichprobenumfang schließen. Das übersteigt meine Fähigkeiten deutlich, da bin ich aber auch dankbar, wenn mir das jemand zeigen könnte, wie man das macht.
Eine Näherungslösung habe ich aber: Die Breite des 95%-KI für die SD läßt sich durch die Funktion DeltaKI = sigma * e*n^(-0.53) ganz gut beschreiben. Dabei ist sigma die (idR unbekannte) SD der Population. Hier beißt sich die Katze etwas in den Schwanz, aber als Richtwert kann man ja eine angenommene oder auch die geschätzte SD nehmen. Die Formel läßt sich für ein DeltaKI bene nach n auflösen.
Grüße,
Jochen