in welchen Fällen benutzt man eigentlich Standardabweichung und wann Konfidenzintervalle?
Die Standardabweichung ist ein Maß für die Streuung der Stichprobenwerte um einen Mittelwert und das Konfidenzinterwall gibt eine Wahrscheinlichkeit an mit der der Mittelwert in einem genannten Bereich liegt, z.B. 95%ige Wahrscheinlichkeit. Richtig? Aber wann ist die eine oder das andere besser geeignet?
Und gibt es jeweils einen minimalen Stichprobenumfang?
in welchen Fällen benutzt man eigentlich Standardabweichung
und wann Konfidenzintervalle?
Vorsicht: die Std.abweichung ist ein Moment einer Stichprobe
oder einer Verteilung. Ein Konfidenzintervall dagegen der Bereich
innerhalb dessen man ein Ergebnis einer bestimmten Verteilung oder
Stichprobe zugehörig einordnet.
Die Standardabweichung ist ein Maß für die Streuung der
Stichprobenwerte um einen Mittelwert und das
Stimmt
Konfidenzinterwall gibt eine Wahrscheinlichkeit an mit der der
Mittelwert in einem genannten Bereich liegt, z.B. 95%ige
Wahrscheinlichkeit. Richtig? Aber wann ist die eine oder das
andere besser geeignet?
Falsch, da Konfidenz auf deutsch Vertrauen heisst. Ausserdem
ist die Std.abw. ein Teil der Berechnung eines KI-Intervalls.
Zudem ist 95% eine (nicht immer sinnvolle) Festlegung.
Siehe auch http://de.wikipedia.org/wiki/Konfidenzintervall
Und gibt es jeweils einen minimalen Stichprobenumfang?
Also es kommt auf den Test an, wenn aussagekräftige Ergebnisse
verlangt sind
Vorsicht: die Std.abweichung ist ein Moment einer Stichprobe
oder einer Verteilung. Ein Konfidenzintervall dagegen der Bereich
innerhalb dessen man ein Ergebnis einer bestimmten Verteilung oder
Stichprobe zugehörig einordnet.
Das habe ich nicht verstanden. Was heißt Moment?
Ist mit Ergebnis z.B. der Mittelwert gemeint?
Wenn ich die explorative Datenanalyse von SPSS nutze, wird ein Konfidenzintervall für meine Daten angegeben. Woher weiß ich, auf welche Verteilung sich das bezieht?
Im ILMES steht ganz schön:
„Die manchmal (auch in früheren Versionen dieses Textes zu findende) Redeweise von der „Wahrscheinlichkeit, mit der der wahre Wert in dem Intervall liegt“ (oder nicht liegt) ist daher formal nicht korrekt. Der wahre Wert liegt entweder in dem gegebenen Intervall oder nicht. Vielmehr ist eine Aussage über ein Konfidenzintervall mit einer (beispielsweise) 95-prozentigen Überdeckungswahrscheinlichkeit so zu verstehen, dass in 95 Prozent aller Stichproben das K. den wahren Wert enthält.“
OK. Des Weiteren weiß ich jetzt, dass das Konfidenzintervall sich aus der Stichprobengröße und der Variabilität der Grundgesamtheit abhängt. Darunter kann ich mir was vorstellen. Den Text in Wikipedia habe ich noch nicht durchschaut.
Also es kommt auf den Test an, wenn aussagekräftige Ergebnisse
verlangt sind
Gilt das Konfidenzintervall immer bezogen auf einen bestimmten statistischen Test? Habs nicht kapiert.
Wann benutze ich „nur“ die Standardabweichung und wann ist das Konfidenzintervall geeignet?
Vorsicht: die Std.abweichung ist ein Moment einer Stichprobe
oder einer Verteilung. Ein Konfidenzintervall dagegen der Bereich
innerhalb dessen man ein Ergebnis einer bestimmten Verteilung oder
Stichprobe zugehörig einordnet.
Das habe ich nicht verstanden. Was heißt Moment?
Erwartungswert und Std.abweichung.
Ist mit Ergebnis z.B. der Mittelwert gemeint?
Nein, eine x-beliebige Zahl, die Teil einer W.keitsverteilung sein
soll. Beispiel: mit einem normalen Würfel kann man einmalig
keine 7 würfeln. Statistisch gesehen liegt diese Zahl ausserhalb
des KI’s (Normalverteilung, EW: 3,5, Std.abw ~2,3)
Wenn ich die explorative Datenanalyse von SPSS nutze, wird ein
Konfidenzintervall für meine Daten angegeben. Woher weiß ich,
auf welche Verteilung sich das bezieht?
SPSS wird die Formeln für die Momente der jeweils gewählten
Verteilung wolh intus haben, oder ?
Im ILMES steht ganz schön:
„Die manchmal (auch in früheren Versionen dieses Textes zu
findende) Redeweise von der „Wahrscheinlichkeit, mit der der
wahre Wert in dem Intervall liegt“ (oder nicht liegt) ist
daher formal nicht korrekt. Der wahre Wert liegt entweder in
dem gegebenen Intervall oder nicht. Vielmehr ist eine Aussage
über ein Konfidenzintervall mit einer (beispielsweise)
95-prozentigen Überdeckungswahrscheinlichkeit so zu verstehen,
dass in 95 Prozent aller Stichproben das K. den wahren Wert
enthält.“
Stimmt
OK. Des Weiteren weiß ich jetzt, dass das Konfidenzintervall
sich aus der Stichprobengröße und der Variabilität der
Grundgesamtheit abhängt. Darunter kann ich mir was vorstellen.
Den Text in Wikipedia habe ich noch nicht durchschaut.
Also es kommt auf den Test an, wenn aussagekräftige Ergebnisse
verlangt sind
Gilt das Konfidenzintervall immer bezogen auf einen bestimmten
statistischen Test? Habs nicht kapiert.
Auf die Verteilung. Eine Poissonverteilung hat andere Formeln für
die Momente als z.B. die Gleichverteilung
Wann benutze ich „nur“ die Standardabweichung und wann ist das
Konfidenzintervall geeignet?
Ich habe jetzt eine Vorstellung davon, was das KI ist, aber:
In welchem konkreten Beispiel benutze ich das Konfidenzintervall? Wofür genau? Wann macht es Sinn in der Praxis?
Ich habe jetzt eine Vorstellung davon, was das KI ist, aber:
In welchem konkreten Beispiel benutze ich das
Konfidenzintervall? Wofür genau? Wann macht es Sinn in der
Praxis?
Stichwort: Statistische Qualitätskontrolle -> Wer beurteilen
will wie es um eine Qualitätslage bestellt ist, geht von einigen
Parameterangaben aus und prüft eine Stichprobe dahingehend.
Ausreisser werden ausgesondert. Bei zuvielen davon scheint mit
der Qualität etwas nicht in Ordnung zu sein.
Konfidenzintervall als Ausreißerkontrolle?
Hallo Markus,
Du bist wohl Frühaufsteher?
Stichwort: Statistische Qualitätskontrolle -> Wer
beurteilen
will wie es um eine Qualitätslage bestellt ist, geht von
einigen
Parameterangaben aus und prüft eine Stichprobe dahingehend.
Ausreisser werden ausgesondert. Bei zuvielen davon scheint mit
der Qualität etwas nicht in Ordnung zu sein.
Heißt das, wenn ich ein Konfidenzintervall von zb den vielverwendeten 95% verwende, dass ich dann die Extremwerte bzw. Ausreißer aus dem Intervall ausgeschlossen habe?
Noch was anderes: Wie ist das denn, wenn meine Daten nicht normalverteilt oder poissonverteiilt etc. sind, sondern, ich nenne es mal unbekannt veteilt sind? In dem WIKI-Artikel stand eine Formel ür solche Fälle. Es war aber n>50 gefordert. In meinen Fällen ist n=16 Ich habe einfaktorielle Varianzanalysen gemacht (Vier Faktorstufen, je n=16) und will die Mittelwertsunterschiede anhand eine Profildiagramms mit Säulen verdeutlichen. Zudem möchte ich Fehlerbalken angeben, mit denen die Streuung (oder die Verteilung?) beschrieben wird, so dass die signifikanten Mittelwertsunterschiede deutlich erkennbar sind.
Boxplots eignen sich nicht (oder?), denn einige der Daten sind varianzheterogen, so dass ich auf Brown-Forsythe und Welch-Test zurückgreifen musste. Also liegen Median und Mittelwert ein gutes Stück auseinander. Mittelwert und KI erschienen mir als beste Variante, aber ist das methodisch korrekt?
Schönes Wochenende!
OnkelHeini, der sich auch sonntags mit seinen Daten plagt. Aber nicht mehr lange!
Heißt das, wenn ich ein Konfidenzintervall von zb den
vielverwendeten 95% verwende, dass ich dann die Extremwerte
bzw. Ausreißer aus dem Intervall ausgeschlossen habe?
So kann man es sehen.
Noch was anderes: Wie ist das denn, wenn meine Daten nicht
normalverteilt oder poissonverteiilt etc. sind, sondern, ich
nenne es mal unbekannt veteilt sind?
Anpassungstest über eine Verteilung durchführen.
Aber damit wird keine Verteilung bewiesen, man kann
die Hypothese, dass eine Stichprobe einer bestimmten
Verteilung angehört nicht verwerfen.
In dem WIKI-Artikel stand
eine Formel ür solche Fälle. Es war aber n>50 gefordert. In
meinen Fällen ist n=16 Ich habe einfaktorielle Varianzanalysen
gemacht (Vier Faktorstufen, je n=16) und will die
Mittelwertsunterschiede anhand eine Profildiagramms mit Säulen
verdeutlichen. Zudem möchte ich Fehlerbalken angeben, mit
denen die Streuung (oder die Verteilung?) beschrieben wird, so
dass die signifikanten Mittelwertsunterschiede deutlich
erkennbar sind.
Kolmogorov-Smirnoff oder Chi-Quadrat sollten da als Anp.test
wohl besser passen.
Boxplots eignen sich nicht (oder?), denn einige der Daten sind
varianzheterogen, so dass ich auf Brown-Forsythe und
Welch-Test zurückgreifen musste. Also liegen Median und
Mittelwert ein gutes Stück auseinander. Mittelwert und KI
erschienen mir als beste Variante, aber ist das methodisch
korrekt?