Logarithmus und Standardabweichung

Hallo,

habe mal eine Frage zu Logarithmen und Standardabweichung.

Wenn ich lineare Zahlen (arith. Mittelwerte) in einem Balkendiagramm logarithmisch darstelle und die Standardabweichung (linear berechnet) mit angebe, dann ist der Fehlerbalken nach unten ja viel länger als der nach oben. Ist logisch, muss ja auch so sein.

Wenn ich aber die Zahlen log-transformiere (zur Basis 10), Standardabweichungen von den so erhaltenen Werten berechne und diese dann linear darstelle, sind die Fehlerbalken gleich lang.

Welche Berechnung (und Darstellung) der Standardabweichung ist denn nun mathematisch korrekt?
Mache ich einen Denkfehler?

Das log-transformieren muss sein, da ich sonst keine annähernd normalverteilten Daten vorliegen habe.

Viele Grüße
OnkelHeini

Hallo,

Was soll der Fehlerbalken zeigen?

Er soll doch anzeigen, in welchem Bereich die dargestellten Werte streuen. Sehr schön (und sinnvoll!) ist es, wenn der Bereich, der durch die Fehlerbalken überdeckt wird, eine interpretierbare BEDEUTUNG hat.

WENN(!) die dargestellten Daten (etwa) normalverteilt sind, dass weiß der geneigte Betrachter, dass der Bereich M+/-S etwa 63% der Werte umfasst (M=Mittelwert, S=Standardabweichung). Noch schöner ist das Intervall um M+/-2S, das etwa 95% der Werte umfasst. (Liegt einem weniger an der Streuung der Werte, sondern an der Genauigkeit der Bestimmung des Mittelwertes, kann man statt S auch den Standardfehler nehmen) Wenn die Verteilung nicht normal ist, dass hat S NICHT diese anschauliche Bedeutung! (zwar ist S weiterhin das mittlere Abweichungsquadrat zum Mittelwert, aber das ist dann eben auch schon alles!)

Natürlich kann man auch dann den Bereich eingrenzen, der 95% der Werte enthält, wenn die Verteilung der Werte nicht normal ist (also zB. log-normal oder Poisson oder exponentiell oder oder). Dann kann man aber nicht die S nehmen, sondern muss die entsprechenden Quantilen hernehmen. Bei nicht-symmetrischen Verteilungen ergibt sich damit ganz natürlich auch ein nicht-symmetrischer Bereich (den man dann eben als Fehlerbalken in einem Diagramm darstellen kann).

Genau das könntest Du für deine Ausgangsdaten machen.

Nun kannst Du aber auch Deine Daten (X) so transformieren (nämlich logarithmieren), dass die transformierten Werte (nennen wir sie X’) etwa normalverteilt sind. Wenn Du DIES (transformierten) Werte X’ in einem Diagramm darstellst, dann wirst du dort DEREN Mittelwert M’ sowie DEREN Streubreite S’ angeben. S’ hat nun wieder die anschauliche Bedeutung, dass 95% der Werte X’ in dem Intervall M’+/-S’ liegen.

Ausgehend von DIESEN transformierten Werten kannst du auch das (asymmetrische) Intervall für die Ausgangsdaten berechnen. Die Grenzen des 95%-Streuintervalls sind dann nämlich einfach die RÜCKtransformierten Werte von (M’-2S’) und (M’+2S’).

LG
Jochen

Hallo Jochen,

vielen Dank für Deine ausführliche Antwort. Hat mir sehr geholfen!

Viele Grüße
OnkelHeini