Messdatenauswertung: Klassen von Ausreissern entf?

Hallo zusammen,

ich habe pro Zeiteinheit n Messwerte, deren Mittelwert (MW) ich für weitergehende Berechnungen verwende. Nun kommt es teilweise vor, dass sich diese Messwerte in 2-5 Klassen gruppieren (jeweils mit Abstand von ca. 400), sodass der MW keine gute Annäherung des tatsächlichen Wertes mehr ist.

Das sieht dann z.B. so aus (Histogramm der Abweichungen vom MW):
http://www.pic-upload.de/30.03.09/78x9fz.png

Ich gehe davon aus, dass die Klasse mit den meisten Messwerten die Lage des tatsächlichen Wertes beschreibt. Darum würde ich gerne nur deren Werte in die Berechnung des MW einbeziehen. Einfach alles wegwerfen, was weiter weg als a*Standardabweichung funktioniert bei der Verteilung natürlich nicht. Wie kann ich da vorgehen, um eine Klassifizierung vorzunehmen?

Gruss, operator

Hi,

warum klassifizierst du denn die Werte überhaupt? Der MW ist bei Normalverteilung ein erwartungstreuer Schätzer für den Erwartungswert, ansonsten kannst du auch den Median nehmen, dann deckt man z.B. noch die Lognormalverteilung ab.
aber von einer beliebigen(?) Klasseneinteilung darauf zu schließen, dass der MW deine Daten nicht gut schätzt ist nur dann zulässig, wenn sich unter nahezu jeder sinnvollen Klasseneinteilung eine mehgipflige Verteilung ergibt (leider kann ich deine Grafik nicht aufmachen).

Ich gehe davon aus, dass die Klasse mit den meisten Messwerten die
Lage des tatsächlichen Wertes beschreibt. Darum würde ich gerne nur
deren Werte in die Berechnung des MW einbeziehen.

Das solltest du nicht tun. erastens liegen die Werte vor und wenn du nicht aufgrund von Messfehlern oder anderen schwerwiegenden Einwänden Werte eliminieren kannst wäre das glatte Fälschung und vollkommen data-driven.

Einfach alles
wegwerfen, was weiter weg als a*Standardabweichung funktioniert bei
der Verteilung natürlich nicht. Wie kann ich da vorgehen, um eine
Klassifizierung vorzunehmen?

Nochmal: Warum überhaupt klassifizieren? Lies mal „Disappointing dichotomies“ von S. Senn, 2003.
Wenn es dir nur um die Häufigkeitsverteilung geht kannst du die Klassen auch selber ändern, sowohl Anzahl als auch Breite. eben deswegen ist diese Darstellung immer mit Vorsicht zu geniessen.

Grüße,
JPL