Differenz von Median und arithmetischem Mittel?

Hallo an Alle…

Ich habe von einem Datensatz den Median und das arithmetische Mittel bestimmt. Bei den beiden Werten taucht aber eine Differenz auf!

Ich habe mir gedacht, dass bei dem Median die sogenannten „Ausreißer-Werte“ nicht so ins gewicht gefallen! Stimmt das?
Und wenn ja, wie kann man das erklären?

Hi,

Ich habe von einem Datensatz den Median und das arithmetische
Mittel bestimmt. Bei den beiden Werten taucht aber eine
Differenz auf!

Nicht verwunderlich, wenn man bedenkt, dass Median und arithmetisches Mittel etwas völlig verschiedenes sind…

Ich habe mir gedacht, dass bei dem Median die sogenannten
„Ausreißer-Werte“ nicht so ins gewicht gefallen! Stimmt das?

So allgemein… Nein.

Und wenn ja, wie kann man das erklären?

http://de.wikipedia.org/wiki/Median
http://de.wikipedia.org/wiki/Arithmetisches_Mittel

Gruß

Anwar

Moin,

Ich habe von einem Datensatz den Median und das arithmetische
Mittel bestimmt. Bei den beiden Werten taucht aber eine
Differenz auf!

es gibt nur wenige Ausnahmen, bei denen sie zusammenfallen.

Ich habe mir gedacht, dass bei dem Median die sogenannten
„Ausreißer-Werte“ nicht so ins gewicht gefallen! Stimmt das?

Es kann sein, muss aber nicht. Er hat aber andere Nachteile, die das arithmetische Mittel nicht hat.
Man muss schon wissen, was man mit welcher Werteverteilung macht, bzw. mus bewerten, welche Ergenisse herauskommen und ob sie für den beabsichtigentn Zweck sinnvoll sind.

Gandalf

Ergänzung

Man muss schon wissen, was man mit welcher Werteverteilung
macht, bzw. mus bewerten, welche Ergenisse herauskommen und ob
sie für den beabsichtigentn Zweck sinnvoll sind.

Als Ergänzung dazu: Auch umgekehrt wird ein Schuh draus - wenn man einen Datensatz hat und sich erstmal einen Überblick verschaffen möche, hilft es zunächst mal Mittel, Median und Modus zu ziehen und aus der Relation der drei weitere Schritte zu überlegen.

Gruß

Anwar

hi,

Ich habe von einem Datensatz den Median und das arithmetische
Mittel bestimmt. Bei den beiden Werten taucht aber eine
Differenz auf!

Ich habe mir gedacht, dass bei dem Median die sogenannten
„Ausreißer-Werte“ nicht so ins gewicht gefallen! Stimmt das?
Und wenn ja, wie kann man das erklären?

sagen wir, du hast folgende messwerte (und es handle sich um metrische daten, mit denen man rechnen kann).

100, 120, 120, 120, 125, 130, 132, 133, 160

dann ist der modus (der am häufigsten auftretende wert) 120
der median (der mittlere wert) ist 125 (4 liegen drunter, 4 liegen drüber)
der mittelwert ist 126,66…

du hast in dieser angelegenheit offenbar einen kleinen „ausreißer“: die 160. wenn das 170 wären, wär das dem modus und dem median völlig egal. die sind da „stabil“. der mittelwert wär dann bereits 127,77…

typischerweise sind z.b. einkommensverteilungen so, dass der median meist deutlich unter dem mittelwert liegt, denn die relativ wenigen groß- und größtverdiener (incl. boni usw.) ziehen den mittelwert nach oben. berechtigterweise kommen deutlich mehr als 50% der menschen zum schluss, dass sie niemals auf das durchschnittseinkommen kommen.

für modus und median musst du nur zählen können; für den mittelwert musst du mit deinen daten rechnen dürfen. für den median musst du die daten wenigstens der größe nach anordnen können; für den modus ist nicht einmal das nötig.

m.

Hi,

Ich habe mir gedacht, dass bei dem Median die sogenannten
„Ausreißer-Werte“ nicht so ins gewicht gefallen! Stimmt das?
Und wenn ja, wie kann man das erklären?

Der Mittelwert reagiert sensitiver auf Verschiebungen bei den Messwerten, das einfachste Bsp ist wohl, dass man das maximum einfach verdoppelt. Während sich der Median nicht ändert, verschiebt sich der mean durchaus.
Der Grund ist, dass der mean die Werte selber verwendet, der Median aber auf den Rängen basiert und dann in die reellen Werte zurückgerechnet wird. In dem Fall oben ist 2*max natürlich auch das max, also ändert sich an den Rängen der Messreihe nix, daher der gleiche Median. Da aber 2*max Max, ändert sich der mean durchaus.

I.a. würde ich mich aber mit einer derartigen Beschreibung nicht lange aufhalten, sondern so vorgehen, wie Anwar es in seiner Ergänzung vorschlägt.

Grüße,
JPL

Hallo,

Der Mittelwert reagiert sensitiver auf Verschiebungen bei den
Messwerten

Das ist sicher oft so, aber eine allgemeine Regel kann man daraus nicht machen. Es sind durchaus Datensätze denkbar, bei denen sich der Mittelwert gar nicht verändert, der Median aber schon.

Gruß

Anwar

Hi,

Der Mittelwert reagiert sensitiver auf Verschiebungen bei den
Messwerten

Das ist sicher oft so, aber eine allgemeine Regel kann man
daraus nicht machen.

Nur weil ich mir das ‚i.a.‘ spare, meine ich ja nicht ‚immer‘.

Es sind durchaus Datensätze denkbar, bei
denen sich der Mittelwert gar nicht verändert, der Median aber
schon.

klar, z.B.
x=c(1,2,3);mean(x); median(x)
[1] 2
[1] 2
> x=c(1,1,2,2.25,2.75,3);mean(x); median(x)
[1] 2
[1] 2.125
ist so ein Fall. Wobei man die Werte 1,2.25 und 2.75 schwerlich als Ausreisser Bezeichnen kann.
Interessanter ist da schon
x=c(-2,1,2,3,3.5,4.5);mean(x); median(x)
[1] 2
[1] 2.5
Hier verändert sich der median weil man asymmetrisch ergänzt und statt 3 nun 6 Werte hat, aber nicht weil er sensitiv gegenüber dem Ausreißer, sprich dem Wert der ergänzten Werte selber ist, denn
x=c(-200,1,2,3,3.5,202.5);mean(x); median(x)
[1] 2
[1] 2.5
ist ja immer noch dasselbe.
Varriert man nun das maximum im Bereich ]3.5, 202.5[u]202.5, oo[ wird sich nun aber der mean ändern, der median aber nicht. Von daher ist der mean also deutlich sensitiver in Bezug auf (den Wert der) Ausreisser.

Grüße,
JPL