Modus

Hallo,
weiß jemand, wieso der Modus nicht empfindlich gegenüber Ausreißern im Datensatz ist, zB gegenüber dem arithmetischen Mittel oder dem Median? Ich kann mir das irgendwie nicht vorstellen, wo der Grund dafür liegt.

AUßerdem haben wir gesagt, dass bei dem Minimierungsproblem des Modus die Summanden den Wert Null annehmen und der Modus deshalb minimal ist. Ich verstehe das irgendwie nicht ganz.

Kann jemand freundlicherweise helfen?

Ich weiß nicht, ob das nicht zu viel wird, aber ich versuche es: Die Minimierungseigenschaft gibt es ja auch beim Median, aber wieso? Wieso werden die Abstände aller Werte a des Intervalls x(n/2) und x(n/2 +1) minimal und gleich groß und alle Werte des Intervalls könnten den Median gut abbilden?

Lieben Dank!

Hallo,

weiß jemand, wieso der Modus nicht empfindlich gegenüber
Ausreißern im Datensatz ist,

Naja, der Modus ist doch der *häufigste* Wert.

Ausreißer sind ja per definitionem nicht häufig (sonst wären es ja „typische“ Werte und keine Ausreißer fern ab von „typischen“ Werten, gelle).

Wenn ich folgende Daten habe:

3, 4, 4, 5, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 9

dann ist 6 der Modus; Werte um 6 herum sind „typisch“, weil häufig. Hängen wir nun einen Ausreißer dran, sagen wir 84:

3, 4, 4, 5, 6, 6, 6, 6, 6, 7, 7, 7, 8, 8, 9, 84

Das ändert ja nichts daran, dass 6 immer noch am häufigsten vorkommt.

AUßerdem haben wir gesagt, dass bei dem Minimierungsproblem
des Modus die Summanden den Wert Null annehmen und der Modus
deshalb minimal ist. Ich verstehe das irgendwie nicht ganz.

Ich auch nicht. Welche Summanden? Vielleicht am Beispiel:

Daten: 1, 3, 3, 67
Modus ist 3
Die Differenzen zum Modus sind -2, 0, 0, 64
Die Summe der Differenzen ist 62
Die quadrierten Differenzen sind 4, 0, 0, 4069
Die Summe der quadrierten Differenzen ist 4073

Was soll da Null oder minimal sein ??

Der *Mittelwert* ist der Wert, für den die Summe der Abweichungsquadrate minimal wird.

Ich weiß nicht, ob das nicht zu viel wird, aber ich versuche
es: Die Minimierungseigenschaft gibt es ja auch beim Median,
aber wieso? Wieso werden die Abstände aller Werte a des
Intervalls x(n/2) und x(n/2 +1) minimal und gleich groß und
alle Werte des Intervalls könnten den Median gut abbilden?

Vielleicht verstehe ich das, wenn ich die vorige Frage verstanden habe…

LG
Jochen

Hm, vielleicht hilft das weiter

http://books.google.de/books?id=md3PV9dMXq4C&dq=asse…

S. 66f und 69 zum Median

Bei der Emüfinslichkeit gegenüber Ausreißern meinte ich auch den Median.

Emüfinslichkeit

???

sowohl der modus (der häufigste wert) als auch der median (der mittlere wert) sind gegenüber ausreißern sehr stabil.

bsp.:
1 2 3 4 4 4 5 5 6 6 … hat einen modus von 4, einen median von 4 und einen mittelwert von 4
1 2 3 4 4 4 5 5 6 20 … hat einen modus von 4, einen median von 4 und einen mittelwert von 5,4 (also bereits höher als der drittgrößte wert)

der mittelwert ist gegenüber ausreißern empfindlich; modus und median sind es nicht.

m.

Hi,

weiß jemand, wieso der Modus nicht empfindlich gegenüber Ausreißern
im Datensatz ist, zB gegenüber dem arithmetischen Mittel oder dem
Median?

wie schon von den anderen gesagt, liegt das an seiner Definition.: Der Modus ist der häufigste Wert der Stichprobe. Wenn du also den Wert mit minimalem Abstand zu allen Werten der Stichprobe suchst, hast du mit dem Modus gewonnen, denn (wie schon in der Literaturangeba evon dir beschrieben) haben dann die meisten Werte einen Abstand von 0 zu eben diesem Wert.
Es gibt auch ein Mass für die Robustheit von Kennwerten gegenüber Aussreisern, ich komme leider gerade nicht darauf, wie es heisst. Sinngemäß beschreibt es die Anzahl der zu änderndern Werte, damit sich der Kennwert ändert.
Da beim artithm. Mittel jeder Wert mit gleicher Gewichtung eingeht, ändert sich der Mittelwert schon bei Änderung nur eines Wertes. Der Median aber „zerlegt“ die Stichprobe in zwei Hälften, d.h. man kann sogar von den Enden her Werte wegnehmen und der Median bleibt derselbe (z.B. für -5,-4,-3,-2,-1,0,1,2,3,4,5 und -1,0,1 ist der Median jedes Mal 0).

Grüße,
JPL