Quantilsverhältnisse

Hallo,

laut

http://www.stat.uni-muenchen.de/~walter/lehre/Stat1S… (Unterkapitel 4.1.4) rechnet man Quantilsverhältnisse wie folgt:

Bilde das Verhältnis von (1 −q )- und q-Quantil, zum Beispiel:
q0.9 / q0.1

Diese Bezeichnung ist allgemein üblich, siehe z.B.:
http://www.bfs.admin.ch/bfs/portal/de/index/themen/2… (Dezile und Quartile)

Nehmen wir an ich will das oberste Dezil durch das unterste Dezil teilen. Logischerweise habe ich 10 Dezile. Nach obiger Formel habe ich aber nur 9 „Namen“ für die Dezile. Daher leuchtet mir diese Art der Bezeichnung nicht ein. Könnt ihr mir das erklären? Oder anderst gefragt: Warum heißt das oberste Dezil q0,9 und nicht q1,0?

Vielen Dank im Voraus

Mfg

Max

Hallo,

mir das erklären? Oder anderst gefragt: Warum heißt das
oberste Dezil q0,9 und nicht q1,0?

Hm, ich vermute, weil q1,0 das Maximum wäre. Und du willst ja nicht das Maximum teilen, sondern den Wert, für den 10% (bzw. q) der Werte größer sind (um eben „Extremwerte“ in beiden Richtungen „abzuschneiden“).

Nehmen wir der Einfachheit halber an, du hast 100 Werte, aufsteigend sortiert. Dann ist q0,1 der 10.-kleinste Wert und q0.9 ist der 10.-größte Wert (90% der Werte sind kleiner).

VG
Jochen

Hi Jo,

danke für die Antwort, aber ich kapiere es nicht, deshalb nochmals in übertriebener Ausführlichkeit die Darstellung meines Problems.

q-----Intervall
0,1 - 0-10%
0,2 - 10-20%
0,3 - 20-30%
0,4 - 30-40%
0,5 - 40-50%
0,6 - 50-60%
0,7 - 60-70%
0,8 - 70-80%
0,9 - 80-90%
1,0 - 90-100% fehlt! Also wenn das Intervall 0-10 % mit q0,1 bezeichnet wird, dann ist es doch unlogisch das Intervall 90-100% mit q0,9 zu bezeichnen, weil q0,9 im Sinne der Folgerichtigkeit ja für das Intervall 80-90% stehen müsste.

Praxisbeispiel (siehe http://www.bfs.admin.ch/bfs/portal/de/index/themen/2…):

Das erste Dezil erhält 3,8 % des Einkommens. Das zehnte Dezil (hier ist auch noch ausdrücklich vom 10. und nicht vom 9. Dezil die Rede) erhält 19,9 % des Einkommens. Das Quantilsverhältniss S90/S10 [Wobei ich ja immer noch der Meinung bin das S90 als S100 zu bezeichnen wäre]ergibt 5,2.

Versteht mich nicht falsch, wenn alle Statistiklehrbücher von S90/S10 und nicht von S100/S10 reden, dann werde ich wohl falsch liegen und es gibt einen guten Grund für diese Notation. Aber mir leuchtet dieser aus den oben aufgeführten Gründen absolut nicht ein. Hat noch jemand Hinweise?

MfG

Max

Hallo,

ok, nochmal ausführlicher:

Allgemein: Ein Quantil ist der Wert einer Datenmenge. Das q-Quantil ist derjenige Wert, für den gilt, dass ein Anteil von q der Werte der Datenmenge kleiner sind. q ist also ein Anteilswert, den man als Dezimalzehl zw. 0,0 und 1,0 schreibt oder als %.

Beispiel das 0,34-Quantil = 34%-Quantil = q0,34 wäre der Wert einer Datenmenge, für den gilt, dass 34% der Werte in der Datenmenge kleiner sind (der „34%-größte Wert“).

Quantile mit „besonderen“ Teilern haben eigene Namen bekommen. Am prominentesten ist das „Quartil“, welches die Datenmenge in Viertel teilt, das „Dezentil“, welches 10 Teile erzeugt und das Perzentil, welches 100 Teile erzeugt.

Sehr bekannt:

q0,00 = 0. Quartil bzw. Minimum
q0,25 = 1. Quartil
q0,50 = 2. Quartil bzw. Median
q0,75 = 3. Quartil
q1,00 = 4. Quartil bzw. Maximum

Eigentlich sind nun, dieser Logik folgend:

q0,00 = 0. Dezentil bzw. Minimum
q0,10 = 1. Dezentil
q0,20 = 2. Dezentil

q0,90 = 9. Dezentil
q1,00 = 10. Dezentil bzw. Maximum

Es gibt also eigentlich 5 Quartile, 11 Dezentile und 101 Perzentile, und zwar wegen des 0,00-Quantils (=Min).

Achtung, jetzt kommt der Springende Punkt!

Was Du bezeichnest, sind Interdezils-Abstände und nicht die Dezile selbst. Leider wird das manchmal sprachlich vermischt. Ein Dezil (oder Quartil oder Perzentil oder allg. Quantil) ist ein Wert, und kein Bereich!

Bei den Quartilen ist es bekannter: Zur Beschreibung der Streuung von Datenwerten wird oft der Interquartilsabstand angegeben, das ist die Differenz zwischen dem 3. und dem 1. Quartil. Dieser Bereich enthält „die zentralen 50% aller Werte“. Die untersten 25% und die obersten 25% fallen raus.

Bei den Dezentilen bildest du nun auch so einen Bereich, bei dem die untersten 10% und die obersten 10% rausfallen, so bleiben die „zentralen 80%“ der Werte übrig. Um oben und unten 10% abzuschneiden, nimmt man nur die Werte, die zwischen dem 9. Dezil und dem 1. Dezil liegen.

Nochmal: das 10. Dezil (=Max) und das 0. Dezil (=Min) umfassen den gesamten Bereich der Daten.

Willst du oben wie unten 20% abschneiden, nimmst du den Bereich zwischen dem 8. Dezil und dem 2. Dezil.

Willst du oben wie unten 30% abschneiden, nimmst du den Bereich zwischen dem 7. Dezil und dem 3. Dezil.

Willst du oben wie unten 40% abschneiden, nimmst du den Bereich zwischen dem 6. Dezil und dem 4. Dezil.

Willst du oben wie unten 50% abschneiden, nimmst du den Bereich zwischen dem 5. Dezil und dem 5. Dezil - hier bleibt genau NICHTS übrig!

Um deine Tabelle richtigzustellen:

q Dezil bezeichnet Es gilt
------------------------------------------------------------------------
0,1 10%-größten Wert 10% aller Werte sind kleiner als q<sub>0,1</sub>
0,2 20%-größten Wert 20% aller Werte sind kleiner als q<sub>0,2</sub>
0,3 30%-größten Wert 30% aller Werte sind kleiner als q<sub>0,3</sub>
0,4 40%-größten Wert 40% aller Werte sind kleiner als q<sub>0,4</sub>
0,5 50%-größten Wert 50% aller Werte sind kleiner als q<sub>0,5</sub>
0,6 60%-größten Wert 60% aller Werte sind kleiner als q<sub>0,6</sub>
0,7 70%-größten Wert 70% aller Werte sind kleiner als q<sub>0,7</sub>
0,8 80%-größten Wert 80% aller Werte sind kleiner als q<sub>0,8</sub>
0,9 90%-größten Wert 90% aller Werte sind kleiner als q<sub>0,9</sub>
1,0 100%-größten Wert 100% aller Werte sind kleiner als q<sub>1,0</sub>
------------------------------------------------------------------------

Das erste Dezil erhält 3,8 % des Einkommens.

Nein! Das erste Dezil ist das Einkommen, für das gilt, dass 10% aller Einkommen kleiner sind. Der erste Dezils bereich (als q0,1-q0,0) enthält die untersteh 10% aller Einkommenswerte (das können 3.8% des Gesamteinkommens sein; nicht die Anzahl der Werte mit der Summe des Einkommens verwechseln!; die 10% beziehen sich zB. auf die Anzahl der Haushalte).

Das zehnte Dezil
(hier ist auch noch ausdrücklich vom 10. und nicht vom 9.
Dezil die Rede) erhält 19,9 % des Einkommens.

Nein. Das 10. Dezil ist das größte Einkommen. 100% aller Einkommen sind kleiner. Der 10. Interdezils abstand (als q1,0-q0,9) enthält die oberen 10% der Einkommenswerte.

Eigentlich wolltest du wohl so eine Tabelle schreiben:

<u>Dezilabstände</u>

 Grenzen 
 --------------------------- 
Nr. unteres Dezil oberes Dezil Intervall Breite
------------------------------------------------------
 1 q<sub>0,0</sub> q<sub>0,1</sub> 0% - 10% 10%
 2 q<sub>0,1</sub> q<sub>0,2</sub> 10% - 20% 10%
 3 q<sub>0,2</sub> q<sub>0,3</sub> 20% - 30% 10%
 4 q<sub>0,3</sub> q<sub>0,4</sub> 30% - 40% 10%
 5 q<sub>0,4</sub> q<sub>0,5</sub> 40% - 50% 10%
 6 q<sub>0,5</sub> q<sub>0,6</sub> 50% - 60% 10%
 7 q<sub>0,6</sub> q<sub>0,7</sub> 60% - 70% 10%
 8 q<sub>0,7</sub> q<sub>0,8</sub> 70% - 80% 10%
 9 q<sub>0,8</sub> q<sub>0,9</sub> 80% - 90% 10%
10 q<sub>0,9</sub> q<sub>1,0</sub> 90% - 100% 10%

VG
Jochen

3 Like

Hi Jochen,

nochmals vielen Dank für deine sehr ausführliche Antwort. Ich denke ich hab verstanden was du meinst.

Aber deiner Logik folgend würde man nicht das Einkommen das ein Dezil bekommt durch das Einkommen das ein anderes Dezilintervall bekommt teilen, sondern ein bestimmtes Einkommen durch ein anderes bestimmtes Einkommen. (Das des 90%-Reichsten durch das des 10%-Reichsten).

So macht es glaube ich auch der Sachverständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung in seinem Jahresgutachten.

http://46.4.4.24/fileadmin/dateiablage/download/guta…
(S. 316, Fußnote 3)

Dann macht die Schreibweise S90/S10 ja auch Sinn.

Das hieße aber auch dass, die Statistik Schweiz eine irreführende Notation verwendet.
http://www.bfs.admin.ch/bfs/portal/de/index/themen/2…

Wie auch immer, so wie du es erklärt hast macht es Sinn und es passt auch zur Vorgehensweise des Sachverständigenrats. Von daher orientiere ich mich daran.

Beste Grüße und nochmal vielen Dank

Max