Konfidenzbereich für ein bestimmtes Quantil

Hallo,

ich habe eine Stichprobe aus einer Grundgesamtheit unbekannter Größe. Die Zufallsvariable X ist Lognormal-verteilt, also ln(X) ist normalverteilt. Den Erwartungswert und die Varianz habe ich mit dem Mittelwert der Stichprobe und ihrer Standardabweichung geschätzt.

Ich weiß zwar, wie ich mithilfe der t-Verteilung einen Konfidenzbereich für den Erwartungswert berechne, aber ich brauche einen Konfidenzbereich für ein bestimmtes Quantil.
Die Frage lautet also: Mit welcher Wahrscheinlichkeit liegt das tatsächliche Quantil alpha innerhalb von alpha’±C? Dabei ist alpha’ das mit der geschätzten Verteilung berechnete Quantil und C der Konfidenzbereich.

Vielen Dank schonmal, Tychi

Hi,

da gibts mehrere wege:
zum einen über eine große Stichprobe und darauf basierend einer Näherung: http://www-users.york.ac.uk/~mb55/intro/cicent.htm
zum anderen via einem R-package (http://rgm2.lab.nig.ac.jp/RGM2/R_man-2.9.0/library/l…), hab ich aber nicht ausprobiert und die Quelle ist nicht angegeben, dann kann man den ersten Ansatz für die log-transformnierten daten verwenden und dann zurücktransformieren (http://www.contingencyanalysis.com/archive/archive02…) und letztlich kann man auch bootstrappen (BCa).
Grüße,
JPL

Hallo JPL,

da gibts mehrere wege:
zum einen über eine große Stichprobe und darauf basierend
einer Näherung:
http://www-users.york.ac.uk/~mb55/intro/cicent.htm

Wie ich es verstehe, rechnet man hier direkt mit der Stichprobe. Dies ist in meinem Fall wohl nicht ratsam, weil sie wahrscheinlich nicht repräsentativ ist.
Warum bringt der Autor hier die Binomialverteilung ins Spiel? Sagt der Zentrale Grenzwertsatz nicht, dass der Mittelwert von Stichproben normalverteilt sei? Diese Verteilung müsste ich doch zugrundelegen, oder? Vielleicht geht der Autor auch davon aus, dass Normalverteilung und Binomialverteilung für viele Werte praktisch gleich sind.
Irgendwie ist dies nicht genau das, was ich suche. Oder ich verstehe es nicht genug.

Außerdem: Was ist mit Bootstrappen in diesem Zusammenhang gemeint?

Viele Grüße
Tychi

Hi Tychi,

Wie ich es verstehe, rechnet man hier direkt mit der
Stichprobe. Dies ist in meinem Fall wohl nicht ratsam, weil
sie wahrscheinlich nicht repräsentativ ist.

Das ist kaum eine Grund, bzw. ist keine Stichprobe wirklich repräsentativ es sei denn, man hätte sich extreme Gedanken gemacht oder schlicht ordentlich randomisiert.

Warum bringt der Autor hier die Binomialverteilung ins Spiel?

wie’s da steht: Die eigenschaft kleiner als das Quantil zu sein, folgt logischerweise einer Binomialverteilung, denn ein Wert ist das entweder oder er ist es nicht. daraus kann man dann eben unbhängig von der eigentlich zugrundeliegenden Verteilung Konfis für das Qunatil schätzen.
Hinreichend viele Werte sollte man trotzdem haben.

Sagt der Zentrale Grenzwertsatz nicht, dass der Mittelwert von
Stichproben normalverteilt sei? Diese Verteilung müsste ich
doch zugrundelegen, oder?

Der Punkt ist aber - ab welchem n? Eine Frage, die man für jede spezielle Situation nur per Simulation beantworten kann (mM).

Irgendwie ist dies nicht genau das, was ich suche. Oder ich
verstehe es nicht genug.

Welches davon zurtrifft, musst du entscheiden :smile: Was suchst du denn genau?
Ich denke, die TraFo-Methode ist eher das, was dir gefallen würde, weil es die zugrundeliegende Verteilung nutzt.

Außerdem: Was ist mit Bootstrappen in diesem Zusammenhang
gemeint?

Bootstrapping ist eine Methode, bei der man Quantile aus der konkreten Verteilung schätzt, anstatt sie parametrisch (also von einer angenommenen Verteilung) abzuleiten.

Grüße,
JPL

Hi JPL,

Warum bringt der Autor hier die Binomialverteilung ins Spiel?

wie’s da steht: Die eigenschaft kleiner als das Quantil zu
sein, folgt logischerweise einer Binomialverteilung, denn ein
Wert ist das entweder oder er ist es nicht. daraus kann man
dann eben unbhängig von der eigentlich zugrundeliegenden
Verteilung Konfis für das Qunatil schätzen.
Hinreichend viele Werte sollte man trotzdem haben.

Ah, o.k. Das leuchtet mir ein.

Irgendwie ist dies nicht genau das, was ich suche. Oder ich
verstehe es nicht genug.

Welches davon zurtrifft, musst du entscheiden :smile: Was suchst du
denn genau?
Ich denke, die TraFo-Methode ist eher das, was dir gefallen
würde, weil es die zugrundeliegende Verteilung nutzt.

Wie heißt die TraFo-Methode genau? Ich würde danach googeln. Was ist ihr Kerngedanke?

Außerdem: Was ist mit Bootstrappen in diesem Zusammenhang
gemeint?

Bootstrapping ist eine Methode, bei der man Quantile aus der
konkreten Verteilung schätzt, anstatt sie parametrisch (also
von einer angenommenen Verteilung) abzuleiten.

Ich bin gerade dabei, mich darüber zu belesen.

Tychi

Hi Tychi,

Wie heißt die TraFo-Methode genau? Ich würde danach googeln.
Was ist ihr Kerngedanke?

wie bereits geschrieben: "dann kann man den ersten Ansatz für die log-transformnierten daten verwenden und dann zurücktransformieren (http://www.contingencyanalysis.com/archive/archive02…) "
Man logarithmiert den ganzen Kram, berechnet das Konfi klassisch basierend auf Normalverteilung und transformiert das dann wieder zurück.

Grüße,
JPL