Ich möchte gerne einen einen Kolmogorov Smirnov Test auf das Vorliegen der Poisson-Verteilung durchführen.
Nun weiss ich leider nicht, wie ich das bewerkstelligen soll, denn im Netz finde ich nur Beispiele für die Normalverteilung.
Kann mir jemand helfen und sagen, wie ich vorzugehen habe?
in dem Buch L. Sachs „Applied statistics“, Springer Verlag (1982) finden sich an zwei Stellen (S. 291 und S. 330) Hinweise auf den Kolmogoroff-Smirnoff Test.
Ich möchte gerne einen einen Kolmogorov Smirnov Test auf das
Es wird auf diesen Seiten kein Hinweis mit einer Verbindung zur Poisson-Verteilung
Also kann ich keinen Kolmogorov-Smirnov Test auf die
Poisson-Verteilung durchführen?
doch, das geht, auch mit einer Poisson-Verteilung. Denn ein Buch weiß auch nicht alles und stetigkeit der Verteilung ist deswegen kein issue, weil man eh die empirischen Verteilungen (ECDF) vergleicht, die immer nur rechtsstetig sind (was abe auch egal ist).
Zum Vorgehen:
die ECDF von deinen Daten berechnen
den parameter für die hypothetische poisson-Verteilung aus den Daten bestimmen
die beobachteten Werte als Stützstellen für ECDF der hyp. Poi verwenden.
ECDF und ECDF der hyp. Poi mittels KS-Test vergleichen.
4b) Falls du R verwendest, gibt es eine verbesserte Version vom KS-test im package Matching (ks.boot), die die Quantile der Verteilung auf basis vom bootstrap schätzt.
aus 4) kann man nicht auf eine Gleichheit schlußfolgern, sondern nur auf keinen Unterschied!
Aber nur, wenn man die observed values nimmt, wenn man den
Kniff über die ECDFs macht gehts wieder.
ok, den Trick darfst Du mir auch erklären. Ich sehe nämlich spontan nicht, wie das gehen soll. Die Quantilen der ECDF sind trotzdem diskret, und wenn ich die kumulative Wahrscheinlichkeiten nehme, sind das zwar irgendwelche Dezimalbrüche im Intervall [0;1], aber auch diskret. *Aufdemschlauchsteh*
ok, den Trick darfst Du mir auch erklären. Ich sehe nämlich
spontan nicht, wie das gehen soll. Die Quantilen der ECDF sind
trotzdem diskret, und wenn ich die kumulative
Wahrscheinlichkeiten nehme, sind das zwar irgendwelche
Dezimalbrüche im Intervall [0;1], aber auch diskret.
*Aufdemschlauchsteh*
und eben die quantile der ECDF werden zur Berechnung der teststatistik verwendet. wenn nun keine stetige Verteilung vorliegt kann es zwar nicht überall sprungstellen der ECDF geben und die Sprünge können auch vielfache von 1/n sein, aber das ist der Teststatistik ja egal.
btw hast du auch für jede stetige ZV eine Treppenfunktion als ECDF, solange n
Tut mir leid, wenn ich etwas schwer von Begriff bin…
ist das so gemeint?
Nehmen wir an wir haben x1=2; x2=2; x3=1…dann währe ECDF für x1=2/3?
Oder habe ich da was missverstanden?
*räusper*
wieviel ahnung hast du denn von statistik?
Immerhin willst du ja nicht mal eben nen Test machen.
Und - entschuldige - das Internet ist sehr umfangreich.
Daher nix konkretes hier, sondern eine, wie ich finde, recht gute Seite: http://www.itl.nist.gov/div898/handbook/eda/section3…