wie kann ich für eine Grundgesamtheit testen, ob sie Poisson-verteilt ist oder nicht?
Geht das mit dem Chi-Quadrat-Test?
Der funktioniert ja für die Normalverteilung…aber Poisson?
Hintergrund ist die Berechnung der Wahrscheinlichkeit des Eintreffen von Aufträgen bzw. Bedarfen innerhalb eines bestimmten Zeitintervalls.
Das ist KEINE Hausaufgabe (mit 47 macht man keine Hausaufgaben mehr)
Vielen Dank schon mal für die Unterstützung…falls das jemand weiß.
zum Teil bieten Statistikpakete die Auswahl einer bestimmten Verteilung an (z.B. SPSS).
Wenn du es „per Hand“ rechnen willst / musst, kannst den Kolmogorv-Smirnov-Test verwenden. Zuerst musst du aber den Parameter mue der Poisson-Verteilung aus den Daten schätzen, z.B. via ML-Schätzer als
mue = 1/n * Summe(k=1,…,k)(x_k*h_k)
wobei x_k der klassenmittelpunkt ist und h_k die Häufigkeit des eintretens des Ereignissen in der Klasse k und n der gesamte Stichprobenumfang ist.
Dann berechnest du die theoretischen Werte der poisson-Verteilung mit Parameter mue und vergleichst die mit den gemessenen. Wenn dann das Maximum der Beträge der abweichungen den kritischen Wert der K-S-Verteilung überschreitet, hast du eine sig. Abweichung von der Verteilungsannahme. Aber Vorsicht: Der KS-Test ist für kleine n konservativ und für größere n liberal.
Allgemein finde ich es aber immer müßig, irgendwelche formalen Kriterien für eine Übereinstimmung oder Abweichung zu bemühen, weil man fast nie genau weiß, wie *groß* die Abweichung denn sein kann, ohne einen *relevanten* Einfluß auf die Schlußfolgerungen zu haben.
Daher - finde ich - reicht es, sich die Form der Verteilung einfach anzusehen. Wenn sie grob von der Wunschverteilung abweicht, dann sieht man das schon. Wenn nicht, dann ist es meistens (a) egal oder (b) man hat eh keine Ahnung, wie sehr das letztendlich von Bedeutung sein könnte.
Ein KS-Test mit zu wenigen Daten kann ein grobe Abweichung übersehen, ein Test aber mit zu vielen Daten wird dir irrelevant geringe Abweichungen als „statistisch signifikant“ melden. Das Problem ist, das man nicht sagen kann, was relevante Abweichungen sind und wie viele Daten man braucht, damit der Test dann (und nicht unnötig „früh“) Alarm schlägt.
Das ist ein guter Ansatz, damit werde ich mal anfangen.
Das mit dem grafischen Ansatz hatte ich auch schon in der Betrachtung, aber ich wollte einfach wissen, ob es auch was numerisches gibt.
da hast du nicht unrecht, es gibt sogar ein paper mti dem statement, dass alle Verteilungsanpassungen nur mittels QQ-Plot gemacht werden sollten. Der Nachteil ist dann nur, dass a) man wie bei den Tests eigentlich alle Verteilungen ansehen müsste und b) man nicht einmal ein Mass für die Abweichung hat, womit es noch subjektiver wird.