Anhand der Urliste auf Verteilung schließen?

Hallo Leute ich bin am verzweifeln,

ich habe eine Hülle von Daten, und muss prüfen ob die diskret Verteilt sind. Wie kann ich auf diskrete Verteilung prüfen???

0.01 1162377
0.02 344009
0.03 213767
0.04 164922
0.05 135461
0.06 61028
0.07 44626
0.08 38909
0.09 37972
0.10 30191
0.11 14859
0.12 11271
0.13 9451
0.14 9245
0.15 7385
0.16 5276
0.17 5020
0.18 5248
0.19 5560
0.20 4825
0.21 2305
0.22 1896
0.23 2056
0.24 2466
0.25 2874
0.26 1908
0.27 1559
0.28 1371
0.29 1975
0.30 1601
0.31 1317
0.32 566
0.33 503
0.34 533
0.35 465
0.36 564
0.37 339
0.38 295
0.39 483
0.40 307
0.41 237
0.42 369
0.43 489
0.44 422
0.45 202
0.46 263
0.47 91
0.48 180
0.49 149
0.50 139
0.51 60
0.52 63
0.53 66
0.54 81
0.55 163
0.56 44
0.57 140
0.58 51
0.59 49
0.60 564

Das sind meine Daten. Es handelt sich um Bewegungen in einem Orderbuch. 0,01 bedeutet: der Abstand zwischen der 2 Askebene zu der 1 Ask Ebene…Und die Zahl daneben ist die Häufigkeit des Auftretens.

Abgesehen von diesem Wissen, weiß einer wie ich diese Daten nun prüfe, ob eine diskrete Verteilung vorliegt??? Bitte helft mir^^

Bist du dir sicher, dass du auf eine diskrete Verteilung testen willst?

Kannst du vielleicht mal mit eigenen Worten formulieren was das Ziel ist, wie die Fragestellung lautet?

Für die Beantwortung der Frage müsste ich außerdem irgendwei verstehen, was Ask sein soll und was ein Orderbuch ist. Und was die Zahl bedeutet die vorn steht.

Ohne diese Infos kann ich leider nichts helfen.

Liebe® Unbekannte®,

wenn die Werte, die dort (links) stehen die einzig Möglichen sind und keine Zwischenwerte mehr existieren (wie 0,115 oder 0,457), dann ist die Verteilung diskret. Daran gibt es eigentlich nichts zu deuteln.

Herzliche Grüße, Andreas

P.S. BTW, es handelt sich dabei nicht um eine Urliste sondern ganz offensichtlich um eine empirische Verteilung.

Es ist eine empirische Verteilung, hinten stehen die Häufigkeiten.

Vorne stehen die Abstände zwischen zwei Preisen, sog. Basispunkte (0,01 = 1 Cent). Xetra ist ein voll elektronisches Handeslsystem, das bei limitierten Kauf und Verkaufsangeboten, mit sogenannten Orderbüchern arbeitet. Die 10 besten Kauf und die 10 besten Verkaufsangebote stehen sich gegenüber.

Meine Aufgabe ist es nun die Bewegungen innerhalb einer Orderbuchseite zu analysieren und zu fragen ob sie speziell diskret verteilt sind.

Der Datensatz oben bedeutet:

die zweite eben der ask seite - der ersten ebene der ask seite.

Konkret im Zeitablauf betrug der Abstand in 1162377 Fällen 0,01 Basispunkte usw.

Ich könnte doch mithilfe des Chi-Quadrat-Test, meine Datensätze auf alle möglichen Diskreten Verteilungen hin prüfen. Wenn sich alle ausschließen, könnte ich doch mit Sicherheit sagen, dass sie nicht diskret verteilt sind oder??? Und wenn sich die Nullhypothese in einigen Fällen bestätigt, würde es doch bedeuten, dass es diskret verteilt wäre???

Vollkommen Richtig, es ist eine empirische Verteilung.

Die Zufallsvariablen sind diskret, da gibt es keine Zweifel.
Ich soll allerdings prüfen, ob eine diskrete Verteilung vorliegt und wenn ja welche. Es gibt in der Literatur 6 verschiedene bekannte diskrete Verteilungen (Poisson, geometrische Binomial usw.) Wie kann ich denn prüfen, ob eine dieser 6 in meinem Fall vorliegt???

Der Chi-Quadrat-Test fällt mir nur ein, dort muss aber jeder Datensatz einzelnd geprüft werden. Also alle Aktien des Orderbuchs, die mir vorliegen, müssen auf die 6 Verteilungen hin geprüft werden.

Gibt es vielleicht ein alternativ Test der auf alle diskreten Verteilungen hin testet. Also eine bestimmte Nullhypothese, womit alle diskreten Verteilungen abgedeckt sind. Was ist charaktertypisch für alle diskreten Vertelungen, die mit dem Chi-Quadrat-Test abgedeckt werden können???

Entschuldigung ich verstehe immer noch nicht die Fragestellung. Letzter Versuch: bitte die FRAGESTELLUNG ohne jegliche Fachbegriffe in eigenen Worten formulieren auch nicht das Wort „diskret“ verwenden, weil es mehrere Bedeutungen haben kann.
Einfach so erklären das es eine Oma versteht.
Und was ask ist hab ich immer noch nicht verstanden, sind das Fälle. Chi-Quadrattest können für verschiedenste Fragestellungen verwendet werden.

Ah, dann hatte ich die Frage falsch verstanden.

Okay, es dürfte allerdings noch viel, viel mehr als nur sechs diskrete Verteilungen geben. Das ist aber insofern nicht so schlimm, weil diskrete Verteilungen im Gegensatz zu den meisten stetigen den unschätzbaren Vorteil haben, dass sie für bestimmte Anwendungsfälle (Warteschlangen, Urnenmodelle usw.) geschaffen worden sind. Das schränkt die Möglichkeiten schon einmal sehr deutlich ein. Zum Beispiel kann es keine Alternative zwischen einer Binomial- und einer geometrischen Verteilung geben. Es kommt garantiert nur eine von beiden in Frage. Aber ich fürchte, ansonsten hast du Recht: Du kannst nur die in Frage kommenden Verteilungen einzeln testen. Das dürfte allerdings mit einem Statistikprogramm deines Vertrauens oder auch nur mit einer geschickt aufgebauten Exceltabelle kein größeres Problem sein. Chi-Quadrat wäre dabei auch für mich der Test erster Wahl.

Gestatte mir aber bitte noch eine Frage: Wenn ich mir deine empirische Verteilung so anschaue, würde ich eher eine stetige, linkssteile Verteilung(günstigstenfalls sogar Lognormal) daran anpassen. Auch wenn die Variable eigentlich diskret ist, denke ich, dass man eine sehr gute Approximation hinbekommen würde. Die Handhabung wäre dann auf jeden Fall deutlich leichter als mit den immer etwas sperrigen diskreten Verteilungen. Spricht da etwas gegen?

Herzliche Grüße

Andreas

Das habe ich am Anfang auch gedacht, dass hier eine stetige Verteilung vorliegt. Aber ich soll, warum auch immer auf diskrete Verteilungen hinprüfen.

Trotzdem vielen vielen Dank.

Eine schöne Restwoche noch

Hallo babani,

ich kann Dir leider nicht wirklich helfen. Ich hab’ keine Ahnung, was das für Daten sind. Aber eine Verteilung ansehen kann man sich ganz gut, wenn man die Daten in Excel eingibt und sich ein Häufigkeitsdiagramm malen lässt. Was eine diskrete Verteilung ist erläutert am schnellsten Wikipedia.

Viel Erfolg noch.

Viele Grüße
Bazillus-online

Hallo,

musst du denn die genaue Verteilung herausfinden?
Meiner Meinung nach liegt hier ein diskrete Verteilung vor, da du ja eine Häufigkeit für einen bestimmten Wert angeben kannst. Bei einer stetigen Verteilung kann man nur Wahrscheinlichkeiten für ein bestimmtes Intervall angeben, die Wkeit für einen einzelnen Wert ist 0. (Es gibt da ja unendlich viele mögliche Werte).
Anhand von diesen Überlegungen wäre ich für eine diskrete Verteilung.

Ich hoffe da hilft ! :wink:

Viele Grüße
Anja