Der Tipp mit Kolmogorow-Smirnow ist zwar nicht schlecht, aber auch nicht optimal. Denn ich habe nicht nur zwei Verteilungen, sondern ca. 50, bei denen allen ich wissen möchte, ob sie der gleichen Verteilung entspringen, oder komplett verschieden sind.
Rein optisch habe ich die Verteilungen schon unterteilt in drei Gruppen mit jeweils ähnlichen Verteilungen, aber innerhalb dieser möchte ich auch testen und habe ich auch mehr als zwei Verteilungen.
tja, das hilft nichts. Für Verteilungen gibt es keinen overall-Test. Du musst schon deine Referenzverteilung spezifizieren und dann alle anderen dagenen testen.
WEr halt viel wissen will, muss eben auch viel rechnen
Grüße,
JPL
viel rechnen ist nicht das Problem, aber was ist meine Referenzverteilung?
Ich hab gestern schonmal angefangen, indem ich einen Durchschnittsverteilung erstellt und dann diese als Referenz genutzt hab. Ich bin mir nur nicht sicher ob das der Weisheit letzter Schluss ist.
das musst du entscheiden.
a) es ist eine hypothetische Verteilung mit hypothetischen Parametern
b) es ist die Verteilung einer deiner Stichproben
c) es ist eine Verteilung, deren Parameter aus allen Stichproben geschätzt wird.
was du wohl schon gemacht hast ist c), wobei dann im Falle, dass eine deiner Stichproben nicht aus derselben Grundgesamtheit wie die anderen stammt dir die "echte2 Verteilung verzerrt.
Bei a) musst du halt deine Parameter raten, wenn du keine sinnvollen aus theoretischen Überlegungen (z.B. Literatur) ableiten kannst, ist das wenig sinnvoll.
b) ist ein Entscheidungsproblem. WENN aber alle Stichproben aus einer Grundgesamtheit stammen, dann ist es egal, welche Stichprobe die Referenz ist. Du kannst natürlich zufällig eine auswählen oder alle Kombinationen durchtesten.
Stellt sich am ende wieder die Frage: Lohnt der Aufwand? Wozu wirst du die Aussage verwenden?
Grüße,
JPL
bei meiner Frage geht es um Folgendes:
Regen fällt in bestimmten Mustern. Wenn es regnet, dann fällt entweder ein Großteil sofort, der Rest in den nächsten 1-4 Stunden. Oder es fällt ein bißchen in den ersten 1-2 Stunden, ein Großteil in Stunde drei, und ein bißchen in den nächsten 1-4 Stunden.
Oder der Großteil des Regens verteilt sich auf Stunde 3 und 4 und ein bißchen vorher und/oder hinterher.
Bsp. Variante 1
Prozent Stunde
0 1
0 2
0.972222222 3
0.027777778 4
0 5
0 6
0 7
0 1
0 2
0.784313725 3
0.058823529 4
0.078431373 5
0.078431373 6
0 7
Bsp. Variante 2
Prozent Stunde
0 1
0.201388889 2
0.798611111 3
0 4
0 5
0 6
0 7
0 1
0.024691358 2
0.716049383 3
0.197530864 4
0.037037037 5
0.024691358 6
0 0
Bsp. Variante 3
0 1
0 2
0.531914894 3
0.404255319 4
0.042553191 5
0.021276596 6
0 7
0.061728395 1
0.185185185 2
0.333333333 3
0.209876543 4
0.135802469 5
0.061728395 6
0.012345679 7
Ich möchte jetzt eine (oder mehrere) Verteilung(en) finden, um z.B. 20 mm Regen danach aufzuteilen.
Zunächst hatte ich die drei Varianten aufgeteilt, gegen den jeweiligen Mittelwert getestet und alle waren gleich.
Dann habe ich den Mittelwert von allen Erteignissen genommen - auch alles gleich.
Als dritten Schritt habe ich die Mittelwerte von Variante 1, 2 und 3 sowohl gegeneinander als auch gegen den Gesamtmittelwert getestet. Alles gleich. Mit p-Werten zwischen 0,2 und 0,9.
Ich hatte ein paar der echten Verteilungen auf Normalverteilung getestet, aber das sind sie definitiv nicht.
Andere könnte ich mir natürlich auch noch ansehen.
Lg
Sina
Ich möchte jetzt eine (oder mehrere) Verteilung(en) finden, um
z.B. 20 mm Regen danach aufzuteilen.
Dann solltest du zuerst Regenfallmuster finden, und denen dann Verteilungen zuordnen.
Regenmuster kannst du entweder finden, indem du eine visual inspection machst (was natürlich sehr subjektiv ist) oder indem du dich in einer Clusteranalyse versuchst. Beides zielt erstmal darauf ab, eine Struktur in den Daten zu finden, keine Unterschiede.
So denn die Muster/Cluster vorhanden sind, würde ich eine allg. Verteilung aus dem Daten schätzen, die diesem Muster zugrundeliegen könnte. Sinnvoll wären hier möglicherweise Lognormalverteilung, Bertaverteilung oder Weibullverteilung und ähnliche Verteilungen, die für x
ehrlich gesagt verstehe ich wenn überhaupt nur noch die Hälfte
Ich habe aber eine Entscheidung getroffen.
Da ich eine einzige feste Verteilung für den Regen brauche, mit festen Anteilen zu welcher Stunde wieviel fällt, werde ich bei den optisch eingeteilten drei Varianten bleiben und deren Mittelwerte nehmen.