Herangehensweise an Chi-Quadrat-Anpassungstest

Wenn ein Zufallsprogramm vorgeblich gleichverteilte Zufallszahlen im Intervall (0,1) liefert und eine Stichprobe genommen wurde von n=1000, welche als Quaril X0,25 = 0,2356 und X0,75 = 0,7654 ergaben.

Wie wende ich dann den Chi-Quadrat-Anpassungstest für eine Annahme der Gleichverteilung an (Aplha=0,01)?

Erst mal meine naive Vermutung:

Für das Quartil 0,25 hätte ich erwartungsgemäß 250 Werte.
Für das Quartil 0,75 hätte ich erwartungsgemäß 750 Werte (500 als Spannweite für die Anzahl zwishcen den Quartilen - auch Interquartilsabstand bekannt)
Und für über 0,75 bis 1,0 müssten es noch mal 250 Werte sein (also für 1.0 müssten es ja 1000 sein).

Ich habe nun alles in 3 Klassen eingeteilt.

Klasse 1–250 Erwartungswert–235,6 beobachteter Wert
Klasse 2–500 Erwartungswert–530,9 beobachteter Wert
Klasse 3–250 Erwartungswert–234,6 beobachteter Wert

Und würde diese Zahlen nun in die Formel vom Chi-Quadrat-Anpassungstest einfügen also z.B.

(235,6-250)²/250 + (530,9-500)²/500 +(234,6-250)²/250 =
0,82944 + 1,90962 + 0,94864 = 3,6877

Der Chi-Wert aus der Tabelle war glaub ich so 3,8. und damit wäre der Testwert kleiner als der Tabellenwert und die Gleichverteilung angenommen. Ist das richtig oder muss ich beim Rechnen die Kommas anders setzen.

Hallo erstmal.

Wenn ein Zufallsprogramm vorgeblich gleichverteilte
Zufallszahlen im Intervall (0,1) liefert und eine Stichprobe
genommen wurde von n=1000, welche als Quartil X0,25 = 0,2356
und X0,75 = 0,7654 ergaben.

Wie wende ich dann den Chi-Quadrat-Anpassungstest für eine
Annahme der Gleichverteilung an (Alpha=0,01)?

Wie unten zu sehen: Summe ((Gemessener Wert - Theoretischen Erwartungswert)^2 / Theoretischen Wert )

Erst mal meine naive Vermutung:

Für das Quartil 0,25 hätte ich erwartungsgemäß 250 Werte.
Für das Quartil 0,75 hätte ich erwartungsgemäß 750 Werte (500
als Spannweite für die Anzahl zwishcen den Quartilen - auch
Interquartilsabstand bekannt)
Und für über 0,75 bis 1,0 müssten es noch mal 250 Werte sein
(also für 1.0 müssten es ja 1000 sein).

Könnte stimmen.

Ich habe nun alles in 3 Klassen eingeteilt.

Klasse 1–250 Erwartungswert–235,6 beobachteter Wert
Klasse 2–500 Erwartungswert–530,9 beobachteter Wert
Klasse 3–250 Erwartungswert–234,6 beobachteter Wert

Also jeden einzelnen der Ergebniswerte mit 1000 multipliziert (warum auch immer…)

Und würde diese Zahlen nun in die Formel vom
Chi-Quadrat-Anpassungstest einfügen also z.B.

(235,6-250)²/250 + (530,9-500)²/500 +(234,6-250)²/250 =
0,82944 + 1,90962 + 0,94864 = 3,6877

Ohne das jetzt alles nachzurechnen: sieht richtig aus :smile: Und das relative Ergebnis (siehe die 1000 von oben) ist eh dasselbe.

Der Chi-Wert aus der Tabelle war glaub ich so 3,8. und damit
wäre der Testwert kleiner als der Tabellenwert und die
Gleichverteilung angenommen. Ist das richtig oder muss ich
beim Rechnen die Kommas anders setzen.

Fast richtig: damit kann die Hypothese einer Gleichverteilung mit dem Mittelwert von ? auf einem Irrtumsniveau von 1% nicht abgelehnt werden.

HTH
mfg M.L.

Danke schon mal für die Antwort

Könnte stimmen.

Klingt gut :wink:
Um mal auf die 1000 zurückzukommen. Und zwar wenn ich die Klassen folgendermaßen einteile.

Klasse 1–0,250 Erwartungswert–0,2356 beobachteter Wert
Klasse 2–0,500 Erwartungswert–0,5309 beobachteter Wert
Klasse 3–0,250 Erwartungswert–0,2346 beobachteter Wert

Also jeden einzelnen der Ergebniswerte mit 1000 multipliziert
(warum auch immer…)

Weil ich irgendwie dachte n * pj - Also n * der Erwartungswert bzw. beobachteter Wert. Aber eigentlich heissts ja Erwartungswert für eine Zahl ist 1/1000. Aber womit ich auch nicht klar komme ist die 4. Nachkommastelle - wie kann die denn zustande kommen???

Chi-Quadrat-Anpassungstest einfügen also wäre dann ohne 1000 z.B.

(0,2356-0,250)²/0,250 + (0,5309-0,500)²/0,500 +(0,2346-0,250)²/0,250 =
0,00082944 + 0,00190962 + 0,00094864 = 0,0036877

Ohne das jetzt alles nachzurechnen: sieht richtig aus :smile: Und
das relative Ergebnis (siehe die 1000 von oben) ist eh
dasselbe.

Das mit dem relativen Ergebnis versteh ich nicht - denn wenn ich die 1000 rauslasse - verschiebt sich das Ergebnis ja um 3 Kommastellen - weiss nicht was nun richtig ist. Für das Endergebnis hätte das ja starke Konsequenzen, ob es heisst 3,68 oder 0,00368. Hmmm!? *Kopfzermarter*

Danke schon mal für die Antwort

Bitte. Trotzdem hätte man mal nachrechnen sollen…

Klasse 1–0,250 Erwartungswert–0,2356 beobachteter Wert
Klasse 2–0,500 Erwartungswert–0,5309 beobachteter Wert
Klasse 3–0,250 Erwartungswert–0,2346 beobachteter Wert

Da lag wohl der Fehler: ein Erwartungswert ist i.A. die Summe (Ereignis * dessen Eintrittswahrscheinlichkeit). Der EW hier müsste pro Klasse aber bei 0,5 liegen: (0+1)/2
Oder bei der dritten Klasse folgerichtig bei 0,750

Chi-Quadrat-Anpassungstest einfügen also wäre dann ohne 1000
z.B.

(0,2356-0,250)²/0,250 + (0,5309-0,500)²/0,500
+(0,2346-0,250)²/0,250 =
0,00082944 + 0,00190962 + 0,00094864 = 0,0036877

Ohne das jetzt alles nachzurechnen: sieht richtig aus :smile: Und
das relative Ergebnis (siehe die 1000 von oben) ist eh
dasselbe.

Das mit dem relativen Ergebnis versteh ich nicht - denn wenn
ich die 1000 rauslasse - verschiebt sich das Ergebnis ja um 3
Kommastellen - weiss nicht was nun richtig ist.

Deswegen oben der Hinweis von wg. nachrechnen :wink:
Mit relativ war gemeint, dass z.B. 26/13 dasselbe ergibt wie 26000/13000

Für das
Endergebnis hätte das ja starke Konsequenzen, ob es heisst
3,68 oder 0,00368. Hmmm!? *Kopfzermarter*

Sicher, aber beide Ergebnisse sind nicht signifikant.

Wo stammt diese Aufgabe eigentlich her ? Klingt nach diskreter Simulation. Nicht vergessen: http://www.reiter1.com

mfg M.L.

Klasse 1–0,250 Erwartungswert–0,2356 beobachteter Wert
Klasse 2–0,500 Erwartungswert–0,5309 beobachteter Wert
Klasse 3–0,250 Erwartungswert–0,2346 beobachteter Wert

Da lag wohl der Fehler: ein Erwartungswert ist i.A. die Summe
(Ereignis * dessen Eintrittswahrscheinlichkeit). Der EW hier
müsste pro Klasse aber bei 0,5 liegen: (0+1)/2
Oder bei der dritten Klasse folgerichtig bei 0,750

Jo Ereignis wäre hier ja die Anzahl der Elemente die gefunden wurde in der Klasse bei einem Quantil von 0,25 müssten also 1/4 aller Zahlen b
verteilt gewesen sein - es wurden aber nur 0,2356 aller Zahlen verteilt.

Beim Quantil von 0,75 müssten also 3/4 aller Zahlen verteilt aufgetreten sein - nun habe ich diesen Bereich zwischen 0,75 und 0,25 abgetrennt und als Klasse 2 aufgestellt. Erwartungswert von 0,5 also 500 Messwerte. Bei der 3. Gruppe 0,25 Erwartungswert also wieder 250 Messwerte.

Also ich stell mir das so vor, dass Zahlen zw. 1 und 4 zufällig auftreten sollen. Bei 1000 Versuchen sollte also 250 mal die 1 auftauchen - sie trit aber beobachtet nur 235 mal auf (das Koma erklärt sich denk ich mal durch verschiedene Zahlen. Aus dem Bereich zwischen 2 und 3 treten diese Werte 530 statt erwarteten 500 mal auf. Im Bereich wo die restlichen 4er Werte 250 mal auftreten sollten treten diese 235 mal auf.

So würd ich mir das ganze erklären.

So kommt ein Ergebnis von 3,noch was raus. Der Chi-Quadrat-Test geht ja von Messwerten und nicht von Kommawerten aus. Hab hier zig Beispiele und die gehen alle mit Messwerten - leider haben die immer nichts mit Intervallen von 0-1 oder Gleichverteilung zu tun.

Das mit dem relativen Ergebnis versteh ich nicht - denn wenn
ich die 1000 rauslasse - verschiebt sich das Ergebnis ja um 3
Kommastellen - weiss nicht was nun richtig ist.

Deswegen oben der Hinweis von wg. nachrechnen :wink:
Mit relativ war gemeint, dass z.B. 26/13 dasselbe ergibt wie
26000/13000

Ja das war mir klar was du meinst - das ist meiner Meinung nach aber nicht richtig - da über dem Bruchstrich ja noch quadriert wird und sich dadurch bei Kommazahlen die Kommastellen verdoppeln (der Wert also kleiner wird) und wenn keine Kommas überm Bruchstrich der Wert ja grösser wird.

Dein Beispiel:
26²/13=52
aber --> 0,26²/0,13=0,52

Deswegen ja kein relatives Ergebnis. Was denkste?