Hallo Jan!
Oh - Mist…
Da es keinen Weg bequem über SPSS gibt, muss man zu Fuss rechnen.
Da die 2te Verteilung nun aber dezimal bzw. theoretisch ist, muss man sie erst einmal „konkret“ machen. So spontan fällt mir erst einmal die Erweiterung um 100 ein.
V1: n= 36; 5-7-13-8-3-0-0
V2: n= 3599; 316-948-1185-790-296-59-5
Nun schaut man nach, wie sich die Ränge des ordinalen Merkmales (hier: Abhängige Variable) über die beiden Stichproben verteilen.
Also z.B. für die „1“ der „AV“ gibt es 5 Kandidaten in der ersten Stichprobe und 316 Kandidaten in der zweiten Stichprobe, die allesamt den Wert „1“ haben und sich somit einen Rang teilen müssen.
321 Kandidaten belegen normalerweise die Plätze 1 bis 321, da sie aber alle den gleichen Wert haben, bekommen sie den mittleren Rang, also „Rang 161“.
Analog gilt für die restlichen AV’s:
AV=1; n1+n2= 321; Rang von/bis: 1 bis 321; mittlerer Rang: 161
AV=2; n1+n2= 955; Rang von/bis: 322 bis 1276; mittlerer Rang: 798
AV=3; n1+n2= 1198; Rang von/bis: 1277 bis 2474; mittlerer Rang: 1875
AV=4; n1+n2= 798; Rang von/bis: 2475 bis 3272; mittlerer Rang: 2873.5
AV=5; n1+n2= 299; Rang von/bis: 3273 bis 3571; mittlerer Rang: 3422
AV=6; n1+n2= 59; Rang von/bis: 3572 bis 3630; mittlerer Rang: 3601
AV=7; n1+n2= 5; Rang von/bis: 3631 bis 3636; mittlerer Rang: 3633.5
Nun berrechnen wir die Rangsumme in der ersten Stichprobe:
Rangsumme V1 = 5*161 + 7*768 + 13*1875 + 8*2873.5 + 3*3422 = 63810
Und - nehmen wir einmal kurz an, die Nullhypothese würde Gültigkeit besitzen - berechnen den Erwartungswert für die Rangsumme in der ersten Stichprobe (eben für H0: {Es gibt keinen Unterschied zwischen den Verteilungen}):
E[Rangsumme V1]= [n1*(n1+n2+1)]/2 = (36*3637)/2 = 65466
Die Differenz zwischen beiden Werten zeigt, wie weit die Daten von der H0 entfernt liegen; allerdings muss man diese noch im Verhältnis zur theoretischen Varianz der Rangsumme in V1 sehen, die wir wie folgt ermitteln:
VAR[Rangsumme V1]= [n1*n2*(n1+n2+1)] / 12 = (36*3599*3637) / 12
= 39268689
Leider muss dieser Wert Bindungskorrigiert werden, und zwar um:
Bindungskorrektur
= [n1*n2* Summe(i=Bindung1 bis Bindung7)über[Bindungslänge³ - Bindungslänge] ] / [12*(n1+n2)*(n1+n2-1)]
Das ist hart, deswegen berrechnen wir erst
Summe(i=Bindung1 bis Bindung7)über[Bindungslänge³ - Bindungslänge] ], d.h. für jede Av die Bindungslänge, die n1+n2 entspricht, jeweils mit 3 potentiert und um die Länge reduziert insgesammt alles miteinanderaufaddiert, also:
(321³ - 321) + (955³ - 955) + … + (5³ - 5) = 3158536788
Eingesetzt in die Bindungskorrektur ergibt sich:
Bindungskorrektur = (36*3599*3158536788) / (12*3636*3635) = 2580243.848
welche wir von der Varianz abziehen:
39268689 - 2580243.848 = 36688445.15
Für unsere Teststatistik erhalten wir
U = [RangsummeV1 - Erwartungswert(RangsummeV1)]/[Bindungskorrigierte Varianz(RangsummeV1)]
= (63810 - 65466)/36688445.15 = 0.000045136826
Unser U ist unter der Annahme, dass H0 gilt asymptotisch N(0,1)-verteilt. Der Wert, den wir für U gefunden haben ist sehr nahe an 0, dem 50% Quantil der Standardnormalverteilung, so dass wir sagen können:
Behaupten wir, dass die Alternativhypothese richtig ist, so ist diese Behauptung zu 50% falsch.
Auf einem 5%-Niveau wäre dieser Test also nicht signifikant (naja, eben erst ab Alpha>0.5, aber das macht hoffentlich niemand…).
Man würde es, wenn man die Stichproben etwas gleich-größer kriegen könnte, eventuell noch ein wenig verschieben können (das Quantil); insgesamt tut sich aber nicht viel daran: die Verteilungen kann man nicht als Ungleich beschreiben (sowohl ein- wie auch zweiseitig).
Du hattest Glück, dass ich in (Fuss-)Rechenlaune gewesen in, was aber einfacher gewesen ist, als den U-Test hier zu erklären…
Bei Rückfragen gerne,
lieben Gruß
Patrick