Stochastik

Hallo,
ich sitze gerad vor der folgenden Aufgabe und weiß ehrlich gesagt nicht weiter.

5 Schüler haben einen Test (0-10 Pnukte) geschrieben. Ermitteln Sie eine Punkteverteilung, sodass der Mittelwert 5 und die Varianz

A) 20
b) 0,8

beträgt.

Falls machbar, erbitte ich mir von euch den Lösungsweg zu zuschreiben.

Schon mal Danke im voraus.

Hallo,

5 Schüler haben einen Test (0-10 Pnukte) geschrieben.
Ermitteln Sie eine Punkteverteilung, sodass der Mittelwert 5
und die Varianz

Idee (ek sei das Punktezahl-Testergebis des k-ten Schülers):

e1 = 5
e2 = 5
e3 = 5
e4 = 5 - x
e5 = 5 + x

ist ein „Datensatz“ mit Mittelwert 5 und einer von x abhängigen Varianz. Drück die Varianz als Funktion von x aus, setz selbige anschließend gleich 20 bzw. 0.8, und rechne daraus das passende x aus.

Gruß
Martin

hi,

5 Schüler haben einen Test (0-10 Pnukte) geschrieben.
Ermitteln Sie eine Punkteverteilung, sodass der Mittelwert 5
und die Varianz

a) 20
b) 0,8

beträgt.

Falls machbar, erbitte ich mir von euch den Lösungsweg zu
zuschreiben.

seltsame fragestellung …
naja: nachdem über die art der verteilung nix gegeben ist, muss man probieren.
jetzt sind die veiden gegebenen varianzen weit auseinander. sehr weit. könnte sein, dass die eine quasi „maximal“ ist und die andere fast so was wie „minimal“ (obwohl echt minimal natürlich 0 wäre).

der mittelwert muss 5 sein; eine maximal streuende punkteverteilung wär z.b., wenn 2 gar keine punkte machen, 2 die maximalzahl 10 und der restliche einen 5er, damit der mittelwert stimmt. rechne dafür mal die varianz aus … (z.b. bei einem am. excel mit funktion VARP)

wenn alle den mittelwert 5 schreiben, hast du varianz 0. also schreibt einer 4, der andere 6, der rest 5. das gibt noch eine zu kleine varianz von 0,4; also noch ein bisschen mehr variieren. 35557 gibt bereits zu viel … also …

hth
m.

hi,

Idee (ek sei das Punktezahl-Testergebis des k-ten Schülers):

e1 = 5
e2 = 5
e3 = 5
e4 = 5 - x
e5 = 5 + x

gute idee, reicht aber nicht. du brauchst (wenn du rechnen willst und nicht mit instinkt probieren) den ansatz:

e1 = 5
e2 = 5 - x
e3 = 5 - x
e4 = 5 + x
e5 = 5 + x

m.

gute idee, reicht aber nicht.

Ja, ich seh den Punkt. Bei meinem Ansatz würde ich auch mit großem x nur auf vergleichsweise kleine Varianzen kommen können. Danke für den Hinweis :smile:

Gruß
Martin

Hallo Michael,

ich fürchte, Deine Lösung ist im Sinne der Aufgabe richtig.

Allerdings verstehe ich bis heute nicht, warum sich die nicht-freiheitsgradkorrigierte Varianz bis heute hält.

Mit der echten, einzigen erwartungstreuen und konsistenten empirischen Varianz müsste die Varianz für a.) selbstverständlich 25 betragen, damit ein Schuh daraus würde (und für b.) gleich 1).

Excel und SPSS berechnen mir im übrigen immer die echte Varianz aus. Wie hast Du die „falsche“ hinbekommen?

Die Lösung für a.) 0 0 5 10 10 hat bei mir VAR= 25.

Lieben Gruß
Patrick

hi,

ich fürchte, Deine Lösung ist im Sinne der Aufgabe richtig.

Allerdings verstehe ich bis heute nicht, warum sich die
nicht-freiheitsgradkorrigierte Varianz bis heute hält.

weil statistisches denken sich noch nicht ausreichend durchgesetzt hat.
excel hat (in der deutschen version) neben der freiheitsgradkorrigierten funktion VARIANZ (excel: „schätzt die Varianz, ausgehend von der Stichprobe“) auch die funktion VARIANZEN (excel: „berechnet die Varianz, ausgehend von der Grundgesamtheit“).

und ohne blick auf stichprobe ist der nenner n schon richtig.

Mit der echten, einzigen erwartungstreuen und konsistenten
empirischen Varianz müsste die Varianz für a.)
selbstverständlich 25 betragen, damit ein Schuh daraus würde
(und für b.) gleich 1).

ja. eh.

Excel und SPSS berechnen mir im übrigen immer die echte
Varianz aus. Wie hast Du die „falsche“ hinbekommen?

s.o.

hth
m.

Hallo,

Deine Lösung funktioniert auch nicht, weil der Schüler dann in einem test eine negative Punktezahl gehabt haben muss. Das "ausgeglichendste Ergebnis wäre x=5 und y=6.1237… und 5-y ist dann kleiner Null.

LG
Jochen

Hallo Patrick,

Allerdings verstehe ich bis heute nicht, warum sich die
nicht-freiheitsgradkorrigierte Varianz bis heute hält.

Varianz ist eine Eigenschaft einer Datenmenge. Hier ist die Datenmenge gegeben durch die 5 Testergebnisse. Die Varianz berechnet sich eben als Mittlere quadratische Abweichung der Werte zum Mittelwert.

Ist die Datenmenge nicht vollständig bekannt, muss sie anhand einer Stichprobe geschätzt werden. Begriffe wie „Erwartungstreue“ sind überhaupt nur im Zusammenhang mit Schätzungen sinnvoll. Der erwartungstreue Schätzer(!) der Varianz ist eben die Summe der Abweichungsquadrate durch (n-1).

In der gegebenen Aufgabe war nicht(!) nach einer Schätzung gefragt, sondern nach der Varianz selbst. Die 5 Werte sind keine Stichprobe sondern die Grundgesamtheit.

LG
Jochen

Hallo,

gegeben sind der Mittelwert (m=5), die Varianz s² und die Anzahl der Daten (n=5). Gesucht sind die n Werte x (x1…xn), so dass sie den Mittelwert m und die Varianz s² haben.

Man kann zeigen, dass beim Ansatz

x1 = m
x2 = m+a
x3 = m-a
x4 = m+b
x5 = m-b

ein x-Wert negativ sein muss, um eine Varianz von 25 zu bekommen. Also muss der Ansatz verfeinert werden. Statt zwei verschiedenen Variablen (a,b) werden also 3 verwendet (a,b,c):

x1 = m
x2 = m
x3 = m+a
x4 = m+b
x5 = m+c

Um negative Punktzahlen zu vermeiden, mussen a, b, c alle mindestens -5 oder größer sein.

Der Mittelwert muss m ergeben, also muss gelten:

(1) a + b + c = 0

Die Varianz muss s² ergeben, also muss gelten:

(2) a² + b² + c² = n*s²

Aus (1) folgt:

(3) b = -a-c

was mna in (2) einsetzen kann:

(4) a² + (-a-c)² + c² = s²

bzw. a² + a² + 2ac + c² + c² = s²
bzw. 2a² + 2ac + 2c² - s² = 0

was eine quadratische Gleichung on a ist. Nach a aufgelöst ergibt sich

a = ( -c +/- Wurzel(2*n*s²-3*c²) ) / 2

Eine Lösung existiert nur, wenn der Ausdruck unter der Wurzel positiv ist. Also muss c zwischen -5 und Wurzel(2/3*n*s²) liegen.

Setzt man

c = Wurzel(2/3*n*s²),

dann gibt es nur genau eine Lösung für a, nämlich

a = -c/2

Schließlich ergibt sich der Wert für b aus (3):

b = -a-c = -c/2

Das gibt nur EINE MÖGLICHE Lösung. Das Problem hat jedoch eine LösungsMENGE. Die Lösungen dieser Rechnung für die gegebenen Beispiel sind übrigends (gerundet):

  • für s² = 25: a sowie b = -4.565 und c = 9.13
  • für s² = 0.8: a sowie b = -0.8165 und c = 1.633

Weil c so gesetzt wurde, dass die Wurzel zur Berechnung von a gleich Null ist, sind hier a und b immer gleich groß.

Nun kann man für c auch leicht andere Werte einsetzen, dann müssen a und b aber mit dem Wurzelausdruck berechnet werden. mit diesen Gleichnungen müsste man den Definitionsbereich für c herleiten können - das habe ich aber nicht gemacht.

WENN man die obige Lösung hernimmt, kann man den Lösungsweg natürlich noch deutlich vereinfachen:

Es gilt ja nach obiger Lösung, dass a = b und dass c = -(a+b) = -2a.
Entsprechend kann man ansetzen:

x1 = m
x2 = m
x3 = m+a
x4 = m+a
x5 = m-2a

Die Varianz-Bedingung fordert dann, dass

a² + a² + (2a)² = n*s²

also

6a² = n*s²

Somit ist

a = Wurzel(n*s²/6).

Fertig.

LG
Jochen