es funktioniert genau wie beim Erwartungswert (E=4):
Var = 0.1*(2-4)^2+0.1*(7-4)^2+0.3*(1-4)^2+0.3*(6-4)^2+0.2*(5-4)^2
Das sieht man unmittelbar, wenn man sich eine Rohdatentabelle konstruiert, in der eine 2, eine 7, drei x die 4, 3 x die 6 und 2 x die 5 steht. (Interpretiere: wie oft ist ein Schüler innerhalb einer Stunde eingeschlafen.)
Dann setze alles in die Formel für die Varianz ein, fasse gleiche Terme zusammen (Bsp: (5-4)^2 + (5-4)^2 = 2*(5-4)^2) und ziehe 1/n in die Formel.
die Formel für die Varianz in diesem Fall lautet:
summe[(x_i-E(x))^2*p_i] über alle i. D.h man berechnet die quadratische Abweichung jeder möglichen Ausprägung vom Erwartungswert und gewichtet jeweils mit der Häufigkeit, mit der die jeweilige Ausprägung vorkommt. Hier Link zu Wikipedia: http://de.wikipedia.org/wiki/Varianz#Berechnung_bei_…:
(2-4)^2*0.1+(7-4)^2*0.1+(1-4)^2*0.3+(6-4)^2*0.3+(5-4)^2*0.2= 5.4
die Varianz ergibt sich als Erwartungswert der quadrierten Abweichungen vom Erwartungswert. Den Erwartungswert hast Du korrekt zu E(n)=4 berechnet. n ist die jeweilige Schülerzahl. Die quadrierten Abweichungen berechnen sich, indem Du jeweils den Erwartungswert von der Schülerzahl abziehst und das Ergebnis quadrierst: (n - E)^2. Von diesen Abweichungen mußt Du wieder den Erwartungswert bilden: V = E[(n - E)^2].
also
Die Varianz ist die mittlere quadrierte Abweichung vom Mittelwert. Sie gibt an, wie stark die Werte um den Mittelwert streuen.
Wenn du jetzt eine große Stichprobe nimmst,
d.h. viele zufällig ausgewählte Leute befragst (Stichprobenumfang n):
„Haben Sie schon einmal im Unterricht geschlafen?“,
dann kannst du eine Zufallsvariable X so definieren,
dass sie angibt, wie viele der befragten Personen mit „JA“ anworten.
Für diese Zufallsgröße X kannst du dann Erwartungswert mü = E(X), Varianz V(X) und Standardabweichung sigma = sqrt(V(X)) bestimmen.
Je nachdem, welche Verteilung du annimmst (binomiale Verteilung, Normalverteilung, hypergeometrische Verteilung, … ), kannst du die entsprechenden Werte auch rein theoretisch berechnen.
wo ist das Problem? Du hast die Merkmalsausprägungen und die relativen Häufigkeiten. Einen Mittelwert hast du doch sogar schon selber berechnet. Da sollte die Varianz doch eigentlich keine Schwierigkeiten machen. Die richtige Lösung ist übrigens 5,4.