Anova

Hallo Mathematiker,

ich suche eine EINFACHE, VERSTÄNDLICHE und EINFÜHRENDE Darstellung, was ANOVA (Analysis of variance) ist, wie sie funktioniert, wie sie durchgeführt wird, was die Ergebnisse bedeuten. Beim Googeln habe ich nur, nunja, recht kompakte und unverständliche Beschreibungen gefunden, ohne einfache Beispiele, ohne umgangssprachliche Erläuterungen und mit zu vielen Symbolen…

Danke für jeden Tipp!!

Jochen

ANOVA - lang und hoffentlich einfach genug
Hallo Jochen,

ich versuch’s als angehende Statistikerin mal so einfach und trotzdem exakt wie möglich:

Basis ist, dass sich die Varianz einer Gesamtheit aus mehreren Gruppen zerlegen lässt in die Varianz innerhalb der Gruppen, d.h. das arithmetische Mittel der Gruppenvarianzen, und die Varianz zwischen den Gruppen, d.h. die Varianz der Gruppenmittelwerte (sogenannte Varianzzerlegung). Dabei werden die Gruppen anhand des Einwirkens mehrerer Faktoren unterschieden (zB anhand des verabreichten Medikaments).

Das statistische Verfahren ANOVA testet anhand einer Prüfgröße, ob nun die Variabilität zwischen den Gruppen größer ist als innerhalb der Gruppen. Es handelt sich um eine Verallgemeinerung des 2-Stichproben-T-Tests.

Ich unterscheide hier die Fälle, dass ein Faktor (einfaktorielle Varianzanalyse)oder zwei Faktoren die Variabilität zwischen den Gruppen verursachen (zweifaktorielle VA, lässt sich analog fortführen). Im ersten Fall wird diese Variabilität SQE (Sum of Squares Expected), im zweiten Fall mit SQA, SQB für die Faktoren A, B bezeichnet. Die Variabilität innerhalb der Gruppen heißt SQR (Sum of Squares Residual). SQ(AxB) bezeichnet eine evt. durch Wechselwirkungen zwichen A und B hervorgerufene Variabilität zwischen den Gruppen. SQT (Sum of Squares Total) gibt die Gesamtvariabilität an. Diese Werte stehen in der ersten Spalte der ANOVA.

Zur Berechnung von SQA, SQB usw. wird die Formel für die Varianzzerlegung angewendet, dh SQA ist einfach die Summe der quadrierten Abweichungen der Gruppenmittelwerte vom Gesamtmittel, wobei die Gruppen nach den Stufen von A (zB die Höhe der Dosis, in der das Medikament A verabreicht wurde) unterschieden werden.

Die zweite Spalte der ANOVA bezeichnet die sogenannten Freiheitsgrade (FG), die für die Gewichtung der SQ’s benötigt werden. Die FG auf den unterschiedlichen Faktorstufen sind immer (Anzahl der Gruppen = Stufen von Faktor A - 1; im Weiteren I). Die Verringerung um 1 rührt daher, dass durch n-1 Beobachtungen und den Mittelwert die n-te Beobachtung bereits festgelegt ist. Für SQ(AxB) ist der FG dann das Produkt der FG von A (I-1) und B (Zahl der Gruppen = J, also J-1), und für SQR verbleiben die restlichen FG (I*J*(K-1), wobei K die Anzahl der Beobachtungen unter jeder einzelnen Faktorkombination ist), so dass für SQT als Summe aller FG die Gesamtzahl der Beobachtungen unter allen Faktoren - 1 = N-1 herauskommt.

Die dritte Spalte der ANOVA enthält die mittleren quadratischen Fehler, d.h. die erste Spalte (Sum of Squares) geteilt durch die zweite (Freiheitsgrade).

Die letzte Spalte enthält die Prüfgröße F, wobei für jede Spalte der mittlere quadratische Fehler des jeweiligen Faktors durch den mittleren quadratischen Fehler der Residuen (MQR=SQR/FG der Residuen) geteilt wird. Deshalb bleibt das letzte Feld auch leer (bzw. würde da die 1 stehen). Diese Prüfgrößen sind F((I-1)(J-1), IJ(K-1))-verteilt (für einfaktorielle VA: F(I-1, N-I)). D.h. wenn der Prüfgrößenwert eines Faktors das (1-alpha)-Quantil dieser Verteilung überschreitet, wird die Hypothese (signifikanter Effekt dieses Faktors) angenommen.

Ich hoffe, das hilft weiter!
Beste Grüße
Katharina

Gruß,

Jochen