Statgraphics - Was ist F-ratio?

Hallo, ich habe im Statistik Programm Statgraphics eine Simple Regression durchgeführt - was bedeutet dabei die Zahl F-Ratio? Danke im voraus…

Hallo,

die F-ratio bei der Regression ist der Quotient aus Erklärter Varianz und Ungeklärter Varianz.

LG
Jochen

Vielen Dank - heisst das ich muss, um f ratio zu berechnen die erkl. Varianz durch die ungekl. Varianz teilen? Das funktioniert leider nicht in meinem aktuellen Beispiel?

Vielen Dank - heisst das ich muss, um f ratio zu berechnen die
erkl. Varianz durch die ungekl. Varianz teilen?

Korrekt.

Das funktioniert leider nicht in meinem aktuellen Beispiel?

Hä? Ist das eine Frage oder eine Aussage? Wenn’s eine Frage sein soll, dann brauche ich da zur Beantwortung aber mehr Informationen (Aufgabenstellung, Daten!).

LG
Jochen

Regression Analysis - Linear model: Y = a + b*X

Dependent variable: absatz
Independent variable: preis

Standard T
Parameter Estimate Error Statistic P-Value

Intercept 2801,39 307,453 9,1116 0,0000
Slope -1182,65 143,112 -8,26381 0,0000

Analysis of Variance

Source Sum of Squares Df Mean Square F-Ratio P-Value

Model 200533,0 1 200533,0 68,29 0,0000
Residual 41110,6 14 2936,47

Hi Jochen, hier die Beispieldaten für ein einfaches lineares Modell!

Wie errechnet das Programm F-Ratio?

Ps: Vielleicht weißt Du auch was Df bedeutet :wink:

Uups - sorry,

hier nochmal die Analysis, die letzte Zeile fehlte:

Analysis of Variance

Source Sum of Squares Df Mean Square F-Ratio P-Value

Model 200533,0 1 200533,0 68,29 0,0000
Residual 41110,6 14 2936,47

Total (Corr.) 241644,0 15

Hallo Michael,

was ist denn die Varianz?

Die Varianz ist die Summe der (Abweichungs-)Quadrate, geteilt durch die Anzahl der Werte (n), also praktisch die mittlere Quadratesumme. Dienen die Werte als Stichprobe zur Schätzung der Varianz, so wird statt durch n durch (n-1) geteilt.

Jetzt solltest du’s hinbekommen. Nur zur Kontrolle ist hier auch noch die Lösung:

Alles, was du brauchst, ist im letzten Teil deiner Angaben gewesen:

Analysis of Variance
----------------------------------------------------------
Source Sum of Squares Df Mean Square F-Ratio P-Value
----------------------------------------------------------
Model 200533,0 1 200533,0 68,29 0,0000
Residual 41110,6 14 2936,47
----------------------------------------------------------
Total (Corr.) 241644,0 15

Die Spalte „Sum of Squares“ enthält die Abweichungsquadrate. Die für das „Model“ zeigen, welcher Teil der Abweichungsquadrate praktisch durch das Modell verringert (=erklärt) wird. Hier sind das 200533. Die Varianz ist ja die mittlere Quadratesumme. Bei n=2 Variablen, die das Modell enthält, ergibt sich die Schätzung der Varianz durch 200533/1 = 200533, was dann auch in der Spalte „Mean Square“ steht. das (n-1) sind übrigends die Zahl der Freiheitsgrade (hier für das Modell; das hat eben einen Freiheitsgrad). Für die Residuen läuft das genauso: Die Summe der Abweichungsquadrate ist 41110,6. Die ergibt sich aus n=15 Werten, das macht (n-1)=14 Freiheitsgrade. Die Varianz-Schätzung ist damit für die Residuen 41110,6/14 = 2936,47. Das ist die „Restvarianz“ oder die (durch das Modell) ungeklärte Varianz.

Nun ist F = gekl.Var / ungekl.Var = 200533 / 2936,47 = 68,29.

Unter der Annahme, dass das Modell nichts mit den Daten zu tun hat, sind beide Varianzen (im Mittel) etwa gleich groß. Wenn das Modell die Daten also nicht beschreibt, erwartet man einen F-Wert 1. Wenn der F-Wert größer als 1 wird, heißt das, dass das Modell mehr als die Hälfte dre Gesamt-Varianz erklärt. Je größer der F-Wert, desto besser beschreibt das Modell die Daten.

Doch was ist eigentlich die Gesamtvarianz?

Das ist einfach die „normale“ Varianz der y-Werte. Du kannst die ja mal ausrechnen. Die Abweichung wird hier zum Mittelwert berechnet. Wenn Du das als lineares Modell beschreiben willst, dann ist das Modell eine horizontale Gerade (Steigung=0) mit einem Achsenabschnitt, der dem Mittelwert der y-Werte entspricht.

In deinem Beispiel sollte 16109,6 herauskommen (ich kann das aus Deinen Angaben berechnen, weil die Gesamtsumme der Abweichungsqadrate und die Zahl der Freiheitsgrade insgesamt ja auch angegeben sind, nämlich 241644 und 15).

In deinem Beispiel ist das optimale lineare Modell ja eine Gerade mit der Steigung -1182,65 und einem Achsenabschnitt von 2801,39. Bildet man die Summe der Abweichungsquadrate von den Datenpunkten zu dieser Geraden, erhält man statt 241644 nur noch 41110,6. Der Rest, die 200533, werden also vom Modell „eliminiert“ bzw. „erklärt“.

Ich hoffe, jetzt ist alles etwas klarer.

LG
Jochen

PS:

das ist jetzt nicht(!) ablässig oder böse gemeint:

Statistik ist ein sehr wichtiges Werkzeug in der (Natur-)Wissenschaft. Ein Wissenschaftler steht IMHO in der Verantwortung, die Arbeitsweise seiner Methoden und Werkzeuge zu verstehen, um Ergebnisse richtig interpretieren zu können und um Fehler entdecken zu können.

Deine Fragen erwecken den Eindruck, dass du hier „eben mal so“ ein tolles Statistikprogramm für „irgendwas“ benutzt, so als Black-Box, und nicht so genau weißt, was das alles soll und bedeutet. Das ist natürlich nicht gut für einen (angehenden) Wissenschaftler.

Leider ist das sehr, sehr oft der Fall; ich weiß - aber das macht es ja nicht besser :wink: Dich zeichnet aber immerhin aus - und das ist wirklich klasse! - dass du NACHFRAGST. Du willst also die Sache verstehen. Gut so! Daher empfehle ich Dir, dich (nochnmal?) intensiver mit Statistik zu befassen und zu lernen, was Varianz ist und wie und warum man wo die Varianz in statistischen Verfahren nutzt.

Hallo,

das hatt ich unten vergessen.

Auf Deutsch: Freiheitsgrade.

Im Prinzip ist es die Zahl der (Meß-)Werte, die unabhängig voneinander zufälligen Schwankungen unterliegen können (also „frei“ sind, frei variieren können). Wenn es keinen Wert gibt, der aus anderen, bereits bekannten Werten genau vorhergesagt (berechnet) werden kann, dann ist die Zahl der Freiheitsgrade gerade die Zahl der Werte.

Beispiel: Der Mittelwert berechnet sich aus der Summe der Einzelwerte, geteilt durch die Zahl der Freiheitsgrade. Da hier jeder Wert unabhängig ist von allen anderen, ist die Zahl der Freiheitsgrade genau die Anzahl der Werte (n).

Wenn man weiß, dass die Elemente bestimmte Randbedingungen erfüllen
müssen, gehen Freiheitsgrade verloren: ein Freiheitsgrad pro einzuhaltende Randbedingung.

Beispiel: Die empirische Varianz hat n-1 Freiheitsgrade, weil die Varianz ja relativ zum Mittelwert berechnet werden muss – einer der Meßwerte ist also durch die anderen genau festgelegt, wenn alle zusammen den Mittelwert ergeben sollen.

Siehe auch:

http://de.wikipedia.org/wiki/Freiheitsgrad (Statistik) http://psydok.sulb.uni-saarland.de/volltexte/2004/26… http://www.statistics4u.com/fundstat_germ/cc_degree_…

Wow - das ist sehr ausführlich, vielen Dank! Ich benötige das Programm für eine Prüfung meines Studiums (Agrarwissenschaften). Wir arbeiten in dem Fach „Empirische Wirtschaftsforschung“ mit Access (verstehe ich bestens) und mit Statgraphics (mäßige Begabung).

Nichts desto trotz - vielen dank erstmal, evtl. kommt noch die ein oder andere Frage auf!

Gruss aus Berlin - Micha

Wow - das ist sehr ausführlich, vielen Dank!

Gerne doch.

Wir arbeiten in dem Fach „Empirische
Wirtschaftsforschung“ mit Access (verstehe ich bestens) und
mit Statgraphics (mäßige Begabung).

Um das nochmal zu betonen: Es geht nicht darum, ein Programm bedienen zu können, ohne zu verstehen, was das Programm macht. Das Verständnis der Prinzipien ist das wichtige. Irgendeine - austauschbare - Software hernehmen, die einem die Rechenarbeit abnimmt, kann man immer noch.

Natürlich kann keiner alles in allen Details verstehen. Als Wissenschaftler sollte (muß) man aber zumindest bestrebt sein, die Methoden, die man nutzt, möglichst genau zu verstehen. Wie gesagt, leider ist es in weiten Kreisen normal, Methoden anzuwenden, Software zu verwenden und unreflektiert Zahlen/Meßwerte/Ergebnisse abzuschreiben ohne auch nur grob die zugrunde liegenden Prinzipien der Methoden verstanden zu haben (und auch verstehen zu wollen). Du glaubst nicht, wieviel Unsinn veröffentlicht wird, weil niemand der Autoren und Reviewer die benutzten Methoden versteht!

Darum freue ich mich ja über solche Fragen hier und kann dich dazu:

evtl. kommt noch die
ein oder andere Frage auf!

nur ermuntern.

LG
Jochen