R² und Q² in statistischer Versuchsauswertung

Hallo zusammen…

…in meinem statistischen Versuchsplanungs-Programm Modde4.0 erhält man als Auswertungsergebnis folgende Variable:

R² und Q²

In der Hilfe gibt´s dazu folgende Erläuterung:

For every fitted response the plot displays R² and Q².
R²: The fraction of variation of the response explained by the model.

R² = SSREG / SS

SSREG = The sum of squares of Y corrected for the mean, explained by the model.
SS = The total sum of squares of Y corrected for the mean

Q²: The fraction of variation of the response that can be predicted by the model.

Q² = 1 - PRESS/SS

PRESS is the prediction residuals sum of squares. SS is the total sum of squares of Y corrected for the mean.

Both R² and Q² values are numbers usually between 0 and 1. Q² can be negative for very poor models. With PLS negative Q² are truncated to zero for computational purposes. Values close to 1 for both R² and Q² indicates very good model with excellent predictive power (see Statistical appendices for more details).

Kann mir das vielleicht jemand auf Deutsch erklären, für was R² und Q² stehen??

Thx, Flox

Aber immer doch!

For every fitted response the plot displays R² and Q².
R²: The fraction of variation of the response explained by the
model.

SS = The total sum of squares of Y corrected for the mean

Dieses ist einfach die Varianz innerhalb der Gruppe Y.

SSREG = The sum of squares of Y corrected for the
mean, explained by the model.

Das ist die Varianz innerhalb der Gruppe Y, die vom Modell erklärt wird.

R² = SSREG / SS

Folglich ist R² ein Ausdruck für die erklärte Varianz an der Gesamtstreuung, und smoit ein Maß für die Güte des Modells, das du angewendet hast.

PRESS is the prediction residuals sum of squares.

Dabei handelt es sich um die Summe der Residuen der nicht erklärten Streuung. Das heißt, daß für jeden Meßpunkt die Abweichung vom Mittelwert berechnet wird, die erklärte Streuung wird abgezogen und der Rest (Residuum) wird quadriert.

Bei einfachen Regressions- oder einfaktoriellen Varianzanalysen setzt sich die Varianz in der Gruppe stets aus der erklärten und der nichterklärten Streuung zusammen (einfach per Addition). Je besser die Parameter des Modells gesetzt wurden, um so größer ist die erklärte Varianz und im Gegenzug dazu um so kleiner die nichterklärte.

Q² = 1 - PRESS/SS: The fraction of variation of the response that can be
predicted by the model.

Damit ist Q² der Anteil der nichterklärten Varianz an der Gesamtstreuung und somit ebenfalls ein Maß für die Güte des Modells.

Both R² and Q² values are numbers usually between 0 and 1. Q²
can be negative for very poor models.

Dann allerdings ist das Modell völliger Müll, denn wenn die nichterklärte Streuung größer als die Gesamtstreuung ist, sollte man seine Vorgehensweise nochmal überdenken.

With PLS negative Q² are truncated to zero for computational
purposes. Values close to 1 for both R² and Q² indicates very
good model with excellent predictive power.

Jetzt dürfte klar sein, warum ein Modell gut ist, wenn R² und Q² nahe bei 1 liegen.
Gruß Tyll

Hi Tyll…

…besten Dank für Deine erklärende Übersetzung, hast mir wahnsinnig geholfen!!

Ähmm…kleine Frage noch…

Wie geht´s den Oldtimern, Suprahet und Hornschrecken?? :wink:

Gruß, Flox

*LOL*
Scheck erstmal nix - Statistik-Prozessor wieder abgeschaltet, dann hats geklickt - ja läuft gut, bin Silberband-Fan, weil ich nicht so viel Zeit habe und gerade bei Band 65 - also eigentlich bin ich schon tot, hmmm, naja, auch Geister haben ihre guten Seiten *g*

Hihi, stimmt…und wenn sie bei wer-weiss-was rumgeistern, dann um so besser!!

Also nochmals danke und viele grüße,

flox

Keine Ursache - gern geschehen! O.T.
Tyll

hmmpf, jetzt muss ich dich nochmal nerven… :wink:
Hi nochmal…

…eines ist mir noch nicht soooooo ganz klar.

Woher kommt denn die sogenannte „nichterklärte“ Streuung? Kannst Du mir vielleicht ein oder zwei Beispiele für erklärte und nichterklärte Streuung und ihre (möglichen) Ursachen sagen?

Schonmal Danke im Voraus…

Gruß, Flox

:smile:

Woher kommt denn die sogenannte „nichterklärte“ Streuung?
Kannst Du mir vielleicht ein oder zwei Beispiele für erklärte
und nichterklärte Streuung und ihre (möglichen) Ursachen
sagen?

Hi!
Im folgenden ist „S1,n(x)“ kein Faktor, sondern steht für „SUMME von 1 bis n über x“ - i wird immer der Laufindex sein.
Also, wir haben mal zwei Gruppen A1 und A2 mit den Meßwerten a11,…,a1n1 und a21,…,a2n2.
Dann seien
A1 :=1/n1*S1,n1(a1i)
A2 :=1/n2*S1,n2(a2i)
die jeweiligen Gruppenmittelwerte, sowie
A :=1/(n1+n2)*[S1,n1(a<sub>1i</sub>)+S1,n2(a<sub>2i</sub>)]
der Gesamtmittelwert.
Nun nehmen wir mal an, A1 und A2 differieren und man hat die Vermutung, daß das an einem bestimmten Sachverhalt liegt, der bei der Meßwerterhebung der Gruppen diese deutlich unterschieden hat. Sind dann die Mittelwerte signifikant verchieden, kann man die Streuung
S :=S1,2(ni( Ai - A )²)
auf eben diesen Grund zurückführen und dann ist S als Streuung zwischen den Gruppen erklärt.
Im Gegensatz dazu gibt es ja aber noch die Streung innerhalb der einzelnen Gruppen, welche nach wie vor auf Zufälligkeit(?) beruht und somit mit dem Modell nicht erklärt werden kann und deswegen nichterklärte Streuung heißt.
Beachte aber immer, daß zur Erstellung eines Modells eine gute Sachkenntnis der Materie gehört, denn die oben angeführte einfaktorielle Varianzanalyse ist ein strukturprüfendes Verfahren, das also nach dem Ausschlußverfahren funktioniert: Mann kann sagen, welcher Faktor wie stark die Streuung erklärt, das heitß aber noch lange nicht, daß er alleine veratwortlich dafür ist!
Für weitere Beispiele kann ich dir den
BACKHAUS, Multivariate Analysemethoden, Springer-Verlag nur ans Herz legen.
Hast du richtig Bock auf Mathe, dann der
FAHRMEIER, Multivariate statistische Verfahren, WdeG der richtige (aber TEUER!)
Gruß
Tyll