Hallo Zusammen,
Könnte mir jemand erklären wo der wesentliche Unterschied zwischen einer linearen und einer stückweise linearen Regression ist und wie man bei einer stückweisen linearen Regression vorgeht?
Vielen Dank im Voraus!
Gruß Dan
Hallo Zusammen,
Könnte mir jemand erklären wo der wesentliche Unterschied zwischen einer linearen und einer stückweise linearen Regression ist und wie man bei einer stückweisen linearen Regression vorgeht?
Vielen Dank im Voraus!
Gruß Dan
Untergruppen?
Könnte mir jemand erklären wo der wesentliche Unterschied zwischen einer linearen und einer stückweise linearen Regression ist
Ich denke, Du meinst sowas wie abschnittsweise lineare Regression oder Regression mit Gruppierung?
und wie man bei einer stückweisen linearen Regression vorgeht?
In diesem Fall bedeutet das:
Die Lineare Regression geht davon aus, daß die verfügbaren Daten durch eine einzige Funktion y=f(x) dargestellt werden.
Die streckenweise lineare Regression geht davon aus, daß die Hypothese y=f(x) für eine einzige Funktion f nur streckenweise gültig ist, und danach die zugrunde liegende Basisfunktion wechselt.
Ein typisches Beispiel: Von 2002 bis zum 1. Januar 2008 wurde im Unternehmen mit SuperGadget gearbeitet. Die Produktivitätsfunktion war… blah.
Seit 1. Januar 2008 wird mit UltraGadget gearbeitet. Die Hypothese „y=f(x) ab 2002 bis heute ist gleich“ konnte schon wiederlegt werden.
Um jetzt herauszufinden, wie die neue Basisfunktion aussieht, muß man die Daten chronologisch separieren zum Zeitpunkt der Änderung.
Komplizierter wird es bei Regression mit multiplen Untergruppen (ka ob Du das meinst und auch BITTE nicht mit multipler Regression verwechseln):
man hat Produktivitätsdaten von Arno, Bernd und Carmen.
Alles in einer Datei. Die Hypothese y=f(x) für alle drei MA konnte schon wiederlegt werden.
Wenn man den Weg gehen wollte, eine Einheitsfunktion mit dem Zusatzfaktor „welcher Mitarbeiter“ zu erstellen (mögliches Problem: „over-fitting“), was multiple Regression wäre, kann man drei Funktionen aus einem Datensatz erstellen:
Man kann eine Regression mit Untergruppen durchführen: y(A)=f(x), y(B)=f(x), y©=f(x), wobei y(A) heißt: „Produktionsfunktion für Arno“.
Natürlich kann man auch „2002-2007“ und „2008-heute“ als Untergruppen verstehen, das tut der Schematik keinen Abbruch.
Dabei natürlich nach wie vor darauf achten, daß die üblichen Prämissen der linearen Regression überhaupt eingehalten sind.
Im Übrigen ist das Nicht-Einhalten der Prämissen der Linearen Regression der Hauptgrund dafür, warum man Untergruppen einführt: sieht man, daß an einem Punkt die Daten auf eine Nichtlinearität hinweisen, sollte man darüber nachdenken, ob man nicht hier eine Untergruppe aufmacht (also z.B. wenn man einen Trendwechsel in den Daten hat oder die Trennung zur Entstehung mehrerer konsistenterer, unterschiedlicher Trends führt).
Gruß,
Michael