Regressionanalyse: Varianz und Korrelation

Hallo Leute!
Ich bin total verzweifelt und bin wirklich auf eure Hilfe angewiesen.
Ich muss ein Preis mittels der Regressionanalyse ermitteln. Ich habe bereits alle Variablen ermittelt und muss jetzt die Teste mit Residuen durchführen. Nach den Annahmen der Regressionanalyse muss für für den tatsächlichen Fehler gelten:

  1. Normalverteilung N(0,varianz)
  2. Homoskedastizität (konstante Varianz)
  3. stochastische Unabhängigkeit

Weil ich den tatsächlichen Fehler nicht habe, muss ich die Tests mit den Residuen durchführen. Dann komme ich zu den Ergebnissen:

  1. Chi-Quadrat-Test: Normalverteilung gegeben!
  2. Bartlett’s test: Auf dem Plot e und ^Y(geschätzte Varible) konnte man vermuten, dass mit dem aufsteigenden ^Y e auch steigt. Deswegen habe ich ^Y aufsteigend sortiert und entsprechende e in 2 Klassen mit gleicher Elementenanzahl aufgeteilt. Dieser Test führte zum Ergebnis, dass Varianz nicht konstant ist.
  3. Diblon-Watson Test und Runs Test: Nacheinanderfolgende Werte korrelieren. Serielle Korrelation ist auch vorhanden.

=> 2. und 3. Annahme sind verletzt. Kann ich irgendwie umgehen? Transformieren? Habe ich vielleicht Bartlett’s Test falsch gemacht? Wenn ihr mir nicht helfen könnt, könnt ihr mir vielleicht ein Forum empfehlen, wo ich sowas fragen könnte?

Danke!

Hi Puntik,
man könnte alle vorgaben auch anders testen, aber das ist wohl nciht Sinn der Übung, oder?

Weil ich den tatsächlichen Fehler nicht habe, muss ich die
Tests mit den Residuen durchführen.

Das musst du sowieso immer. Denn du willst das Modell prüfen, also die die Residuen ansehen.

  1. Chi-Quadrat-Test: Normalverteilung gegeben!

Oder besser: Keinen Hinweis darauf, dass es einen Unterscheid gäbe.

  1. Bartlett’s test: Auf dem Plot e und ^Y(geschätzte Varible)
    konnte man vermuten, dass mit dem aufsteigenden ^Y e auch
    steigt. Deswegen habe ich ^Y aufsteigend sortiert und
    entsprechende e in 2 Klassen mit gleicher Elementenanzahl
    aufgeteilt. Dieser Test führte zum Ergebnis, dass Varianz
    nicht konstant ist.

Die Aufteilung in 2 Gruppen kommt mir seltsam vor. Eigentlich würde bei vermuteter Autokorrelation zwar die Werte ansteiegend ordnen (was aber eigentlich auch egal ist) und jeden Zeitpunkt (bzw. jede Stützstelle auf der x-Achse) als Gruppe nehmen. Das wird natürlich schwierig, wenn du nur einen Messwert pro Stützstelle hast. Aber deine Einteilung ist vollkommen willkürlich und hätte bei anderer Wahl ein anderes Ergebnis, weswegen sie nicht optimal ist.

  1. Diblon-Watson Test und Runs Test: Nacheinanderfolgende
    Werte korrelieren. Serielle Korrelation ist auch vorhanden.

Wahrscheinlich eher ein Effekt der Autokorrelation.

=> 2. und 3. Annahme sind verletzt. Kann ich irgendwie
umgehen? Transformieren? Habe ich vielleicht Bartlett’s Test
falsch gemacht?

Kleine Übersicht über mögliche Konsequenzen:
http://tu-dresden.de/die_tu_dresden/fakultaeten/phil…
und
http://www.forschung.snb.ch/files/stalder/update-aug…
und
http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1…
Alles aber kein Grund, die Flinte ins Korn zu werfen. Es gibt entsprechend angepasste Tests/Schätzer:
http://www.statistik-service-schlumprecht.de/index.p…
und
http://home.arcor.de/rafflenbeul/inhalte/Termpaper.pdf („WLS“)

Grüße,
JPL