Multiv. Regression - Toleranz vs. Konditionsindex

Hallo,

ich hoffe auf Hilfe zu folgendem Problem:

Ich habe (mit SPSS) eine multiv. Regressionsanalyse berechnet, bei der 3 Variablen (UV) in das endgültige Modell aufgenommen wurden. Alle Werte optimal und entsprechend theoretischer Vorüberlegungen.

Nur bei der Indentifikation der Multikollinearität bekomme ich widersprüchliche Werte: Die Toleranzwerte liegen immer über 0,96 (was auf keine Multikoll. schließen läßt) aber der Konditionsidex „schießt“ weit über 15 (was auf Multikoll. hindeutet) hinaus. Regressionsanalysen und Korrelationsanalysen zwischen den drei UV bestätigen eine Abwesenheit von Multikollinearität. Würde natürlich gerne die Ergebnisse annehmen, weiß aber nicht, wie ich bzgl. der extremen Konditionsindexwerte argumentieren soll…

Was kann ich tun? Wieso (bzw. wann) ergeben sich beim Konditionsindex diese gegenläufigen Ergebnisse?

Vielen Dank für Eure Antworten!
VG
flatratte

Hi,
reich doch mal die Korrelationsmatrix rüber.
Bei nur 3 UV kann man die Eigenwerte auch zu Fuss berechnen und die Toleranzkoeffizienten auch.

Gruss,

hallo helge,

hier die Korrelationen (nach Pearson):

_____UV1_____UV2_____UV3
UV1___1_____0,073____0,180
UV2__0,073____1_____-0,021
UV3__0,180__-0,021_____1

Danke für deine Unterstützung!!!
VG

Hi,

Vor jeglicher Berechnung fällt bereits auf, dass die Korrelationskoeffizienten durch die Bank ziemlich klein sind.
Das spricht gegen Kollinearität.

Ich hab mal die Eigenwerte der Korrelationsmatrix mit Excel berechnet.
Ergebnis: es gibt nur einen einzigen Eigenwert! (ca. 0,6)
Zweifel ausgeschlossen, ich hab das Polynom 3. Grades graphisch mit Excel aufgetragen. Es hat keine lokalen Extrema -> nur eine einzige Nullstelle.
Das würde bedeuten, dass es nur einen einzigen Konditionsindex geben kann, mit dem Wert 1.
Von Kollinearität kann also wirklich keine Rede sein.

Ich würde den Toleranzkoeffizienten mehr trauen, auch aus einem weiteren Grund: Die Toleranzkoeffizienten hängen direkt mit den quadrierten Korrelationskoeffizienten zusammen, was somit prinzipiell eine Signifikanzaussage ermöglicht.
Zu den Konditionsindices dagegen findet man nur vage Aussagen a la „ab 15 kann man davon ausgehen, dass“, oder „ab 30 ziemlich sicher“ blabla.
Ich glaube, dass das numerische Verfahren der Statistiksoftware bei deinem Zahlenbeispiel einfach in die Wüste rennt.
Gruss,

Hallo Helge,

danke für deine Mühen und die ausführliche Erläuterung!

Werde die Multikollinearitätprüfung „nur“ auf Basis der Korrelationen sowie der Toleranzwerte durchführen. Die „sprechen“ ja eine deutliche Sprache.

Nochmal vielen DANK!!!
VG
flatratte