Ich habe (mit SPSS) eine multiv. Regressionsanalyse berechnet, bei der 3 Variablen (UV) in das endgültige Modell aufgenommen wurden. Alle Werte optimal und entsprechend theoretischer Vorüberlegungen.
Nur bei der Indentifikation der Multikollinearität bekomme ich widersprüchliche Werte: Die Toleranzwerte liegen immer über 0,96 (was auf keine Multikoll. schließen läßt) aber der Konditionsidex „schießt“ weit über 15 (was auf Multikoll. hindeutet) hinaus. Regressionsanalysen und Korrelationsanalysen zwischen den drei UV bestätigen eine Abwesenheit von Multikollinearität. Würde natürlich gerne die Ergebnisse annehmen, weiß aber nicht, wie ich bzgl. der extremen Konditionsindexwerte argumentieren soll…
Was kann ich tun? Wieso (bzw. wann) ergeben sich beim Konditionsindex diese gegenläufigen Ergebnisse?
Vor jeglicher Berechnung fällt bereits auf, dass die Korrelationskoeffizienten durch die Bank ziemlich klein sind.
Das spricht gegen Kollinearität.
Ich hab mal die Eigenwerte der Korrelationsmatrix mit Excel berechnet.
Ergebnis: es gibt nur einen einzigen Eigenwert! (ca. 0,6)
Zweifel ausgeschlossen, ich hab das Polynom 3. Grades graphisch mit Excel aufgetragen. Es hat keine lokalen Extrema -> nur eine einzige Nullstelle.
Das würde bedeuten, dass es nur einen einzigen Konditionsindex geben kann, mit dem Wert 1.
Von Kollinearität kann also wirklich keine Rede sein.
Ich würde den Toleranzkoeffizienten mehr trauen, auch aus einem weiteren Grund: Die Toleranzkoeffizienten hängen direkt mit den quadrierten Korrelationskoeffizienten zusammen, was somit prinzipiell eine Signifikanzaussage ermöglicht.
Zu den Konditionsindices dagegen findet man nur vage Aussagen a la „ab 15 kann man davon ausgehen, dass“, oder „ab 30 ziemlich sicher“ blabla.
Ich glaube, dass das numerische Verfahren der Statistiksoftware bei deinem Zahlenbeispiel einfach in die Wüste rennt.
Gruss,