Multiple Regression bei verschied. Häufigkeiten?

Hallo ich habe eine ganz kurze Frage hinsichtlich meiner Diplomarbeit:
Macht es Sinn wenn ich eine multiple Regression durchführen will, die einzelnen Variablen aber unterschiedliche Häufigkeiten haben…Kannn ich so Varianzen aufklären, oder is das Datenmaterial dann unbrauchbar?
Besten Dank für die Antworten, Gruß Nico

Hallo Nico,

mir ist nicht ganz klar, was Du mit „die einzelnen Variablen aber unterschiedliche Häufigkeiten haben“ meinst. Multiple Regression setzt Punkte der Form (y,x1,x2,…) voraus. Zwischen den Punktkoordinaten muss ein logischer Zusammenhang. Es könnte also die Messwerte zweier Prediktoren und der AV einer Person sein. Wenn bei einem solchen Tupel ein Wert fehlt, würde ich es von der Datenanalyse aussschließen. Es gibt allerdings auch Schätzmethoden für Missing Values. Beantwortet dies Deine Frage?

Viele Grüße,

Falk

Hallo,

Macht es Sinn wenn ich eine multiple Regression durchführen
will, die einzelnen Variablen aber unterschiedliche
Häufigkeiten haben…Kannn ich so Varianzen aufklären, oder is
das Datenmaterial dann unbrauchbar?

kommt darauf an, wie die fehlenden Daten zustande gekommen sind. Wenn rein zufällig Daten fehlen (data missing completely at random), dann ist das Verfahren, das Du vorschlägst (pairwise deletion), vertretbar. Wenn Daten aber nicht rein zufällig fehlen, dann beziehen sich die Daten, die für die Berechnungen herangezogen werden, auf systematisch unterschiedliche Teilmengen, so daß man die Ergebnisse der Regressionsanalyse nicht in Bezug auf eine Population oder Teilpopulation interpretieren kann. Außerdem können sich durch das Verfahren Korrelationen ergeben, deren Konstellation mathematisch unmöglich ist, wenn die Daten vollständig wären; d.h. die auf diese Weise zusammengestellte Korrelationsmatrix kann von solcher Art sein, daß sie keine vernünftigen Schätzung der wahren Korrelationsmatrix ist. Da die Korrelationen aber die Basis für die Regressionsanalyse sind, kann das Ergebnis der Regressionsanalyse auf Basis solcher Korrelationsmatrizen nicht richtig sein.

Grüße

Oliver