Hi,
Konkret:
- Darf ich die Variablen q1 und q2 zusammenfassen, wenn es
sich um unterschiedliche Fragen zum gleichen Thema handelt?
Ja, kannst du. Das ist das übliche Mittel um von einer multivariaten analyse (mehrere abh. Vars) zu einer univariaten (1 unabh. Var) zu kommen. Je nach Art der Verknüprfung (+, *, -, mean, median ,…) ist der Informationsgehalt ein anderer und muss bei der Interpretation berücksichtigt werden.
- Darf ich die Variablen q3-q9 zusammenfassen, wenn sie
mehrere Antwortmöglichkeiten der gleichen Frage sind
(Mehrfachantworten)?
Mehrfachantworten sind etwas anderes als enfachantworten auf mehrere ähnliche Fragen. Erstes Kriterium: Waren Mehrfachantworten vorgesehen? Wenn ja, warum fasst du sie jetzt zuammen (dann hättest du auch gleich nur eine ntwort zulassen können). Wenn nein, sollte man sich vorher überlegen, was man in dem Fall macht. Mitteln kann u.U. extreme Verzerrungen bewirken (bei -5 und 5 ergäbe das 0, würde aber in keinster Weise die Beatwortung widerspiegeln). Möglich ist hier ein konservativer Ansatz, d.h. min oder max, je nachdem, was für den erwarteten Ausgang der Studie schlimmer wäre (wenn du dann noch über mehrere Fragen mittelst, wird es allerdings sehr schwer, das abzuschätzen. Das zeigt u.a., wie verzerrend und verändernd man in die Daten eingreift, wenn man so etwas macht. Inwiefern das dann noch die gegebenen Antworten widergibt, ist dann fraglich).
Macht das überhaupt Sinn? Und wie sieht es dann mit der
Linearität aus, funktioniert eine Regressionsanalyse dann
noch?
Bei Linearität funktioniert eine regression super. Nicht-linearität ist eher das Problem, also z.B. funktionen der Form y = a*x^a1 + b*x^b1, wobei a1, b1 nicht 1 sind.
Ob das Sinn macht hängt vor allem davon ab, ob die nur metrische Variablen hast oder auch andere (Geschlecht, wohnort,…)
Grüße,
JPL