ich möchte gerne eine lineare (multiple) Regressionsanalyse durchführen. Meine abhängige Variable musste ich aud anderen Daten approximieren und sie ist logarithmiert, also ln(x).
Wie sind nun meine unabhängigen Variblen zu definieren? Muss ich diese ebenfalls logarithmieren um methodisch korrekt zu arbeiten?
es geht darum, dass ich untersuchen möchte, ob es einen statistischen Zusammenhang zwischen der Anzahl von Rezensionen und dem Buchverkauf im Onlinehandel gibt.
Die Verkäufe habe ich mittels einer Formel vom Rangplatz des Buches berechnet, allerdings ist es der ln, Also ln(Verkäufe). Wenn ich nun eine lineare Regression durchführen möchte mit den Verkäufen als abhängige Variable, müssen dann die unabhängigen Variblen (zB Preis) ebenfalls logarithmiert werden?
Danke!
[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]
es geht darum, dass ich untersuchen möchte, ob es einen
statistischen Zusammenhang zwischen der Anzahl von Rezensionen
und dem Buchverkauf im Onlinehandel gibt.
Die Verkäufe habe ich mittels einer Formel vom Rangplatz des
Buches berechnet, allerdings ist es der ln, Also ln(Verkäufe).
Wenn ich nun eine lineare Regression durchführen möchte mit
den Verkäufen als abhängige Variable, müssen dann die
unabhängigen Variblen (zB Preis) ebenfalls logarithmiert
werden?
Prinzipiell solltest du alle Transformationen, die nicht notwendig sind, vermeiden.
Eine Notwendigkeit für eine log-Transformierung ergibt sich aus deiner Fragetsllung nicht.
Allerdings solltest du dir klar darüber sein, was logarithmierte Verkäufe bedeuten, wenn du die Ergebnisse interpretierst.
die log-Formel habe ich aus der Literatur und sie dient dazu, vom Rangplatz des Buches auf die Verkäufe zu schließen. Ich bin jetzt hingegangen und habe die Ergebnisse mit der e-Funktion wieder entlogarithmiert. Darf man das?
Gruß,
Pascal
[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]