Logistische Regression

Hallo zusammen!
Ich würde gerne eine logistische Regression durchführen, bin mir aber nicht sicher, wie die unabhängigen Variablen abgebildet sind.
Ich möchte eine metrisch skalierte Variable (Umsatz) aufnehmen, und möchte testen, ob diese Auswirkung auf die abhängige Variable (ja/nein) hat.
Ist es möglich, wenn man allein den Umsatz nimmt, dass man in der Ausgabe erkennt, ab welcher Höhe ein signifikanter Wechsel der abhängigen Variblen (von nein zu ja) stattfindet? Oder muss ich, um dieses Ziel zu erreichen, den Umsatz in verschiedene Variablen mit verschiedenen Klassen (zB 0 bis 100, 101 bis 200 usw.) aufsplitten?

Für eine Antwort wäre ich dankbar!

Hallo Pascal,

Ich möchte eine metrisch skalierte Variable (Umsatz)
aufnehmen, und möchte testen, ob diese Auswirkung auf die
abhängige Variable (ja/nein) hat.

das kann man anhand des zugehörigen Regressionskoeffizienten feststellen. Wenn der Koeffizient für den Prädiktor Umsatz signifikant von Null verschieden ist, dann hat der Umsatz einen Effekt auf die AV.

Ist es möglich, wenn man allein den Umsatz nimmt, dass man in
der Ausgabe erkennt, ab welcher Höhe ein signifikanter Wechsel
der abhängigen Variblen (von nein zu ja) stattfindet?

In der logistischen Regressionsanalyse wird die Wahrscheinlichkeit, daß die AV den Wert 1 annimmt, modelliert. Man kann sich über die Regressionsgleichung berechnen, ab welchem Wert im Prädiktor Umsatz die Wahrscheinlichkeit, daß die AV = 1 ist, eine bestimmte Höhe, z.B. 0,5, erreicht.

Beste Grüße

Vielen Dank soweit!

Man kann sich über die Regressionsgleichung berechnen, ab
welchem Wert im Prädiktor Umsatz die Wahrscheinlichkeit, daß
die AV = 1 ist, eine bestimmte Höhe, z.B. 0,5, erreicht.

Das hört sich, wenn ich es richtig verstehe, nach eine Aufkummulierung der Wahrscheinlichkeiten an. Dies sollte aber möglichst nicht der Fall sein, sondern eher in dieser Art der Interpretationsmöglichkeit:

Man kann erkennen, dass ab einem Umsatz von (z.B.) 250€ der Wechsel von 0 zu 1 signifikant ist im Gegensatz zu einem Umsatz von (z.B.) 195€.

(hoffe, ich habe mich verständlich genug ausgedrückt)

Das hört sich, wenn ich es richtig verstehe, nach eine
Aufkummulierung der Wahrscheinlichkeiten an.

Nein. Wie ich schrieb: Man kann berechnen, für welchen Wert im Prädiktor die Wahrscheinlichkeit AV = 1 einen bestimmten Wert annimmt.

Man kann erkennen, dass ab einem Umsatz von (z.B.) 250€ der
Wechsel von 0 zu 1 signifikant ist im Gegensatz zu einem
Umsatz von (z.B.) 195€.

Entweder ist die AV = 0 oder sie ist gleich 1. Deshalb kann ich mit dem Wort „signifikant“ in diesem Kontext nichts anfangen.

Das Modell der logistischen Regression beschreibt Wahrscheinlichkeiten. Du kannst Dir berechnen, wie groß die Wahrscheinlichkeiten p(AV = 1) für alle Umsätze sind. Wahrscheinlich gibt es auch einen Standardfehler dazu. Dann könnte man prüfen, ob sich die vorhergesagten Wahrscheinlichkeiten signifikant voneinander unterscheiden.

Beste Grüße

Hi Pascal,

Ich möchte eine metrisch skalierte Variable (Umsatz)
aufnehmen, und möchte testen, ob diese Auswirkung auf die
abhängige Variable (ja/nein) hat.

Das kanst du so machen, wie aiwendil beschrieben hat.

Ist es möglich, wenn man allein den Umsatz nimmt, dass man in
der Ausgabe erkennt, ab welcher Höhe ein signifikanter Wechsel
der abhängigen Variblen (von nein zu ja) stattfindet?

Das ist eine andere Fragestellung. Wenn man sich von dem Wort signifikant mal verabschiedet, kann man aber mittels ROC Kurven einen cut-off bestimmen, der die beiden Gruppen optimal trennt. Damit könntest du dann später eine bei zufälliger Befragenung einer Person nach dem Umsatz die Aussage treffen können, ob die abhängige Variable dann ja oder nein ist.

Oder
muss ich, um dieses Ziel zu erreichen, den Umsatz in
verschiedene Variablen mit verschiedenen Klassen (zB 0 bis
100, 101 bis 200 usw.) aufsplitten?

Um Gottes Willen! Stepeh Senn hat mal einen schönen artikel über „disappoiting dichotomies“ geschrieben, und sich sehr klar darüber ausgelassen, dass es (meistens) Blödsinn ist (PHARMACEUTICAL STATISTICS 2003; 2: 239–240 (DOI:10.1002/pst.090), Disappointing dichotomies, Stephen Senn).

Grüße,
JPL