datenprüfung f log regression spss

Hallo Zusammen
Ich habe einen spss datensatz und soll prüfen ob eine log regression angewendet werden kann. inklusiv grafik.
ich versteh aber weder was ich tun muss, noch wie ich diese werte dann interpretieren soll damit ich aussagen kann, ja dieser datensatz ist für eine log regression geeignet oder nicht. kann mir da wer helfen? herzlichen dank

Hi,

zum einen muss das Skalenniveau passen, zum anderen sollte der fit nicht allzu schlecht sein (AIC oder BIC-Kriterium).
ftp://ftp.physik.hs-mannheim.de/nuernberg/ASV/Vortra…

Grüße,
JPL

Hallo :smile:

Um eine logistische Regression durchführen zu können, muss die Zielgröße / abhängige Variable binär sein, also darf nur zwei Merkmale annehmen können (ja / nein; schwarz/weiß etc.).
Dazu würde ich einfach ein ein Balkendiagramm der Zielvariable machen, um zu zeigen, dass wirklich nur zwei Ausprägungen vorhanden sind. Dann kann man eine log-Regression durchführen.
Wie das in SPSS genau geht kann ich nicht sagen, da ich mit einem anderen Programm arbeite. Kurze Einleitung da hier:
[http://www.urz.uni-heidelberg.de/imperia/md/content/…](http://www.urz.uni-heidelberg.de/imperia/md/content/urz/programme/statistik/spss_h ufigkeiten_ prozentwerte_balkendiagramm.pdf)
Ich hoffe das hilft weiter :smile:

Viele Grüße
Anja

Hallo JPL
Bin leider ein absoluter Neuling mit SPSS. Verstehe leider deine Antwort nicht. Muss ich als erster Schritt die log ausführen mit den Daten oder muss ich zuerst auf Normalverteilung prüfen mit einer Einfachen Linearen Funktion, ob die 2 uv mit der av zusammenhängen? die Varianz dort ist 34% ist das ok oder irrelevant? was meinst du mit BIC und AIC niveau? Wie sollten die Residuuen sein damit sie den Kriterien entsprechen und an welchem Wert siehe ich das? Drehe mich irgendwie im Kreis. Herzlichen Dank

Liebe Anja, Danke, dass hilft schon mal weiter.
Die Durchführung im SPSS ist mir klar. Nur die Interpretation der Daten nicht und die genaue Prüfung der Log Regression. DIe Linearität zwischen den 2 uv und der ab sollte nicht direkt sein jedoch zwischen dem logit(y) und den unabhängigen variabeln? was heisst das? bezieht sich das auf korrigierte R quadrat? da wäre die Varianz bei der multiplen Regression 34% wäre das ok? dann sollten die residuen noch unabhängig sein, wo sehe ich das? und wie lese ich es ab? dann sollte keine mulitkollinearität bestehen. wo im spss dies einzugeben weiss ich, aber welcher wert es ist und wie er zu interpretieren ist nicht. kannst du mir da noch einige tipps geben? das wäre super. vielen herzlichen dank.

Hallo.
Leider bin ich dafür kein Experte.
MfG achian

Hi,

okay, sollst du denn eine logistische Regression machen oder auf den logarithmierten Daten eine Regression?
Das ist nämlich ein großer Unterschied.
Grüße,
JPL

Hallo JPL vielen dank für deine hilfe. Ach her je… ich würde auf logistische regression tippen. hab die analyse auch im spss gemacht. bis montag soll ich zum einen prüfen ob dieser datensatz überhaupt die kriterien erfüllt für eine log reg. sprich kriterium Linearität, unabhängigkeit der residuen und keine mulitkollinerität. plus soll ich die ergebnisse der analyse richtig plotten. darf ich dir den datensatz schicken? ich bin mir eh unschlüssig wie sinnvoll das das wirklich ist, aber die gruppe will es so.

Hi lilalola,

datensatz überhaupt die kriterien erfüllt für eine log reg.
sprich kriterium Linearität, unabhängigkeit der residuen und
keine mulitkollinerität.

Linearität ist mir in diesem Zusammenhang schleierhaft, aber den Rest kannst in SPSS in eine extra Variable ausgeben lassen und dann gegen die predicted Werte plotten (wenn das nicht eh in der Analyse enthalten ist) und dann anschauen: Werden die Residuen größer/kleiner mit größerem vorhergesagtem Wert? wenn ja, dann sind die Residuen nicht unabhängig. Multikoll. kann man eher nur rechnerisch bestimmen (siehe Wiki-seite).

plus soll ich die ergebnisse der
analyse richtig plotten.

das ergibt dann den typischen graphen: y-Achse von 0 bis 1 (kodiert den Erfolg / nicht-erfolg) und auf der x-achse die erklärende Variable. dazwischen dann der sigmiode Verlauf der geschätzten Funktion (siehe Wiki).

darf ich dir den datensatz schicken?

Da ich kein SPSS habe würde das nicht viel bringen, fürchte ich. Ich kann dich nur theoretisch-fachlich betreuen, sozusagen.

ich bin mir eh unschlüssig wie sinnvoll das das wirklich ist,
aber die gruppe will es so.

Nehmen wir das mal als Arbeitsauftrag und egen erstmal los. Wenn man dann was in der Hand hat, kann man die Kritikpunkte besser verkaufen.

Grüße,
JPL

Zuerst gilt zu klären, welche Variable aufeinander bezogen werden: Welche Variable ist die Basis-Variable (die „Unabhängige“) und welche Variablen sind von dieser abhängig. Mit diesen Variablen ist ein Plot-Diagramm anzufertigen.

Im nächsten Schritt lässt sich mit SPSS der Zusammenhang berechnen. SPSS bietet hierzu mehrere Log-Lin Modelle an. Dabei sind auch einige Tests, wie gut das Modell die Daten erklären kann. Im Handbuch zu SPSS wird erklärt, ob dies Modelle passen und anhand welcher Parameter das entschieden werden kann.

Viel Erfolg
Günther Zier, mag.psych.

Hallo JPL vielen dank, ich schau mal im wiki nach… mir bereitet oft bereits die sprache mühe. mit linearität meinte ich: linearität zwar nicht direkt zwischen den abhängigen variable y und den uvs, aber zwischen dem logit(y) und den unabhängigen variabeln…
damit ich aber all diese kriterien also auch residiuen und mulikollinerität prüfen kann rechne ich bereits die log regression? oder zuerst eine andere berechnung? die log regression habe ich berechnet… nur steht da niergends residuen und plots habe ich ausser einen komischn genannt observed grooups and predicted auch nichts. die ausgabe könne ich dir aber mailen nicht? herzlichen dank

Hallo
ich habe 1 abhängige variable und zwei unabhänge variabeln, die sind gegeben: d.h. es sind eigentich 3 unabhängige aber ich soll 2 davon wählen. die basisvariable ist somit klar.

leider habe ich das handbuch spss nicht. ich habe die log regresssion binär mit einschluss gewählt, inkl stadnartisierten residuen, korrelation, guppenzugehörigkeit wahrscheinlichkeit hebelwerte, cook, hosmer lemeshow nur kann ich mit dem output nichts anfangen um meine fragen zu klären. bin ich auf dem richtigen weg? danke

ach ja und bei den unabhängigen variabeln habe ich die interaktion dazu genommen:
und welches plott wäre das passende?

Ja, das ist der richtige Weg. Leider kann ich auch nicht sagen, wie die Outputs zu interpretieren sind.

SPSS liefert normalerweise auch die passenden Plots dazu. Daran kann man erkennen, wie gut die berechnete Regressionsgleichung die Daten erklären kann. Welcher Plot genau dazu passt, kann ich nicht sagen, weil ich die Version nicht kenne.
Viel Erfolg

hi lilola
ich kann dir leider nicht weiterhelfen. Du findest jedoch bestimmt in deinen Unterrichtsunterlagen die entsprechenden Hinweise.

Gruss
pepo

tut mir leid. Nie davon gehört. Kann Dir leider nicht helfen.

Hallo JPL
Bin verzweilflet, hab noch nichts trotz googlen, lesen und ausprobieren. dabei möche ich nur eine graphische dartsellung die das resultat darstellt und die kriterien grafisch ebenfalls darstellt (rediduen etc.) bin nun auf die roc kurve gestossen, wäre das was? aber ich krieg auch das nicht hin. könntest du mir nicht konkret helfen? diese arbeit wird nicht benotet. herzlichen dank

HI,

ROC geht in ene ganz andere Richtung.
Also: 1) logistische Regression rechnen
2) SPSS ausgabe nach R², BIC und so weiter durchforsten
3) residuen speichern und plotten
steht alles auch hier beschrieben:
http://www.home.uni-osnabrueck.de/rniketta/method/SP…

Viele Grüße,
JPL

hallo JPL
also gar kein roc machen. ok danke.