Chi Quadrat, Mc Nemar und telweise abhängige Daten

Hi Michael,

Ah, das ist dann ja mal völlig unkompliziert :smile:

Eben deswegen kommt bei den meisten Nichtstatistikern Mist raus wenn sie Statistik machen, ohne nachzufragen.

ok, ich war dumm. Auf die Idee, das ganze rein per Syntax zu machen, :bin ich gar nicht gekommen. Das kommt dabei heraus, wenn man :so ein Menü-verwöhnter Weichspül-User geworden ist…

Das lässt sich ja noch ändern :smile:

Du hast mir schon in ganz extremer Weise geholfen, jetzt muss ich :das erstmal aufarbeiten :wink:

Würde mich auch interessieren, wie du das am Ende dann analysierst.

Super, danke! Ich glaube, ich habe noch in keinem anderen Forum :Leute getroffen, die so viel Ahnung von einem mathematischen :Spezialthema haben und zugleich in so hohem Maß :bereit sind, zu helfen. Das ist echt beeindruckend.

Danke für die Blumen. Das geht aber auch auf dein Konto, weil du bereitwillig auf all unsere Fragen eingegangen bist.

Grüße,
JPL

Hallo!

Vielleicht noch einmal zurück zu meinem Anfangsposting, da
mich ein Teil von Patricks zweiter Antwort verwirrt hat:
Bedeutet das, dass man bei der von mir geschilderten
Kreuztabelle Gruppe*Kategorie den Chi-Quadrat-Test (alleinig
zum Vergleich zwischen den Gruppen, nicht zum Vergleich
zwischen den Kategorien oder zum Prüfen einer Interaktion)
verwenden darf, da ich trotz der Abhängigkeiten innerhalb
einer der beiden Variablen unabhängige Messungen zwischen den
beiden Variablen habe?

Darfst Du auf Einzel-Fragen-Ebene (binäre Daten Pro VP), aber nicht über den globalen Fragenvergleich (Punkte zwischen 0 und 3 pro VP).

Da wäre dann z.B. der U-Test oder T-Test (besser: Welch-Test) möglich (unter SPSS jedoch eine Soße).

Lieben Gruß
Patrick

Darfst Du auf Einzel-Fragen-Ebene (binäre Daten Pro VP), aber
nicht über den globalen Fragenvergleich (Punkte zwischen 0 und
3 pro VP).

ah, ok, danke! Wäre dieses Vorgehen auch bei Häufigkeiten anstatt Binärdaten ok (auf Einzel-Fragen-Ebene), da Chi-Quadrat überall für den Häufigkeitsvergleich angepriesen wird?

Viele Grüße,

  • Michael

Toll, vielen Dank!
Mit den Syntax-Kenntnissen hapert es bei mir zwar etwas, aber ich werde mir die Software auf alle Fälle anschauen.
Viele Grüße,

  • Michael

Darfst Du auf Einzel-Fragen-Ebene (binäre Daten Pro VP), aber
nicht über den globalen Fragenvergleich (Punkte zwischen 0 und
3 pro VP).

ah, ok, danke! Wäre dieses Vorgehen auch bei Häufigkeiten
anstatt Binärdaten ok (auf Einzel-Fragen-Ebene), da
Chi-Quadrat überall für den Häufigkeitsvergleich angepriesen
wird?

Hallo Michael,

na klar kannst Du den Chi-Quadrat-Test für Personenhäufigkeiten pro Gruppe und Item benutzen (in Deinem Fall). Mit der Angabe binär als Vorraussetzung für Chi-Quadrat wollte ich nur sagen, dass Du Probleme bekommst wenn die EInzelperson nicht dichotom bzw. binär ausgeprägt ist sondern z.B. die Scores 0-3 hat, denn dann kannst Du nicht ohne weiteres den Chi-Quadrat-Test anwenden (da Du ja keine Häufigkeiten bilden kannst). Chi-Quadrat wird natürlich über Häufigkeiten berechnet.

Besser ist in Deinem Fall aber wie erwähnt der für dieselbe Gelegenheit konzipierte Test von Fisher (funktioniert sowohl bei abhängigen als auch bei unabhängigen Fragestellungen), da der auch robust gegen die Verletzung des Chi-Quadrat-Tests bei mehr als 20% an Zellhäufigkeiten kleiner als 5 ist. Bei Dir muss ja nur eine Zelle entsprechend besetzt sein, dann ist der Chi-Quadrat-Test nichts mehr.

Lieben Gruß
Patrick

Hallo Patrick!

Ah, danke jetzt habe ich es kapiert.

Du schreibst, dass man den Test von Fisher sowohl bei abhängigen als auch bei unabhängigen Fragestellungen nutzen kann. In Test-Übersichten aus dem Internet (z.B. http://www.complexity-research.com/pdf/Seminare/Test…) taucht er jedoch ausschließlich bei „unabhängig“ auf. Habe ich Dich diesbzgl. falsch verstanden?

Viele Grüße,

  • Michael

Hallo Michael,

In Test-Übersichten aus dem Internet (z.B.
http://www.complexity-research.com/pdf/Seminare/Test…)
taucht er jedoch ausschließlich bei „unabhängig“ auf. Habe ich
Dich diesbzgl. falsch verstanden?

Oha - bei so etwas kann man schon mal vorsichtig sein… :wink:

Allerdings taucht der Test hier auch zweimal auf: 4.1.1 und 4.2.3.
Ich glaube, 4.1 bezieht sich auf Abhängige und 4.2 auf Unabhängige Stichproben. Etwas verwirrend der Text.

Jedoch ist z.B. auch Chi-Quadrat für Abhängige Stichproben geeignet - er fragt ja lediglich, ob sich die Tabelle von einer totalen Gleichverteilung über die Zellen unterscheidet - er weiß nichts davon, ob die Kreuztabelle abhängigkeit oder unabhängigkeit beinhaltet.

Der p-Wert für abhängige und unabhängige Stichproben im Chi-Quadrat-Test und im exakten Test von Fisher berechnen sich identisch.

Was Du nicht verwechseln darfst: beide Tests Testen auf Unabhängigkeit der Kontingenztabelle, wobei eine rechnerische Abhängigkeit zwischen den beiden Merkmalen gemeint ist. Auch zwei unabhängige Merkmale können innerhalb ihrer Merkmalsausprägungen Abhängigkeiten zueinander aufweisen (korrelieren).

Du kannst eine Kreuztabelle über die Gruppenvariable und ein Item erstellen (wenn Du meiner Matrixanordnung gefolgt bist) und Chi-Quadrat berechnen lassen (unabhängige Testung) sowie über eine Kreuztabelle zweier Items miteinander (abhängige Testung). Beim letzteren berechnet sich ja auch McNemar sinnvoll. Auch hier geht Chi-Quadrat.

Grober Schnitzer in der von Dir verlinkten Übersicht ist m.E. nach aber vor allem (das nur am Rande), dass U-Test und andere nichtparametrische Verfahren sich bei Tests zu Maßen der zentralen Tendenz eingeordnet finden. Das stimmt so nicht.

Lieben Gruß
Patrick

Hallo Patrick!
Jetzt werde ich tatsächlich neugierig: Auch der fette Bortz (Statistik für Sozialwissenschaftler) sagt bei Chi-Quadrat: „Die einzelnen Beobachtungen müssen voneinander unabhängig sein (Ausnahme: McNemar-Test und Cochran-Test)“. Damit ist wohl substantielle (damit meine ich nicht-rechnerische) Abhängigkeit gemeint, nehme ich an.

Du kannst eine Kreuztabelle über die Gruppenvariable und ein
Item erstellen (wenn Du meiner Matrixanordnung gefolgt bist)
und Chi-Quadrat berechnen lassen (unabhängige Testung) sowie
über eine Kreuztabelle zweier Items miteinander (abhängige
Testung). Beim letzteren berechnet sich ja auch McNemar
sinnvoll. Auch hier geht Chi-Quadrat.

Ah, danke noch einmal für diese genaue Erklärung! Nur zum Verständnis: Mit „Item“ meinst Du hier meine (insgesamt 9) Kategorien, nicht die (insgesamt drei) Fragen, oder? Das hieße dann, dass ich pro offener Frage für jede Kategorie einen Chi-Quadrat-Test machen kann, um einen Unterschied zwischen den Gruppen zu prüfen. Also 3 Fragen x 9 Kategorien = 27 Chi-Quadrat-Tests mit Gruppe*einzelne Kategorie als Kontingenztabelle, deren p-Werte dann Bonferroni-Holm-adjustiert werden sollten (wenn ich JPL korrekt verstanden habe), wobei sich die Kreuztabelle auf binäres Datenmaterial stützt und Häufigkeiten angibt, wie häufig die jeweilige Kategoriennennung vorlag oder nicht vorlag. Probleme habe ich jedoch noch immer mit den Binärdaten: Zwar kann ich angeben, wenn bei einer Person einen Kategoriennennung nicht vorlag, jedoch: falls eine Nennung vorlag, muss ich angeben, ob sie nur einmal oder mehrfach bei dieser Person vorlag (Mehrfachnennung der gleichen Kategorie), womit ich keine Binärdaten mehr habe, sondern Häufigkeiten schon auf Einzelpersonenebene… Ich könnte natürlich festlegen, dass ich Mehrfachnennungen der gleichen Kategorie auf Einzelpersonenebene ignoriere und aus der Datenanalyse ausklammere…

Grober Schnitzer in der von Dir verlinkten Übersicht ist m.E.
nach aber vor allem (das nur am Rande), dass U-Test und andere
nichtparametrische Verfahren sich bei Tests zu Maßen der
zentralen Tendenz eingeordnet finden. Das stimmt so nicht.

Hm, gut zu wissen, dass man auf das pdf nicht so viel geben sollte :smile:

Lieben Gruß,
Michael