ANOVA mit binärer AV?

Hallo!

Ich habe eine Frage für einen Sonderfall wissenschaftlicher Auswertung:

In einem Messwiederholungsdesign mit 4 UV (je 2fach abgestuft) ist über somit 16 resultierende Versuchsbedingungen je Versuchsperson eine binär codierte ZV erhoben worden. Die Stichprobengröße beträgt 32.

Wie wertet man das vernünftig aus?

Für eine messwiederholte ANOVA doch sicherlich ein Grenzfall?

Ich habe es mit der Konfigurationsfrequenzanalyse versucht (per Hand) - jedoch ist diese Auswertung ja unabhängig (eine 2x2x2x2 Kontingenztafel mit der Anzahl aller VP mit einer „1“ pro Bedingung).

Als abhängige Auswertung schwebte mir McNemar bzw. ein Binomialtest über 2x2 Tafeln vor - wobei hier jedoch auf eine globale Analyse verzichtet werden muss.

Hat jemand (1) eine andere Idee oder (2) kennt jemand eine Quelle die besagt, dass die ANOVA für binäre AV’s doch geeignet ist?

Lieben Gruß
Patrick

Hi Patrik,

In einem Messwiederholungsdesign mit 4 UV (je 2fach abgestuft) ist
über somit 16 resultierende Versuchsbedingungen je Versuchsperson
eine binär codierte ZV erhoben worden. Die Stichprobengröße beträgt
32.

D.h. du hast 2 VP pro Kombination der UV’s? Gute nacht …
Oder hast du leere Zellen (also unbesetzte Kombinationen)?
Und wie sieht die Messwertwiederholung genau aus? Ansteiegnde Dosis, oder wirklich nur eine wiederholte Messung oder ein ganza anderes treatment?

Wie wertet man das vernünftig aus?

Gute Frage :smile:
Wenn du keine Wiederhiolung hättest, könnte man eine GLM mit linkfunktion logit. Zieh dir das mal zum anfang rein:
http://en.wikipedia.org/wiki/Generalized_linear_model

Für eine messwiederholte ANOVA doch sicherlich ein Grenzfall?

Hm, von einer messwertwiedergholten GLM hab ich noch nichts gehört, aber sdas muss ja nichts heissen :smile:

Als abhängige Auswertung schwebte mir McNemar bzw. ein Binomialtest
über 2x2 Tafeln vor - wobei hier jedoch auf eine globale Analyse
verzichtet werden muss.

Wenn dich die globale Hypothese eh nicht interessiert muss du sie auch nicht konfirmatorisch testen, sondern kannst dich gleich auf deine Hypotheses of interest stürzen. McNem gibts auch für wiederholungen von Tabellen, ist aber sehr aus der Mode gekommen, seit man die generalized linear models bei der Hand hat.

Hat jemand (1) eine andere Idee oder (2) kennt jemand eine Quelle
die besagt, dass die ANOVA für binäre AV’s doch geeignet ist?

ad (2): Es gibt haufenweise Literatur zu GLM mit binären Daten. Bezüglich power und messwiederholung musst du aber noch ein wenig such, bestimmt findet sich da was.
Zur Not musst du es eben aussimulieren.

Grüße,
JPL

Du kannst GEE (general estimation equations) verwenden, um multinomiale repeated mesurements mit missings zu modellieren.
http://orm.sagepub.com/cgi/content/refs/7/2/127
Grüße,
JPL

1 Like

Hallo!

In einem Messwiederholungsdesign mit 4 UV (je 2fach abgestuft) ist
über somit 16 resultierende Versuchsbedingungen je Versuchsperson
eine binär codierte ZV erhoben worden. Die Stichprobengröße beträgt
32.

D.h. du hast 2 VP pro Kombination der UV’s? Gute nacht …
Oder hast du leere Zellen (also unbesetzte Kombinationen)?
Und wie sieht die Messwertwiederholung genau aus? Ansteiegnde
Dosis, oder wirklich nur eine wiederholte Messung oder ein
ganza anderes treatment?

Nein ganz so schlimm ist es nicht…
32 Personen haben in 16 unterschiedlich modellierten Bedingungen ein Item gelernt, welches sie hinterher reproduzieren sollten. Gezählt wurde pro Bedingung, ob es richtig oder falsch reproduziert werden konnte.

Die 16 Versuchsbedingungen kamen durch die 4 unabhängigen Variablen, welche jeweils mit 2 Abstufungen den Versuchskontext bzw. das Item verändert haben.

Deine Antwort hilft erst einmal sehr gut weiter, die GEE kannte ich noch nicht - das kommt davon, wenn man SPSS-fixiert ist… Aber ein sehr interessanter Artikel.

Ich dachte auch schon an ein loglineares generelles Modell (ist ja auch unter SPSS verfügbar), allerdings modelliert der das in dem Fall nicht vernünftig (Die erwarteten Werte schätzt er genau den beobachteten Werten).

Aber vielen Dank erst einmal!

Lieben Gruß
Patrick

Hi,

Nein ganz so schlimm ist es nicht…
32 Personen haben in 16 unterschiedlich modellierten Bedingungen ein
Item gelernt, welches sie hinterher reproduzieren sollten. Gezählt
wurde pro Bedingung, ob es richtig oder falsch reproduziert werden
konnte.

Dann evrstehe ich das richtig, dass jeder jede der 16 Versuchsbedingungen durchlaufen hat? Dann hast ein cross-over design; ud ich hoffe, dass die Bedingungen randomisiert waren.

Deine Antwort hilft erst einmal sehr gut weiter, die GEE kannte ich
noch nicht - das kommt davon, wenn man SPSS-fixiert ist… Aber ein
sehr interessanter Artikel.

Das ist auch kein leichter Stoff, denn GEE ist wiederum eine Veralgemeinerung der GLM, die eine Verallgemeinerung der ANOVA sind. Wenn du aber ein X-over hast, müsstest du nicht zwingend mit GEE’s arbeitten (die haben den Vor-/Nachteil, dass man sich noch mehr Gedanken um die Kovarianzstruktur machen kann/muss).

Ich dachte auch schon an ein loglineares generelles Modell (ist ja
auch unter SPSS verfügbar), allerdings modelliert der das in dem
Fall nicht vernünftig (Die erwarteten Werte schätzt er genau den
beobachteten Werten).

Ein loglineares Modell ist auch kein logistisches. Konkret: Im loglinearen Fall geht man von einem multiplikativen Modell aus, wendet eine log-Transformation an und landet beim linearen additiven Modell. Grundannahme ist also eine Log-Normalverteilung. Im logistischen Modell ist die Transformation (=link-Funktion) die logit.
Im logistischen Modell werden W’keiten zu den binären Daten modelliert, aber nicht die Daten selbst, wie es beim lognormal der Fall ist. Da bim lofnormal nur zwei Ausprägungen vorliegen, schätzt er die regressionsgerade dann natürlich genau da durch, da 2 Punkte eine Gerade bestimmen.

Grüße,
JPL