SPSS - Signifikanz von Häufigkeiten

Hallo Leute,

ich drehe durch, weil ich nicht weiß, wie man das in SPSS macht:

Habe eine Single-Choice-Frage und die habe ich dann mittels
Häufigkeitsanalyse ausgewertet:

A = 20
B = 10
C = 30
D = 70

Wie kann ich mittels SPSS überprüfen, ob sich D signifikant von C
unterscheidet? Es ist ja eine univariate Analyse…

Hi,

als naiven schätzer für den Unterschied kannst du erstmal die Differenz der relativen Häufigkeiten betrachten. Zu dieser Diff kannst du mittwls der Wilscon-score Methode (zur Not per Hand - ist nicht sehr schwer: http://www.kardiolab.ch/KI_NNT.pdf) ein Konfidenzintervall berechnen. Liegt 0 darin => kein sig. Unterschied, liegt 0 nicht darin => sig. Unterschied.
Wenn du mehrfache Vergleiche machst, kannst du das Konfi dahingehend auf Multiplizität anpassen, dass du das Signifikanzniveau mittels simpler Bonferroni-Korrektur anpasst. Das ist dann zwar etwas konservativ, aber besser als nix.
Was davon alles in SPSS möglich ist, weiß ich nicht, aber die ganzen Rechnungen lassen sich auch per Hand machen.
Grüße,
JPL

Hi,

als naiven schätzer für den Unterschied kannst du erstmal die
Differenz der relativen Häufigkeiten betrachten. Zu dieser
Diff kannst du mittwls der Wilscon-score Methode (zur Not per
Hand - ist nicht sehr schwer:

Warum nicht ein Chi²-Test auf den beiden zu vergleichenden Klassen mit den erwarteten Häufigkeiten E1=E2 ?

Grüße,
Jochen

Hi Jochen,

zum einen muss man sich mit den Annahmen des Chi² herumschlagen, zum anderen liegt nur ein 1-dimnesionaler Fall mit 2 Klassen vor, was auf eine Binomialverteilung führt. Diese über die X²-Verteilung zu approximieren geht - aber nicht besonders gut. Ausserdem bekommt man weder einen vernünftigen Punktschätzer, geschweigedenn ein KI, wenn Chi² verwendet wird.
Mir ist das zuviel Annahme und Approximation im Gegensatz zu einer einfachen soliden Methode (Wilson-Score).
Grüße,
JPL

Huhu,

ja - sehe ich ein. Allerdings: Was spricht dann gegen die Verwendung der Binomialverteilung (ich Trottel: eigentlich meinte ich das auch, also pi=0.5 statt E1=E2)? Damit sind doch KI’s berechenbar.

Ist Fishers Exakter Test anwendbar? Wenn ja - warum ist sein p-Wert mehr als zwei Größenordnungen größer als der des Binomialtests? Ich hätte intuitiv vermutet, dass sie das gleiche liefern sollten, allerdings kann ich die Dichten der Binomialverteilung und der hypergeometrischen Verteilung nicht vergleichen (rechnerisch, meine ich; ich kann mir die Unterschiede mathematisch nicht verständlich machen).

LG
Jochen

PS: Beispiel mit den 70:30-Daten

 Exact binomial test

data: c(n1 = 30, n2 = 70) 
number of successes = 30, number of trials = 100, p-value = 7.85e-05
alternative hypothesis: true probability of success is not equal to 0.5 
95 percent confidence interval:
 0.2124064 0.3998147 
sample estimates:
probability of success 
 0.3 

 Fisher's Exact Test for Count Data

data: matrix( data=c(30,70,50,50), ncol=2 ) 
p-value = 0.005937
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.2298048 0.7960498 
sample estimates:
odds ratio 
 0.4304381 

Hi Jochen,

du willst es wieder ganz genau wissen :smile:

Beim Binom.test testest du ob 0.3 verscheiden von 0.5 ist, gegeben 1 sample. Die Frage ist aber, ob sich 0.3 und 0.7 unterscheiden, gegeben 2 samples!
Beim Fisher.test testest du, ob die odds ratio=1 ist. Um das machen zu können, muss eine 2. dummy spalte eingefügt werden, die aber masgeblich die (Rand-)Verteilung beeinflusst. Hier wird ebenfalls nicht getestest, ob 0.3 von 0.7 verschieden ist, sondern ob ob bei vorliegen von Merkmal x es wahrscheinlicher ist in Gruppe A oder B zu sein.
Damit wird auch klar, warum bei beiden nicht dasslebe herauskommt. Viele Grüße,
JPL

P.S.: Das Newcombe-paper „Interval estimation for the difference between independent proportions comparison of11 methods“ kennst du, oder?

Hallo,

du willst es wieder ganz genau wissen :smile:

Klar, immer. Allerdings deckt sich der Drang zum Wissen wollen nicht immer mit der Möglichkeit zum Verstehen können… :frowning:

Konzeptionell habe ich da noch ein Problem:

Mir ist dunkel in Erinnerung, dass der Chi²- (und somit auch Fishers Exakter Test) testen kann, ob eine Häufigkeitsverteilung aus einer gegeben Verteilung stammen kann. Bin ich da noch richtig?

Wenn ja: Was ist so verkehrt daran, die Ablehnung der Nullhypothese „die Hüfigkeiten stammen aus einer 50:50-Verteilung“ so zu interpretieren, als dass die beiden Häufigkeiten nicht gleich sind?

Und beim Binomialtest: _Wenn_ eine Gleichverteilung vorliegt, dann kommt das doch auf’s gleiche raus, oder nicht? Nein, natürlich nicht. Aber Warum? Ich hab’s nicht wirklich verstanden…

Beim Fisher.test testest du, ob die odds ratio=1 ist. Um das
machen zu können, muss eine 2. dummy spalte eingefügt werden,
die aber masgeblich die (Rand-)Verteilung beeinflusst.

Die Null 50:50 ist ja durch den Stichprobenumfang und die Gleichverteilung vorgegeben. Es ist ja keine „willkürliche“ Beeinflussung.

Damit wird auch klar, warum bei beiden nicht dasslebe
herauskommt.

Hmm, klar ist was anderes, aber das liegt wahrscheinlich eher an mir als an Deinen Erklärungen.

Viele Grüße,
Jochen

P.S.: Das Newcombe-paper „Interval estimation for the
difference between independent proportions comparison of11
methods“ kennst du, oder?

Nö. Wenn Du’s PDF gerade greifbar hast, könntest Du’s mir senden? Danke!

Hi Jochen,

mit einem Chi² test kann man auch eine Verteilung testen. Mit nur zwei Stützstellen ist das aber recht dünn. Man könnte höchstens (das hatten wir ja früher schon mal) alle Gruppen einschließen und dann eine Art Globaltest machen; wenn es dann abweichungen gibt, weiß man eben nur nicht wo :\
Fisher geht ganz explizit von einer 2x2 Tabelle aus. 4 Werte hat man aber nciht vorliegen, sondern nur zwei. Jedes „hinzudichten“ von weiteren Werten würde ich mit Vorsicht geniessen, weil sie nicht gemessen wurden. ausserdem stellt sich die Frage, was die Splatenvariable bei matrix( data=c(30,70,50,50), ncol=2 ) eigentlich sein soll. Die Zeilensummen ergeben 80 bzw. 120 und die Gesamtzahl wächst auf 200. Aber was bedeuten diese Zahlen? Dementsprechend wird es schwer, diesen Test in der vorliegenden Situation zu interpretieren.
Für den Binomialtest musst du nicht ein Experiment mit 30/100 Erfolg gegen p=0.5 testen, sondern 30/100 versus 70/100 gegeben zwei Binomilaverteilungen. Ist eben eine andere Fragestellung.
Hoffe, das hilft dir weiter.
Grüße,
JPL

1 „Gefällt mir“

Hallo,

Hoffe, das hilft dir weiter.

Das tut es in der Tat. Danke nochmal!

Grüße,
Jochen