Hallo,
ich habe zwei Merkmale (A & B), von denen Merkmal B nur dann beobachtet werden kann, wenn Merkmal A vorhanden ist. Bei einer Vierfeldertabelle wäre also das Feld ‚!AB‘ immer=0. Das Feld ‚!A!B‘ kann theoretisch jeden beliebigen Wert annehmen - ist also nicht wirklich zu gebrauchen. Einzig die Felder ‚A!B‘ und ‚AB‘ sind mit sinnvollen Werten gefüllt.
Jetzt möchte ich die bedingten Wahrscheinlichkeit p(B|A=wahr) anzeigen. Mein Problem: A kann manchmal sehr klein sein (z.B. A=‚3‘); in anderen Fällen ist A sehr groß (A=‚500‘). Das heißt, die bedingte Wahscheinlichkeit p(B|A=Wahr) ist nur begrenzt zuverlässig/sicher - ich möchte jedoch gerne eine Aussage treffen, wie sicher man sein kann, dass die bedingte Wahrscheinlichkeit statistisch valide ist.
Ich wollte ursprünglich auf statistische Signifikanz mit Chi^2 testen - das erscheint mir hier bei abhängigen Merkmalen aber nicht wirklich sinnvoll, oder? Was macht man da sinnvollerweise? Einen festen Grenzwert für A wählen (sowas wie A>=10) oder gibt es da bessere Wege um die Häufigkeit von A mit einzubeziehen?
Vielen Dank und schöne Grüße!