Bedingte Wahrscheinlichkeiten - einfache Erklärung

Hallo Wissende,

ich habe bei Christoph Bördlein (Das sockenfressende Monster in der Waschmaschine) folgende Aussage gefunden:

Angenommen, es gibt einen Test, der eine bestimmte Krankheit mit einer Sicherheit von 79% nachweisen kann. Diese Krankheit kommt in der Bevölkerungsgruppe, der man angehört, zu 1% vor. Wenn man ein positives Testergebnis hat, wie hoch ist dann die Wahrscheinlichkeit, dass man diese Krankheit hat? Diese Wahrscheinlichkeit beträgt nicht 79%, sondern nur 7%.

Das hat wohl etwas mit bedingten Wahrscheinlichkeiten zu tun. Ich habe mir den Wikipedia-Artikel zu dem Thema durchgelesen, aber nicht verstanden. Kann mir bitte jemand erklären, wie das mit den bedingten Wahrscheinlichkeiten funktioniert?

Schöne Grüße

Petra

Hallo Hallo Petra,

vorweg eine Warnung: das könnte jetzt etwas länglich werden. Da ich deinem Artikel entnehme, dass du dich nur in deiner Freizeit mit Mathe beschäftigst, versuche ich alles so genau wie möglich zu erklären. Übrigens: Respekt, Mathe als Hobby ist viel zu selten nach meinem Geschmack und sonst eigentlich fast nur unter denen verbreitet, deren Beruf auch damit zu tun hat.

Zuerst mal die Frage, ob du vielleicht eine Information vergessen hast, nämlich die, welche Sicherheit der Test hat, wenn jemand die Krankheit nicht hat. Die Sicherheit weicht nämlich in der Realität oft von den 79% bei Vorhandensein der Krankheit ab (man nennt das Sensitivität und Spezifität, siehe http://de.wikipedia.org/wiki/Aidstest#Genauigkeit_de…)
Die Sensitivität ist dabei in der Regel höher, da ein falsch-positives Ergebnis besser, oder sagen wir lieber weniger katastrophal, ist als ein falsch-negatives, vor allem wegen Ansteckung anderer.
Wenn ich für die Spezifität in deinem Beispiel ebenfalls 79% nehme, komme ich nämlich auf knapp 4%, nicht auf 7. (Liebe WWWler, korrigiert mich wenn ich falsch liege)

Dann zu bedingten Wahrscheinlichkeiten:

P(A|B)

bezeichnet die Wahrscheinlichkeit, dass das Ereignis
A
eintritt unter der Bedingung, dass das Ereignis
B
bereits eingetreten ist. Das heißt, die Entscheidung, dass
B
eintritt, ist schon gefallen,
B
ist schon „passiert“, daran ist nichts zu ändern. Nun interessiert uns, wie wahrscheinlich
A
ist, wenn wir von
B
schon wissen, dass es eingetreten ist.

Wenn du zum Beispiel mit zwei Würfeln nacheinander würfelst, kannst du, sobald der erste Würfel gefallen ist, bessere Aussagen über die Wahrscheinlichkeit, dass die Summe beider Würfel einen bestimmten Wert annehmen wird, machen, als vorher.

Hast du zum Beispiel eine sechs geworfen, so beträgt die Wahrscheinlichkeit

P(Summe=2|Erster Wurf=6)=0,
denn offensichtlich kannst du in der Summer nicht mehr auf nur 2 kommen, wenn 6 schon da liegen.

Mathematisch gesehen gibt es für bedingte W’keiten die Formel:

P(A|B)=\frac{P(A\cap B)}{P(B)}

Dabei bezeichnet
P(A\cap B)
die Wahrscheinlichkeit dafür, dass
A
und
B
beide eintreten und
P(B)
die Wahrscheinlichkeit, dass
B
eintritt.

P(B)
wird, bildlich gesprochen „rausdividiert“, weil
B
ja schon passiert ist und jetzt nur noch
A
„passieren muss“.

Damit erhalten wir in unserem Beispiel

P(Summe=2|Erster Wurf=6)=\frac{P(Summe=2\cap Erster Wurf=6)}{P(Erster Wurf=6)}=\frac{0}{\frac16}=0

Der Zähler wird 0, weil nie gleichzeitig die Summe 2 und der erste Wurf 6 sein kann. Das bestätigt also unser intuitives Ergebnis.

Betrachten wir nun

P(Summe=12|Erster Wurf=6)\=\frac{P(Summe=12\cap Erster Wurf=6)}{P(Erster Wurf=6)}

=\frac{P(Erster Wurf=6\cap Zweiter Wurf=6)}{P(Erster Wurf=6)}

=\frac{P(Erster Wurf=6)\cdot P(Zweiter Wurf=6)}{P(Erster Wurf=6)}=P(Zweiter Wurf=6)=\frac{1}{6}

Die W’keit für Erster Wurf=6 UND Summe=12 entspricht natürlich der W’keit Erster Wurf=6 UND Zweiter Wurf=6, weil nur mit einer 6 in beiden Würfen die Bedingungen „6 im ersten Wurf“ UND „Erster Wurf+Zweiter Wurf=12“ erfüllt werden können.

Diese W’keit kann man durch multiplizieren der Einzelereignisse berechnen, da Erster Wurf=6 und Zweiter Wurf=6 sogenannte unabhängige Ergeinisse sind, das heißt das eine „wirkt sich nicht auf das andere aus“, das Auftreten des einen verändert die W’keit für das andere nicht („Würfel zwei interessiert es nicht, was bei Würfel eins gefallen ist“).

Für unabhängige Ereignisse
A
und
B
gilt

P(A\cap B)=P(A)\cdot P(B)

(Genaueres hier: http://de.wikipedia.org/wiki/Stochastische_Unabh%C3%…)

Insgesamt kommen wir also zu dem Ergebnis, dass die W’keit dafür, als Summe 12 zu erhalten, wenn wir schon wissen, dass wir eine 6 gewürfelt haben, der W’keit entspricht, im zweiten Wurf auch eine 6 zu würfeln. Auch das folgt, wie ich finde, er Intuition.

Für weitere Beispiele siehe hier: http://de.wikipedia.org/wiki/Wahrscheinlichkeitstheo… , meiner Meinung nach wesentlich besser, genauer gesagt ausführlicher, als der Artikel über Bedingte W’keit.

Nun zu deinem Beispiel: Was du suchst, IST eine bedingte Wahrscheinlichkeit, nämlich die W’keit, die Krankheit zu haben unter der Bedingung, positiv getestet worden zu sein.
Also:

P(krank|positiver Test)

Nach unserer Formel wissen wir:

P(krank|positiver Test)=\frac{P(krank\cap positiver Test)}{P(positiver Test)}

Schauen wir uns das mal Stück für Stück an:

P(krank\cap positiver Test)
bedeutet, die Person ist krank UND wird positiv getestet.

P(krank)
kennen wir, die beträgt 1%, also 0,01,
P(positiver Test|krank), also die W’keit, positiv getestet zu werden unter der Bedingung, krank zu sein, ebenfalls, das sind die 79% Testgenauigkeit, also 0,79.

Wenden wir nun unsere Formel für bedingte W’keit „rückwärts“ an, finden wir:

P(krank|positiver Test)=\frac{P(krank\cap positiver Test)}{P(krank)}

Setzen wir unsere bekannten Wert ein, folgt:

0,79=\frac{P(krank\cap positiver Test}{0,01}

Umgestellt finden wir

P(krank\cap positiver Test)=0,79\cdot 0,01=0,0079
,
also eine sehr kleine W’keit.

Nun haben wir schon den Zähler gefunden, fehlt noch der Nenner, der etwas komplizierter wird. Wir brauchen hier schon wieder eine Formel, die ich dir hier allerdings ersparen möchte (bei Interesse: http://de.wikipedia.org/wiki/Totale_Wahrscheinlichke…)

Ich beschränke mich lieber darauf, das hier an dem konkreten Beispiel zu erklären:
Die Wahrscheinlichkeit, dass irgendjemand (von dem wir ja nicht wissen, ob er krank ist, oder nicht), setzt sich aus zweit Summanden zusammen. Es kommt nämlich zu einem positiven Test:
a) wenn die Person krank ist und der Test richtig testet und
b) wenn die Person gesund ist und der Test falsch testet.

Die W’keit im Fall a) haben wir gerade berechnet, das war

P(krank\cap positiver Test)=0,0079

Im Fall b) verfahren wir ähnlich, wir wissen:

P(positiver Test|gesund)=1-0,79=0,21

(der Test testet Gesunde zu 79% richtig, also negativ und damit zu 21% falsch, also positiv.)
sowie

P(gesund)=1-0,01=0,99

Wie oben finden wir also:

P(gesund\cap positiver Test)=0,21\cdot 0,99=0,2079

Nehmen wir die Fälle a) und b) zusammen, das heißt, addieren wir die W’keiten, folgt:

P(positiver Test)=P(krank\cap positiver Test)+P(gesund\cap positiver Test)

und damit:

P(positiver Test)=0,0079+0,2079=0,2158

Setzen wir alles in unsere Formel von oben ein, so finden wir unser Ergebnis:

P(krank|positiver Test)=\frac{P(krank\cap positiver Test)}{P(positiver Test)}=\frac{0,0079}{0,2158}=0,036608

Also beträgt die W’keit, wirklich krank zu sein, wenn ein positives Testergebnis bereits bekannt ist, genau 3,6608%: Mit anderen Worten, den Test kann man wegschmeißen. Wie du aber im Wiki-Artikel über den HIV-Test lesen kannst, betragen hier die W’keiten nicht etwa 79, sondern 99,9 bzw. 99,8%. Wenn du Lust hast, kannst du ja mal hier die W’keit
P(krank|positiver Test) ausrechnen, wenn wir wissen, das ca. 65.000 Deutsche mit HIV infiziert sind :wink:

Also, insgesamt muss ich sagen, du hast dir ein recht anspruchsvolles Thema ausgesucht, mach dir also keine Sorgen, wenn du nicht alle Rechnungen sofort verstehst. Solltest du noch Fragen haben, zögere nicht, ich (und andere WWWler) helfen dir gerne noch weiter!

Liebe Grüße und schönen Sonntag,
Nadine

Hallo

Ein beispiel was ich sehr gut finde wäre folgendes:

Du hast einen normalen fairen sechsseitigen würfel und fragst nach der wahrscheinlichkeit, dass eine sechs gewürfelt wird. Klar, das ist 1/6.

Jetzt bekommst du aber nach dem würfeln die information, dass eine gerade zahl gewurfen wurde. Du selbst siehst aber den würfel nicht. Wie wahrscheinlich ist jetzt die 6?? Da nur die Möglichkeiten 2, 4 und 6 übrig bleiben ist sie auf 1/3 gestiegen. Würdest du jedoch erfahren, dass eine ungerade zahl gewurfen wurde ist dir auch klar, dass eine sechs zu 0 % aufgetreten sein kann, da sie ja gerade ist.

nehmen wir mal
A… Es wurde eine gerade zahl geworfen
B… Es wurde eine sechs geworfen
als Ereignisse.

P(A) = 1/2 und P(B)=1/6 sollten klar sein.

Wie oben geschildert ist nun die wahrscheinlichkeit von B unter der bedingung, dass A eingetreten ist sogar 1/3. unter der Bedingung, dass A nicht eingetreten ist aber 0.

Anders könnte man jetzt auch fragen, mit welcher wahrscheinlichkeit tritt A ein, wenn ich weis, dass B (nicht) eingetreten ist. Das komm dem Beispiel mit dem Test und der Krankheit am nächsten.

Ist B eingetroffen, so liegt die Wahrscheinlichkeit für A bei 1. Ist B nicht eingetroffen so bleiben als Würfelergebnisse 1,2,3,4,5 übrig, von denen 2 gerade sind. Die wahrscheinlichkeit liegt also bei 2/5.

Ich habe absichtlich versucht es mit wenig formeln zu erklären und es eher sprachlich herüber zu bringen. Ich hoffe es ist mit teilweise gelungen.
MfG IGnow

Hallo Nadine,

vielen Dank für deine ausführliche Antwort. Alles habe ich zwar nicht verstanden, aber so ungefähr ist mir jetzt klar, wie der Autor auf die relativ geringe Prozentzahl gekommen ist.

Übrigens: Respekt, Mathe als Hobby
ist viel zu selten nach meinem Geschmack und sonst eigentlich
fast nur unter denen verbreitet, deren Beruf auch damit zu tun
hat.

Danke :smile:
Ich habe aber nur in einem Buch dieses Beispiel gelesen, nämlich in „Das sockenfressende Monster in der Waschmaschine“.

Für weitere Beispiele siehe hier:
http://de.wikipedia.org/wiki/Wahrscheinlichkeitstheo…
, meiner Meinung nach wesentlich besser, genauer gesagt
ausführlicher, als der Artikel über Bedingte W’keit.

Ok, schau ich mir gleich mal an.

Also beträgt die W’keit, wirklich krank zu sein, wenn ein
positives Testergebnis bereits bekannt ist, genau 3,6608%: Mit
anderen Worten, den Test kann man wegschmeißen. Wie du aber im
Wiki-Artikel über den HIV-Test lesen kannst, betragen hier die
W’keiten nicht etwa 79, sondern 99,9 bzw. 99,8%.

Ok, das Buch ist schon etwas älter. Vielleicht war damals der Test noch nicht so genau. Der Autor schreibt zwar nicht explizit, dass er HIV meint, aber ich hatte so den Eindruck, weil er auch was von Risikogruppen und Drogensüchtigen schreibt.

Solltest du
noch Fragen haben, zögere nicht, ich (und andere WWWler)
helfen dir gerne noch weiter!

Danke, erst einmal bin ich soweit zufrieden.

Schöne Grüße

Petra

Hallo,

Ich habe absichtlich versucht es mit wenig formeln zu erklären
und es eher sprachlich herüber zu bringen. Ich hoffe es ist
mit teilweise gelungen.

Danke für die Erklärung, vor allem für die wenigen Formeln. Ist doch schon eine Weile her, dass ich Mathe in der Schule hatte.

Schöne Grüße

Petra

Hossa Petra :smile:

Meine beiden Vorschreiber haben ja bereits alles sehr richtig erklärt. Ich möchte nur auch noch kurz meinen „Senf“ dazu geben, wie ich mir die bedingte Wahrscheinlichkeit verständlich gemacht habe.

Ein Zufallsexperiment hat eine Menge E von möglichen Ausgängen. Das einmalige Würfeln zweier Würfel hat z.B. 36 mögliche Ausgänge. Diese sind alle in der Menge E enthalten:

 | 1 2 3 4 5 6
--------------------
1| 2 3 4 5 6 7
2| 3 4 5 6 7 8
3| 4 5 6 7 8 9
4| 5 6 7 8 9 10
5| 6 7 8 9 10 11
6| 7 8 9 10 11 12

Zum Beispiel ist die Wahrscheinlichkeit eine Augensumme zu werfen, die mindestens 10 beträgt, hier 6/36. Es gibt 6 günstige Fälle und 36 mögliche Fälle.

Bei der bedingten Wahrscheinlichkeit hast du nun Kenntnis über einen bestimmte Umstand, der diese Menge E der möglichen Ereignisse einschränkt. Wenn wir z.B. wissen, dass der erste Würfel eine Zahl größer als 4 zeigt, schrumpft der Ereignisraum E zusammen. Streng genommen muss er also einen neuen Namen kriegen, etwa E’, um ihn von E zu unterscheiden.

 | 1 2 3 4 5 6
--------------------
5| 6 7 8 9 10 11
6| 7 8 9 10 11 12

Die Wahrscheinlichkeit nun eine Augensumme zu werfen, die mindestens 10 beträgt, ist 5/12. Es gibt 5 günstige Fälle und 12 mögliche Fälle.

Bei der bedingten Wahrscheinlichkeit wird also die Menge E der möglichen Ausgänge eines Zufallsexperiment eingeschränkt auf die Menge E’. Die Einschränkung erfolgt dadurch, dass du zusätzliche Informationen über den Ausgang des Zufallsexperimentes hast.

Das zeigt auch die Formel für die bedingte Wahrscheinlichkeit sehr schön:

P_B(A)=\frac{P(A\cap B)}{P(B)}

Dies ist die bedingte Wahrscheinlichkeit von A bezüglich B. Die Menge B ist die eingeschränkte Ereignismenge E’. Und von der Menge A dürfen nur noch die Elemente berücksichtigt werden, die in B enthalten sind. Daher die Schnittmenge im Zähler.

Viele Grüße

Hasenfuß

Hallo Petra !

Hier ein ähnliches Beispiel mit ausführlicher Erklärung:

0,01 % der heterosexuellen Männer, die keiner Risikogruppe angehören, sind statistisch gesehen HIV infiziert.
Bei heutigen HIV Testverfahren werden Infizierte und Gesunde mit einer Wahrscheinlichkeit von 99,99 % richtig erkannt.
Herr X gehört keiner Risikogruppe an und unterzieht sich einem Aids-Test.
Er erhält die Nachricht, das Testergebnis sei" positiv", das heißt, er sei infiziert.
Mit welcher Wahrscheinlichkeit handelt es sich um einen Fehlalarm?

Lösung:
Mit 50% Wahrscheinlichkeit war es ein Fehlalarm.

Begründung:
Werden die eine Million Menschen dem HIV-Test unterzogen, so ergibt sich folgendes Resultat:

 Person ist... und wurde vom Test Anzahl
 erkannt als... 
 --------------------------------------------------------------
 a) gesund gesund (Test korrekt) 999800.01
 b) gesund infiziert (Test schlug fehl) 99.99
 c) infiziert gesund (Test schlug fehl) 0.01 
 d) infiziert infiziert (Test korrekt) 99.99
 ---------- 
 Summe = 1000000.00

Die „99.99“ im Fall b) kommen dadurch zustande, daß die geringe Test-Irrtumswahrscheinlichkeit (0.01 %) mit der großen Zahl der gesunden Menschen (999900) multipliziert wird. Die „99.99“ im Fall d) kommen dadurch zustande, daß die große Test-Korrekheitswahrscheinlichkeit (99.99 %) mit der geringen Zahl der infizierten Menschen (100) multipliziert wird.

Bekommt nun ein bedauernswerter Mensch mitgeteilt, daß er laut Test infiziert sei, dann gibt es zwei Möglichkeiten: Entweder der Fall b) trifft auf ihn zu, oder der Fall d). Im Fall b) schlug der Test fehl (die Person ist in Wirklichkeit also gesund); im Fall d) dagegen war der Test korrekt, d. h. die Person ist tatsächlich infiziert. Da, wie die Tabelle zeigt, unter den eine Million Menschen jeweils 99.99 auf b) und d) entfallen, beträgt die Wahrscheinlichkeit dafür, daß die Person zu b) gehört, genau 50 %.

Fazit: Wenn der Test „infiziert“ meldet, dann beträgt die Wahrscheinlichkeit, daß es ein Fehlalarm ist, 50 %. Der Test selbst hat zwar eine Irrtumswahrscheinlichkeit von 0.01 %, aber es durchlaufen viel viel mehr (im Beispiel hier 9999 mal mehr) Gesunde den Test, als Infizierte.

Das wahrscheinlichkeitstheoretische Stichwort dazu heißt „bedingte Wahrscheinlichkeit“. Auf einem idealen Würfel erscheint die Augenzahl „1“ im Mittel bei genau 1/6 aller Würfe, aber wenn man schon weiß, daß bei einem Wurf die Augenzahl ungerade ist (dies ist hier die Bedingung bei der bedingten Wahrscheinlichkeit), dann ist die Wahrscheinlichkeit für die Augenzahl „1“ 1/3. Die Bedingung für das Beispiel mit dem HIV-Test ist „Test fällt positiv aus“.

mfg
Christof