Prozentaufgabe für statistik

Hallo zusammen,
versuch grade ne kleine Statistik aufzustellen, aber jetzt komme ich mit den Przenten irgendwie durcheinandere…

Fehlertolleranz:
Ein Problem wird 4 mal durchlaufen.
3 mal wird das Problem erkannt und 1 mal nicht.
==> demnach wird zu 75% das Prblem immer erkannt und zu 25% nicht.

Zu wieviel Prozent wird das Problem beim nächten mal erkannt?
(kann man solch eine Frage überhaupt stellen?)

falls es eine Lösung gibt, dann bitte mit Rechnung ^^
Danke

Hallo,

Die Variable ist binomialverteilt (es gibt nur zwei mögliche Ausprägungen: „erkannt“ und „nicht erkannt“).

Punktschätzer für die Erkenn-Rate ist gleich Anzahl erkannt geteilt durch Anzahl untersucht, also 3/4 = 0.75.

So würde man auch die Wahrscheinlichkeit einschätzen, das Problem in einer beliebigen Untersuchung zu erkennen (75%).

Das Problem ist hier die sehr kleine Stichprobe, was die Schätzung recht unsicher macht. Anhand der Binomialverteilung kann man berechnen, dass ein Intervall von 19% bis 99% reichen muss, um mit 95%iger Wahrscheinlichkeit die wahre Erkenn-Rate zu enthalten (95%-Konfidenzintervall, siehe http://en.wikipedia.org/wiki/Binomial_proportion_con…).

Zu wieviel Prozent wird das Problem beim nächten mal erkannt?
(kann man solch eine Frage überhaupt stellen?)

Mit 95%iger Sicherheit mit irgendwas zwischen 19% und 99%.

VG
Jochen

Danke Jochen, habs denke ich so halb verstanden ^^ frage ist nur mit welcher Rechnung komme ich an die Zahlen 19% und 99%?
und kann man nicht einfach den Mittelwert angeben, der dann zu 95% eintrifft?
Also:
Das Problem wird mit einer 95%igen Wahrscheinlichkeit zu 59% erkannt.

Gruß
Alex

Danke Jochen, habs denke ich so halb verstanden ^^ frage ist
nur mit welcher Rechnung komme ich an die Zahlen 19% und 99%?

Mit der Binomialverteilung. Die Ermittlung des Konfidenzintervalls ist etwas aufwändig, aber es gibt online-Rechner für sowas, zB. hier:

http://campus.uni-muenster.de/fileadmin/einrichtung/…

(Anm.: Bei der Suche trifft man meist auf Tools, welche das KI anhand der Normalverteilung berechnen. Das ist bei n>50 ok, aber Du hast n=4, da muss man das Intervall exakt berechnen).

und kann man nicht einfach den Mittelwert angeben, der dann zu
95% eintrifft?

Nein. Schau mal, ein *bestimmter* Wert ist praktische sicher falsch: Wenn man 53% angibt, kann der Wert tatsächlich aber auch 53,01% sein, oder 52,9999% oder irgend ein andere Wert in der Nähe von 53%. Normalerweise erwartet man den wahren Wert ziemlich „in der Nähe“ des Wertes, den man angibt. Das Konfidenzintervall zeigt Dir, was „in der Nähe“ in deinem Fall aber tatsächlich heißt.

Also:
Das Problem wird mit einer 95%igen Wahrscheinlichkeit zu 59%
erkannt.

Nein, so geht das nicht. Um eine (endlich große) Sicherheit anzugeben, brauch es ein Intervall. Eine Aussage wie „Anhand der vorliegenden Daten können wir mit 95%iger Sicherheit sagen, dass ein Problem im nächsten Versuch mit mindestens 59%iger Wahrscheinlichkeit erkannt wird.“

VG
Jochen