Stochastik

hi!
es geht um folgendes stochastisches problem:

Ein Buch von 300 Seiten enthalte 200 zufällig verteilte Druckfehler. Ich soll jetzt mittels Poissonapproximation, Normalapproximation sowie exakt die Wahrschein-
lichkeit für mehr als einen Druckfehler auf der ersten Seite berechen.

würde mich freuen, wenn mir jemand helfen könnte.

gruss

Hallo.

Ein Buch von 300 Seiten enthalte 200 zufällig verteilte
Druckfehler. Ich soll jetzt mittels Poissonapproximation,
Normalapproximation sowie exakt die Wahrschein-
lichkeit für mehr als einen Druckfehler auf der ersten Seite
berechen.

Im Idealfall also entweder alle 200 Fehler auf einer Seite oder max. 1 Fehler auf je einer Seite… Macht grob geschätzt eine W.keit von 200/300.
Eine analoge Aussage aus http://www.amazon.de/exec/obidos/ASIN/354020380X/inf…
(S. 77): Ausgehend davon, dass jeder Buchstabe eine geringe W.keit hat, etwa p=0.002, ein Druckfehler zu sein und dass es insgesamt
1000 Buchstaben pro Seite gibt, hat die Anzahl der Druckfehler auf einer Buchseite ein Bin(1000,0.002)-Verteilung. Diese wird ausgezeichnet durch die Poisson(2)-Verteilung approximiert.

Hier müsste das Spiel analog laufen: Bin(300, 0.66) wird approx. durch Poi(200) [300 * 0.66]. Und die Bin.vert. durch die Normalvert., wenn n*p*(1-p) > 9 (Laplace Bedingung)
…leider versiegen hier meine Quellen.

HTH
mfg M.L.

Hallo,

wahrscheinlich enthält das Buch die 200 Druckfehler doch mit einer gewissen Wahrscheinlichkeit. Wie groß ist diese ?

Ich glaube, daß es kein Herstellungsverfahren gibt, wo die Wahrscheinlichkeit für eine bestimmte Fehlerzahl (bei feststehender Seitenzahl) 1 ist.

Wenn das Buch auf jeden Fall genau 200 Druckfehler enthalten soll, so kann man das als Denksportaufgabe rechnen. Aber ich kann mir keine reale Wahrscheinlichkeitverteilung vorstellen, wo ein gedrucktes Buch z. B. auf den letzten 10 Seiten 200 Fehler haben muß, wenn 290 Seiten fehlerfrei waren.

Wenn die Aufgabe lautet, daß auf einer Seite mit der Wahrscheinlichkeit von 2/3 ein Fehler auftritt, wäre das eine Angabe, mit der man etwas ausrechnen kann. Aber mit den 200 Pflichtfehlern sehe ich keinen echten Ansatz.

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

an Shan, Torsten und Markus
Hi zusammen,

die Aufgabe ist mit den vorhandenen Angaben eindeutig lösbar, soweit die gute Nachricht an dich, Torsten (und natürlich auch an dich, Shan :wink:.

Los geht’s gemäß der Regel „günstige durch mögliche“, indem man sich die Anzahl der Möglichkeiten für die Platzierung der (unabgängig identisch verteilten) Fehler überlegt. Es handelt sich hier um eine Variation mit Wiederholung (–> Kombinatorik), und die Formel lautet A = Buchseiten^Fehler. Die exakte Wahrscheinlichkeit p für eine dieser A Möglichkeiten lautet also p=1/A. Dein Denkfehler, Markus, liegt darin, dass du die Zusatzannahme triffst, jede Seite enthalte höchstens einen Fehler.

Wir wollen die Wahrscheinlichkeit für mehr als einen Fehler; dies entspricht der Gegenwahrscheinlichkeit zu „höchstens 1 Fehler“. Also: P(X>1) = 1- P(X>=1) = 1 - P(X=1) - P(X=0).

Nun müssen wir bestimmen, wieviele dieser Möglichkeiten günstig sind, also die Seite mit der Nummer 1 nicht oder genau 1x enthalten. Dies bedeutet, dass 200 Druckfehler auf den 299 anderen Seiten enthalten sind bzw. dass 199 Druckfehler auf 299 Seiten enthalten sind, also 299^200 bzw. 299^199. P(X=0) ist also (299/300)^200, und P(X=1) ist 200*(299^199/300^200) = 200 * (299/300)^199 * 1/300, weil es noch 200 Möglichkeiten für den speziellen Druckfehler auf der 1. Seite gibt.

Damit haben wir also N=200 und p=1/300 als Parameter der zugrundeliegenden Binomialverteilung bestimmt. Anschaulich kannst du es dir auch so vorstellen, dass du einen festen Druckfehler entweder auf Seite 1 platzierst oder woanders. Die Wahrscheinlichkeit, ihn auf die Seite 1 zu setzen, ist 1/300, und da der Druckfehlerteufel 200 Druckfehler verteilt, ist N eben 200.

Die Approximation durch Poisson- und Normalverteilung hast du dann wieder grundsätzlich richtig dargestellt, Markus. Lambda ist Np = 200 * 1/300, bzw. my = Np = lambda, sigma^2 = Np*(1-p), was ungefähr gleich N*p ist, weil p nahe bei 0 liegt. Stutzig hätte dich vielleicht machen können, dass die Poisson-Approximation nur für sehr kleine p erlaubt ist. Die Normalverteilung wird übrigens keine sehr gute Approximation darstellen, da p weit von 0.5 entfernt ist.

Gruß
Katharina

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Die Vorstellung, daß ein Druckfehlerteufel die feststehende Zahl von 200 Fehlern in ein Buch hineinwürfelt, ist einfach wahnwitzig. Ich weiß nicht, was das mit der Realität bei der Herstellung eines Buches zu tun haben soll. So etwas machte höchstens der KGB oder ähnliches. Ich habe auch erst angefangen so zu rechnen, aber dann ist es mir aufgefallen.

Um die Aufgabe lösen zu können, fehlt die Information, welcher Zusammenhang zwischen dem Fortschreiben des Buchinhaltes beim Satz und möglichen Fehlern besteht. Dieser Zusammenhang kann sehr unterschiedlich sein, und ohne Angaben über diesen Zusammenhang ist die Aufgabe nicht lösbar.

Lösbar wäre die Aufgabe z. B. schon, wenn es heißen würde: „Die Fehlerzahl von 200 ist zufällig und Ergebnis einer Normalverteilung.“

Hi zusammen,

die Aufgabe ist mit den vorhandenen Angaben eindeutig lösbar,
soweit die gute Nachricht an dich, Torsten (und natürlich auch
an dich, Shan :wink:.

Los geht’s gemäß der Regel „günstige durch mögliche“, indem
man sich die Anzahl der Möglichkeiten für die Platzierung der
(unabgängig identisch verteilten) Fehler überlegt. Es handelt
sich hier um eine Variation mit Wiederholung (–>
Kombinatorik), und die Formel lautet A = Buchseiten^Fehler.
Die exakte Wahrscheinlichkeit p für eine dieser A
Möglichkeiten lautet also p=1/A. Dein Denkfehler, Markus,
liegt darin, dass du die Zusatzannahme triffst, jede Seite
enthalte höchstens einen Fehler.

Wir wollen die Wahrscheinlichkeit für mehr als einen Fehler;
dies entspricht der Gegenwahrscheinlichkeit zu „höchstens 1
Fehler“. Also: P(X>1) = 1- P(X>=1) = 1 - P(X=1) -
P(X=0).

Nun müssen wir bestimmen, wieviele dieser Möglichkeiten
günstig sind, also die Seite mit der Nummer 1 nicht oder genau
1x enthalten. Dies bedeutet, dass 200 Druckfehler auf den 299
anderen Seiten enthalten sind bzw. dass 199 Druckfehler auf
299 Seiten enthalten sind, also 299^200 bzw. 299^199. P(X=0)
ist also (299/300)^200, und P(X=1) ist 200*(299^199/300^200) =
200 * (299/300)^199 * 1/300, weil es noch 200 Möglichkeiten
für den speziellen Druckfehler auf der 1. Seite gibt.

Damit haben wir also N=200 und p=1/300 als Parameter der
zugrundeliegenden Binomialverteilung bestimmt. Anschaulich
kannst du es dir auch so vorstellen, dass du einen festen
Druckfehler entweder auf Seite 1 platzierst oder woanders. Die
Wahrscheinlichkeit, ihn auf die Seite 1 zu setzen, ist 1/300,
und da der Druckfehlerteufel 200 Druckfehler verteilt, ist N
eben 200.

Die Approximation durch Poisson- und Normalverteilung hast du
dann wieder grundsätzlich richtig dargestellt, Markus. Lambda
ist Np = 200 * 1/300, bzw. my = Np = lambda, sigma^2 =
Np*(1-p), was ungefähr gleich N*p ist, weil p nahe bei 0
liegt. Stutzig hätte dich vielleicht machen können, dass die
Poisson-Approximation nur für sehr kleine p erlaubt ist. Die
Normalverteilung wird übrigens keine sehr gute Approximation
darstellen, da p weit von 0.5 entfernt ist.

Gruß
Katharina

hi!
es geht um folgendes stochastisches problem:

Ein Buch von 300 Seiten enthalte 200 zufällig verteilte
Druckfehler. Ich soll jetzt mittels Poissonapproximation,
Normalapproximation sowie exakt die Wahrschein-
lichkeit für mehr als einen Druckfehler auf der ersten Seite
berechen.

würde mich freuen, wenn mir jemand helfen könnte.

gruss

Über den Realitätsbezug von Übungsaufgaben
Hi Torsten,

mir sind selten Statistik- oder Stochastik-Übungsaufgaben begegnet, die realitätsnah sind. Die Vorstellung von Druckfehlerteufel dient dazu, einem Studenten das stochastische Modell zu veranschaulichen.

Warum soll es eigentlich nicht der KGB gewesen sein? Wenn es dazu dient, die Studenten zur Lösung der Aufgabe zu motivieren, ist das ein guter Vorschlag (vielleicht baue ich den mal in eine Übungsaufgabe für meine Studenten ein… danke!).

Die Aufgabe ist mit der Angabe der Wahrscheinlichkeit gelöst. Ob die Beschreibung einen Herstellungsprozess korrekt darstellt oder nicht, ist nebensächlich, solange das Modell auf die Aufgabe passt. So wie sie gestellt wurde, passt es, und damit ist die Aufgabe gelöst.

Leider gibt’s mit deiner Argumentation - so richtig sie im realen Leben ist - halt Null Punkte in der Statistik-Übung.

Gruß
Katharina

Die Vorstellung, daß ein Druckfehlerteufel die feststehende
Zahl von 200 Fehlern in ein Buch hineinwürfelt, ist einfach
wahnwitzig. Ich weiß nicht, was das mit der Realität bei der
Herstellung eines Buches zu tun haben soll. So etwas machte
höchstens der KGB oder ähnliches. Ich habe auch erst
angefangen so zu rechnen, aber dann ist es mir aufgefallen.

Um die Aufgabe lösen zu können, fehlt die Information, welcher
Zusammenhang zwischen dem Fortschreiben des Buchinhaltes beim
Satz und möglichen Fehlern besteht. Dieser Zusammenhang kann
sehr unterschiedlich sein, und ohne Angaben über diesen
Zusammenhang ist die Aufgabe nicht lösbar.

Lösbar wäre die Aufgabe z. B. schon, wenn es heißen würde:
„Die Fehlerzahl von 200 ist zufällig und Ergebnis einer
Normalverteilung.“