Kennt sich jemand mit Wahrscheinlichkeitsrechnung / Kombinatorik aus?

Hallo,

ich habe ein Problem. Ich möchte berechnen wie die Wahrscheinlichkeit ist, dass eine Mannschaft beim Fussball in der Punktetabelle das nächst Bessere Team überholt bzw. gleichzieht (stark vereinfacht: es wird einfach angenommen, dass die Chance für Sieg, Niederlage und Unentschieden gleich hoch sind). Zum Beispiel: Es ist nur noch ein Spiel zu spielen und Team A braucht 2 Punkte um mit Team B gleichzuziehen (um Tordifferenzen kümmern wir uns auch nicht). Ich bin dann alle Möglichkeiten durchgegangen: Wenn Team A gewinnt kriegt es 3 Punkte, wenn es Unentschieden spielt 1 Punkt und bei einer Niederlage erhält es keine Punkte. Dann muss ich gegen rechnen, dass das Gegnerteam B auch Punkte machen kann. 3 Möglichkeiten für Team A mal 3 Möglichkeiten für Team B ergibt 9 mögliche Ergebnisse. Das geht alles noch, doch je mehr Spieltage noch zu spielen sind, desto breiter spaltet sich alles auf. Ist eine Formel möglich, in der ich nur noch die Anzahl der offenen Spieltage und die nötigen Punkte eintrage und dass Ergebnis der Formel dann einen Prozentwert ergibt, welcher zeigt wie wahrscheinlich es ist, das Team A die erforderlichen Punkte erzielt?

Ich habe mich gestern den ganzen Tag mit Wahrscheinlichkeitsrechnung beschäftigt und mir qualmt inzwischen der Kopf. Ist da jemand fit drin und kann mir da mit wenig Aufwand helfen? Vielen Dank für eure Aufmerksamkeit!

Hallo,
an sich ist das recht einfach, Du hast es nur nicht ganz sauber modelliert. Der Ergebnisraum (aus Sicht von A) ist {-3, 0, 3}, das Ereignis ist dementsprechend als Aufholen von Punkten gegenüber B definiert, also Differenz zu B.

Nun hast Du eine Gleichverteilung festgelegt, also gilt: P(3) = 1/3, P(3+3) = 1/3 * 1/3, usw.

Wenn A also n Punkte braucht, um mindestens gleichzuziehen, dann ist P(n) = P(3m) = 1/3^m, wobei 3m die kleinste ganze Zahl größer-gleich n sein soll, die durch 3 teilbar ist.

Ich habe mir deine Antwort sorgfältig durchgelesen und verstehe den Anfang noch. Aber dann bei 3m bin ich mir leider nicht mehr sicher, wofür das steht. Steht m für die Menge? Und wie rechne ich das dann konkret? Ich bin dir wirklich sehr dankbar für deine schnelle Antwort, aber bei diesen ganzen mathematischen Buchstabenkürzeln verstehe ich immer nur Bahnhof. Ich verstehe immer noch nicht, wie ich z. B. konkret auf das Ergebnis kommen kann, dass Team 1 beispielsweise zu einer Chance von 5,6 % einen Rückstand von 5 Punkten aufholen kann, wenn noch 2 Spiele zu spielen sind. Wie sieht die allgemeine Formel dafür aus und was rechne ich dann, wenn ich die konkreten Zahlen einsetze? Und kann ich dann auch mit der selben Formel auch jede mögliche Wahrscheinlichkeit an jedem beliebigen Spieltag berechnen? Wenn du noch einmal Zeit für mich hättest würde ich mich riesig freuen; ich bin in dem Thema irgendwie blockiert…

Ok, also 3m (in Worten 3 mal m) war eigentlich eine ganze Zahl >=n. Hier in Deinem Beispiel n=5, 3m=6. Man könnte sagen, runde auf die nächste durch drei teilbare Zahl.

Das mache ich, damit nicht sowas rauskommt wie „nach 1.666 gewonnenen Spielen“ hat Mannschaft A 5 Punkte geholt.

Wenn es n Punkte aufzuholen gilt, dann rundest Du auf zu 3m und rechnest 1/3^m. Also bei n=5 ist 3m=6, also m=2, und damit 1/3^2.

Meine „Formel“ setzt voraus, daß auch soviele Spiele wie nötig noch gespielt werden können. Für Ergebnisse a la wie hoch ist die Wahrscheinlichkeit von 5 Punkten innerhalb von z.B. 4 Spielen, schreibt man alle 3^4 Tupel von möglichen Ergebnissen auf (die 3 in der Basis stammt von der Menge {S, U, N} (Sieg, Unentschieden, Niederlage) oder als Punktedifferenz (+3, 0, -3}. Man zählt dann alle Tupel, die in der Summe mindestens 5 ergeben, also z.B. (S, S, N, S), (S, S, U, U), usw. Nennen wir die Anzahl x. Die gesuschte Wahrscheinlichkeit ist dann x / 3^4.

Ich wollte noch sagen, daß mir für die letztere Variante, die Anzahl x zu ermitteln, außer in Spezialfällen, gerade keine allgemeine Lösung einfällt.

Es ist allgemein die Summe von bestimmten Binomialkoeffizienten, aber dadurch, daß die Elemente ihren Summenwert gegenseitig beeinflussen, ist unklar welche Mächtigkeit die Auswahlmenge in jedem Summanden hat. Also das Ergebnis: (S S N) ist das gleiche wie (S U U).

Ich überlege mal.

Danke schön, dass war eine sehr schnelle und ausführliche Antwort. Das werde ich mir im Laufe des Tages mal genau durchlesen!

Ah, noch eine Antwort für das m-Punkte-in-n-Spielen Problem. Manchmal sieht man die Lösung aber auch nicht sofort: Trinomialkoeffizienten.

Also, die grundlegende Herangehensweise bleibt die gleiche: Das Alphabet ist {S, U, N} mit S+U = S, N+U = N und S+N = U (in Punkten gedacht), auf Wolfram heißen die x, 1, und x^-1. Zur Vereinfachung gibt’s bei mir für den Sieg 1 Punkt, Niederlage -1, und unentschieden 0, das sind genau die Potenzen von x, x^-1 und 1 (was ja gleich x^0 ist).

Wir wollen also vom Verlauf aller möglichen n Spiele diejenigen ermitteln, die mindestens m Punkte bringen. Das sind aber gerade die Koeffizienten von den Termen x^m, x^(m+1), x^(m+2), … x^n

Für genau die rechnen wir also die Trinomialkoeffizienten [n k]2 aus und addieren sie:

#(>=m Punkte in n Spielen) = [n m]2 + [n m+1]2 + ... + [n n]2

Und (wegen der von Dir angenommenen Gleichverteiltheit) ist dann die Wahrscheinlichkeit:

P(>=m Punkte in n Spielen) = #(>=m Punkte in n Spielen) / 3^n

Für die Trinomialkoeffizienten bietet sich die Gleichung 11 an, das sollte jede Programmiersprache oder jeder Taschenrechner hergeben. Die anderen Varianten haben das Problem, daß die Fakultäten sehr schnell sehr groß werden und zudem noch signiert (also mit negativen Fakultäten) gearbeitet wird.

Nicht vergessen Du mußt Deine Punktezählung noch durch 3 teilen, damit Du auf meine Punktezählung kommst.

Sieht super gut aus, ich lese mich rein, teste und melde mich zurück ob das klappt! Erstmal Danke!

Hallo,

sehr gerne würde ich berichten, dass ich die Formel erfolgreich getestet habe und mein Problem damit gelöst ist. Doch konnte ich trotz intensiven Rechnens nicht auf die richtige Lösung einer beliebigen Beispielsituation kommen. Denn je mehr ich mich mit dem Thema beschäftige, desto mehr Fragen kommen bei mir auf:

Sind die Trinomialkoeffizienten / 3n alles was man berechnen muss? Wäre das nicht auch zu einfach? Und was hat … zu bedeuten. Muss ich den Term (x(m+2) nicht auch irgendwie einbeziehen? Und was nehme ich für die Punkte, wenn ich 5 Punkte in 2 Spielen brauche? 5 Punkte, oder 6 Punkte wegen dem Aufrunden auf das nächste Vielfache von 3, oder nur ein Drittel (1,67 bzw. 2)? Wann rechne ich in das andere Punktesystem um und wann nicht? 5 Punkte wären 1 Sieg und 2 x Unentschieden also 1+(20)=1 Punkt oder 5 mal Unentschieden = 0 Punkte. Wie kommt das Punktesystem überhaupt zum tragen? Und was ist überhaupt mit den 34 Tupeln? Ist das inzwischen überholt mit der Trinomialkoeffizientenlösung? Und was soll ich mit Gleichung 11 machen? Muss ich das auch ausrechnen? Und was ist j? Brauche ich da eine bestimmte Taste auf meinem Taschenrechner? Und wie passt die Gleichung 11 überhaupt hier rein, ich dachte die Trinomialkoeffizienten werden einfach durch (nm)2 + (nm+1)2 + nn2 errechnet? Und n sind doch die offenen Spiele und m die nötigen Punkte, oder? Du hast doch geschrieben „>=m Punkte in n Spielen“. Oder habe ich alles falsch gerechnet; muss ich die eckigen Klammern anders behandeln? Sind die 2 nicht Mal 2 sondern hoch 2? Und ist das allgemein gültig oder muss ich die Formel jedes Mal variieren?

Ich kriege diese ganzen Puzzlestücke einfach nicht zusammengesetzt. Ich habe versucht auf das zuvor von mir errechnete Ergebnis der Beispielsituation zu kommen, indem ich alle denkbaren Zahlen in die Formel eingesetzt habe. Aber nie kam ich auf die 5,6 % Wahrscheinlichkeit bei 5 Punkten in 2 Spielen. Solltest du noch irgendeine Idee haben, wie du mir noch helfen kannst das besser zu verstehen, würde ich mich riesig freuen. Ansonsten habe ich ja jetzt am Wochenende ein wenig mehr Zeit und hoffe, dass ich mit ein wenig Nachdenken am Ende noch auf die Lösung komme. Tut mir leid, dass ich kein positiveres Feedback geben kann, aber ich steige einfach nicht durch; Mathe war auch noch nie meine Stärke…

Aaalso, Trinome lösen wirklich einen sehr einfachen Fall, nämlich: Team A liegt unmittelbar hinter Team B, mit m Punkten Rückstand, alle folgenden n Spiele sind zwischen Team A und Team B.

Wenn Du das für realistische Spieltabellen und Spielpaarungen brauchst, dann sind die Wahrscheinlichkeiten pfadabhängig, sprich 5 Punkte in 3 Spielen aufholen geht allgemein nicht mehr durch einen Sieg und zwei unentschieden. Es muß noch sichergestellt werden, daß Team B in den nächsten drei Spielen verliert.

Der Lösungsansatz hier ist: Man simuliert alle erdenklichen, legalen Kombinationen (und nennt deren Anzahl X), dann selektiert man die, bei denen A mit B mindestens gleichgezogen ist (nennt deren Anzahl Y) und dann ist die Wahrscheinlichkeit Y / X (immer mit der Gleichverteilungsannahme).

Für Spiele bei denen A gegen B spielt, haben wir die Lösung mit den Trinomen bereits. Wenn A mal nicht gegen B spielt, dann betrachtet man die möglichen Spielausgänge (aus Sicht von A und aus Sicht von B), also SS, SU, SN, US, UU, UN, NS, NU, NN, also A siegt, B siegt, A siegt, B unentschieden, usw. Fürs Aufholen von Punkten heißt das 0 (SS), 2 (SU), 3 (SN), -2 (US), 0 (UU), 1 (UN), -3 (NS), -1 (NU), 0 (NN). Du ahnst es vielleicht schon, aber wir müssen noch multinomialer werden und wollen die Koeffizienten von:

(x^-3 + x^-2 + x^-1 + 3x^0 + x^1 + x^2 + x^3) ^ n

ausrechnen, also ein 7-nomialer Ausdruck statt eines trinomialen.

An dieser Stelle mußt Du Dich entscheiden, ob Du eine schöne geschlossene Formel haben willst, wo Du nur einsetzen mußt: m Punkte, n Spiele, davon r Spiele zwischen A und B. Oder ob Du nicht einfach vollständig simulierst.

Ich sehe Du willst das ganze in Excel machen? Da scheidet die Simulationslösung ja schon fast wieder aus, und auch die Lösung per Multinomialkoeffizienten in Ermangelung an Mathefunktionen, die man dafür bräuchte. Ich bin aber auch kein Excel-Experte.

Dann zu dem Rest der Fragen: Ja, die Trinomialkoeffizienten (und später die 7-nomialkoeffizienten) müssen aufaddiert werden und durch 3^n geteilt werden. Ich hoffe, Du weißt das 3^n und 3*n was ganz anderes sind.

Die Schreibweise … sollte anschaulich die Schleife darstellen, in der Mathematik nimmt man dafür das Summenzeichen, was ich aber hier nicht tippen kann: Also Summe von k=(m bis n) über [n k]2. Später steht hier dann Summe von k=(m bis n) über [n k]6.

Für die Punkte hatte ich vorgeschlagen nur ein Drittel zu nehmen, weil man dann einfach die Formel von Wolfram abschreiben kann. Ansonsten kann man auch das Trinom (x^-3 + 1 + x^3) ^ n und entsprechend steht dann in der Summe [n k]2 * x^(3k) (es ist wirklich schade, daß man hier keine mathematische Notation tippen kann), und man muß nun „k passend starten lassen“ also bei 5 Punkten braucht man k=2 denn 3k = 6.

Zum Thema aufrunden, ja man muß auf das nächste durch 3 teilbare Vielfache aufrunden.

3^4 Tupel war konkret ein Beispiel für 4 Spieltage, allgemein sind es 3^n.

Ja Gleichung 11 definiert ja gerade was [n m]2 als Zahlenwert zu gegebenen n und m ist. Was hast Du denn stattdessen gerechnet?

j ist der Summationsindex bei Wolfram um [n k]2 auszurechnen.

Auf dem Taschenrechner mußt Du die Summe natürlich selbst ausrechnen. Aber für diese (n j) (n über j) bzw. (2n - 2j n - k - j) gibt es auf den Taschenrechnern (meistens) eine Taste nCr (n choose r).

Ja eckige Klammern sind bei mir nur Notation für die Trinomialkoeffizienten gewesen [n k]2 soll heißen „n über k zwei“, so wie bei Wolfram definiert. Wie gesagt, ich kann die Notation hier nicht herkopieren. Und die 2 steht für Trinome, in Anlehnung an Binomialkoeffizienten, wo da im Index eine gedachte 1 steht.

Die geschlossene Formel ist eine Gleichung mit Parametern, die muß nicht variiert werden.

Allgemeingültig wird dann die vollständige Betrachtung mit den Spielen, in denen A nicht gegen B spielt. Da solltest Du mir noch die Rückkopplung geben, ob Du das mit einer fertigen Formel machen möchtest. Es wird dann einen Parameter mehr geben, nämlich in wieviel Spielen der nächsten n Tage die Paarung A vs B auftritt.

Die Alternative per Simulation ist zwar bedeutend einfacher zu verstehen und zu programmieren, aber auch langsamer, und man braucht wie gesagt vielleicht etwas besseres als Excel.

1 Like

Da hast du ja nochmal einen richtig langen Text raus gehauen! Da kriege ich ein richtig schlechtes Gewissen. Hätte ich geahnt, dass das so kompliziert ist, hätte ich es von vorn herein gelassen! Ich dachte das Problem wäre relativ simpel und deshalb auch relativ leicht mit Schulmathe zu lösen. Aber das finde ich sehr heftig! Ich gebe mir alle Mühe und versuche dich nicht zu enttäuschen!

1 Like