Statistik: Verteilung approximieren

Hallo liebe Wissenden,

ich habe kein spezielles Brett für Statistik gefunden, daher siedel ich diese mal bei der Mathematik an.

Ich habe folgendes Problem:
Ich untersuche zur Zeit Auktionsformen und möchte dabei verschiedene „Zahlungsbereitschafts-Verteilungen“ über die Bieter annehmen (z.B. die Normalverteilung). In meiner Untersuchung ist es für mich aber wichtig, die Wahrscheinlichkeit für das „ziehen“ des Bieters mit der zweithöchsten Zahlungsbereitschaft herauszufinden. Das ist natürlich bei einer stetigen Verteilung nicht möglich.
Bekannt ist mir schon, dass man diskrete Verteilungen (z.B. mit der Normalverteilung) oft durch stetige Verteilungen approximieren kann. Bei mir wäre das ja eher umgekehrt: Ich würde gerne aus stetigen Verteilungen diskrete Annäherungen machen.

Habt dazu einer eine Idee? Gibt es in diese Richtung schon Modellierungsansätze?

Liebe Grüße

Benjamin

Huhu,

ich verstehe nicht ganz, was deine Aufgabe

…ist es für mich aber wichtig, die
Wahrscheinlichkeit für das „ziehen“ des Bieters mit der
zweithöchsten Zahlungsbereitschaft herauszufinden.

mit der Verteilungsfunktion der Biet-Bereitschaft zu tun haben soll. Der Witz ist doch, dass die zufällige Auswahl NICHT von der Biet-Bereitschaft abhängt. Ganz egal, wie gerne und viel die Leute bieten, wenn du von n Personen rein zufällig und ohne Zuhilfenahme zus. Kriterien eine Person herausnimmst, steht’s 1/n, dass diese Person das zweithöchste Gebot abgibt.

Anders sieht’s aus, wenn du Bewertungskriterien zum Biet-Verhalten der anwesenden Personen zur Auswahl heranziehst. Dann wird’s aber mit der Berechnung von Wahrscheinlichkeiten problematisch.

LG
Jochen

Hallo Jochen,

danke schonmal für die Antwort. Mein Problem dabei ist nun allerdings, dass es ja mehrere Bieter mit der zweithöchsten Wertschätzung geben kann. Ich stelle mir einfach mal die Dichtefunktion der Normalverteilung vor. Irgendwo rechts am Schwanz von der Glockenkurve liegt der Höchste Bieter, um den Mittelwert herum liegen die mittleren Bieter und links davon die niedriegen Bieter. D.h. es gibt sehr wenige Bieter die hoch oder nierig Bieten, aber viele, die Mittel Bieten.
Biete ich ein Gut bei einer Auktion an gäbe es dann z.B. einen der 1€ bieten würde dann aber schon 2, die 3€ bieten würden. Entsprechen an der oberen „Grenze“ : Es gibt z.B nur einen der 100 € bieten würde aber schon 2, die 97 Euro bieten würden.

Dann wäre also im Beispiel die W´keit einen Bieter mit Wertschätzung 3€ schonmal doppelt so hoch wie die für einen Bieter mit Wertschätzung von nur 1€.

So, und das Problem ist jetzt halt, dass ich keine Daten über Wertschätzungen von Bietern habe, und die (z.B.) als Normalverteilt annehmen möchte. Da sich meine Untersuchungen um einen Erstbieterrabatt drehen (Amazon), der hauptsächlich AUswirkung auf den Verlauf einer Auktion haben kann, wenn der (bzw. ein) Bieter mit der zweithöchsten Wertschätzung zugleich auch der Erstbieter ist.

Ich hoffe das ist jetzt nicht noch verwirrender. Ich selber komme immer mehr zu dem Schluss, dass das was ich vorhabe so gar nicht geht.

Jetzt vieleicht ne Idee?

Ich nochmal.

Die W´keit 1/N bekomme ich natürlich, wenn ich die Gleichverteilung statt die Normalverteilung unterstelle.

Liebe Grüße

Benjamin

Hallo an dieser Stelle.

Das scheint ja doch eine härtere Nuss zu sein :-L
Vor allem, weil bisher immer von diskreten Werte auf stetige geschlossen wurde. Aber umgekehrt … ?
Vielleicht lässt sich hier -irgendwo- etwas Brauchbares finden:
http://www.uni-dortmund.de/web/de/content/fachbereic…
http://www.reiter1.com
http://statistikforum.foren-city.de
http://www.christian-fries.de/ (inkl. des Buchs)

mfg M.L.

Nachfrage
Hi,
(…)

Biete ich ein Gut bei einer Auktion an gäbe es dann z.B. einen
der 1€ bieten würde dann aber schon 2, die 3€ bieten würden.
Entsprechen an der oberen „Grenze“ : Es gibt z.B nur einen der
100 € bieten würde aber schon 2, die 97 Euro bieten würden.

Dann wäre also im Beispiel die W´keit einen Bieter mit
Wertschätzung 3€ schonmal doppelt so hoch wie die für einen
Bieter mit Wertschätzung von nur 1€.

Was meinst du damit?
Es gibt mehr Bieter mit 3 Euro als Bieter mit 1 Euro.
Aber wieso soll die W’keit für einen 3-Euro-Bieter höher sein als für einen 1-Euro-Bieter? Beide werden das Rennen niemals machen, sondern der 100 Euro Bieter, und auch nicht der 97 Euro Bieter.
Welche Kriterien legst du zugrunde, wenn du von Wahrscheinlichkeiten sprichst?
Das reine „Vorhandensein“ von x-Euro-Bietern in einer Bieter-Grundgesamtheit für sich alleine genommen ist ja wohl kaum sinnstiftend, oder?

(…)

wenn der
(bzw. ein) Bieter mit der zweithöchsten Wertschätzung zugleich
auch der Erstbieter ist.

Hä?
Sorry, hilf mir mal vom Schlauch runter.

Gruss,

Was meinst du damit?
Es gibt mehr Bieter mit 3 Euro als Bieter mit 1 Euro.
Aber wieso soll die W’keit für einen 3-Euro-Bieter höher sein
als für einen 1-Euro-Bieter? Beide werden das Rennen niemals
machen, sondern der 100 Euro Bieter, und auch nicht der 97
Euro Bieter.

Hallo,

Ich bleibe nochmal beim Beispiel. Natürlich ist da auch weiterhin die Wahrscheinlichkeit einen bestimmten 3-Euro Bieter zu ziehen 1/N.
Mich interessiert allerdings mit welcher Wahrscheinlichkeit ein gezogener Bieter ein 3-Euro Bieter ist. Gäbe es zum Beispiel nur 3 Bieter. Einer wäre bereit 1€ zu bieten und zwei wären bereit 3€ zu bieten. Dann ist doch die Wahrscheinlichkeit, dass der letztendlich gezogene Bieter 3€ bieten würde doch 2/3 und dass er 1€ bieten würde 1/3.

Das war zuvor vieleicht nicht ganz klar ausgedrückt. Ich möchte also die W´keit dafür, dass der gezogene Bieter ein (und nicht der ) Bieter mit der zweithöchsten Bietbereitschaft ist.

Das „Rennen“ kann im Falle eines Erstbieterrabattes sehr wohl der Bieter mit der (a priori) zweithöchsten Bietbereitschaft machen, da er, wenn er Erstbieter sein sollte, soviel bieten kann, dass er nach Abzug des Rabattes seine wahre Bietbereitschaft zahlen muss. Im Fall eines Erstbieterrabattes von 10% könnte der 97 Euro Bieter demnach 107,7777…€ bieten und somit den 100€ Bieter aus dem Rennen werfen. (Denn er zahlt nur 107,7777…x90%=97)

Grüße derben

Ich nochmal.

Dito.

Die W´keit 1/N bekomme ich natürlich, wenn ich die
Gleichverteilung statt die Normalverteilung unterstelle.

Nicht in dem o.g. Zusammenhang.

Nochmal:

Die W’keit, ob es sich bei einer zufällig aus n Personen herausgegriffenen Person um denjenigen handeln wird, der das zweithöchste (oder allgemein m-höchste) Gebot macht, ist unabhängig von der Verteilung der Wertschätzungen bei den n Personen.

Der mathematisch exakte Beweis dafür ist mir zu hoch, aber ich kann es simulieren. Hier ist ein R-Skript, welches eine große Zahl von Auktionen simuliert und empirisch die Trefferquote ermittelt (also die W’keit, dass die zufällig gewählte Person der vorletzte Bieter ist).

R ist OpenSource, siehe http://cran.r-project.org/
Das Skript kannst du einfach in den Editor kopieren. Durch einen Aufruf von „Auktion()“ würdest du 100 Auktionen mit je 10 Personen simulieren und dann die Trefferquote angezeigt bekommen.

Hier das Skript:

# Beispiel für Normalverteilung der Wertschätzungen
# für n=10 Bieter in der Auktion
# und eine mittlere Wertschätzung von 20(€) und einer Stabw von 1.
LimitsNorm 0) cat(" Experiment #",i,": Bieter ",X," wurde gewählt:",sep="") 
 voriger.Bieter 0)
 {
 voriger.Bieter aktuelles.Gebot)
 if (Details\>1)
 cat("\n Bieter ",aktueller.Bieter," bietet ",aktuelles.Gebot,sep="") 
 }
 if (Details\>1) cat("\n Bieter ",aktueller.Bieter," gewinnt. Voriger Bieter war ",voriger.Bieter," \n",sep="") 
 if (voriger.Bieter==X) n.Treffer 0) if (voriger.Bieter==X) cat(" TREFFER!\n") else cat(" kein Treffer.\n")
 flush.console() 
 }

 cat("Trefferquote =",n.Treffer/n.Auktionen,"\n")
}

Tatsächlich bekommt man immer etwa 1/n heraus - egal, mit welcher Verteilungsfunktion man die Limits setzt.

Nochmal ein Beispielaufruf für eine Normalverteilung, 50 Bietern und 10000 Auktionen:

\> LimitsNorm Auktion(n.Auktionen=10000)
Simulation von 10000 Auktionen mit 50 Bietern...
Trefferquote = 0.0202 

Und siehe da: 1/50 = 0.02.

Liebe Grüße,
Jochen

Hallo Jochen,

Die W’keit, ob es sich bei einer zufällig aus n
Personen herausgegriffenen Person um denjenigen handeln wird,
der das zweithöchste (oder allgemein m-höchste) Gebot macht,
ist unabhängig von der Verteilung der Wertschätzungen
bei den n Personen.

Ja das ist mir schon klar. Allerdings (und das hatte ich wohl zu undeutlich formuliert) geht es mir beim ziehen nicht um einen bestimmten Bieter mit „der“ zweithöchsten Wertschätzung. Es kann ja auch zwei bieter mit der Gleichen Wertschätzung geben (Ziehen aus Kiste mit 1 weißen und 2 schwarzen Kugeln. Die W´keit eine Schwarze zu ziehen ist doch 2/3 und eben nicht 1/3).
Mir ist daher auch klar das bei einer Simulation bei der…

Die Limits werden der einfacheren Handhabung wegen

sortiert.

Bieter 1 hat das geringste Limit, Bieter n das höchste

Limit
Limit

Hallo,

Daher möchte ich vielmehr einige
Verteilungen unterstellen, um daraus jeweils etwas diskretes
zu machen (glatte Kurve wird Histogramm),

Ähm, das verstehe ich jetzt so:

Du unterstellst zB. eine Verteilung der Wertschätzungen W der Form: W ~ N(m,s) [also Normalverteilt mit Mittelwert m und Stabw. s].

Du diskretisierst die Wertschätzungen über die Intervallgrenzen In wobei I0 = geringste praktische Wertschätzung bis In = höchste praktische Wertschätzung.

Du nimmst eine Peron mit der (zufälligen) Wertschätzung w
und willst wissen: p(Iaa+1).

Korrekt?

Das ist aber doch einfach: Phim,s(Ia+1) - Phim,s(Ia)

[Phim,s ist die Normal-Verteilungsfunktion, also das Integral über der Normal-Dichtefunktion, mit Mittelwert m und Standardabweichung s).

Also?

LG
Jochen

Hallo und danke nochmal,

Du nimmst eine Peron mit der (zufälligen) Wertschätzung w
und willst wissen: p(Iaa+1).

Korrekt?

Das ist aber doch einfach: Phim,s(Ia+1)

  • Phim,s(Ia)

[Phim,s ist die Normal-Verteilungsfunktion, also
das Integral über der Normal-Dichtefunktion, mit Mittelwert m
und Standardabweichung s).

Das ist genau was ich meinte, allerdings ist mir halt inzwischen auch klar, dass ich durch die Wahl der Intervallbreite (Abstand zwischen Ia und Ia+1) natürlich auch die entsprechenden Wahrscheinlichkeiten selbst festsetze.

Habe aber auch schon ein weiteres Problem, an dem ich feilen muss. Vieleicht schreibe ich das auch noch hier rein, wenn ichs selber nicht gebacken kriege.

Liebe Grüße
derben