Hallo,
ich bin auf der Suche nach näheren Infos zur Durchführung des „Data Mining Reality Check“. Leider sind alle Artikel, die ich bislang gefunden habe, auf englisch und erklären nur grob die genaue Berechnungsmethode.
Normalerweise hätte ich einen simplen t-Test durchgeführt, ob die Ergebnisse (hier: Renditen) signifikant von Null verschieden sind. Jedoch wird häufig in der Literatur der t-Test abgelehnt, wenn die Ergebnisse evtl. durch data mining oder data snooping zustandegekommen sind und der DMRC angewendet.
Kurze Info zu DMRC: http://www.secondmoment.org/articles/datamining.php
Vielen Dank und viele Grüße
benny
Hallo,
nachdem sich niemand auf mein Problem gemeldet hat, gehe ich davon aus, dass ich mein Anliegen nicht präzise genug formuliert habe. Hier ein weiterer Versuch:
Das Verfahren, um welches es mir geht, nennt sich auch „White`s Reality Check for Data Snooping“. Mittels Bootstapping entstehen neue Daten z.B. Mittelwerte um somit die Verteilung zu erhalten. Der ursprünglich größte Wert (Mittelwert) des ursprünglichen Datensatzes wird nun mit den Quantilen der Verteilung verglichen.
Problemstellung:
"Whites Reality Check for Data Snooping" wird angewendet, wenn anhand einer Sample-Periode sehr viele Regeln überprüft werden und daraud der maximale Wert (Mitterlwert) die Lösung darstellt. Nun kann es gut möglich sein, dass dieses Ergebnis zwar vom herkömmlichen t-Test als signifikant eingestuft wird, obwohl es in Wirklichkeit durch Data Mining zustandegekommen ist. Um dieses Problem zu umgehen, wird der p-Value mittels Whites Reality Check ermittelt.
Hoffentlich ist dies einigermaßen verständlich geschildert.
Mein Problem/Frage ist, wie geht man bei dem „Reality Check for Data Snooping“ nach White vor?
Vielen Dank und viele Grüße
benny