Hallo,
nnachdem ich mich durch den Artikel nun durchgekämpft habe (Daaaanke dafür!), stehe ich vor „folgendem“ Problem. Und zwar habe ich gelesen, dass bei einer logistischen Regression (wo das Kriterium nur 2 Ausprägungen hat) man eine sogenannte Kreuzvalidierung machen muss, da die angegebene Trefferquote kein unverzerrter Schätzer sei und daher potnetiell überschätzt ist. Was ich verstganden habe ist folgendes: Man nimmt aus seiner Stichprobe einen kleinen Teil und teilt diese auch (irgendwie auf). Aber was macht man denn genau??? Teilt man diese per Zufall auf? Weil wenn ja, dann hätte ich ja auch einfach gucken können, wieviele mein Kriterium haben (z.B. .60-> also 60%) und das könnte ich als „Benchmark“ für meine Trefferquote nehmen; sprich also, mein Modell muss mehr Trefferquote besitzten, als 60% oder was bringt einem die Kreuzvalidierung genauer?!