Hallo ihr,
muss mich doch nach Jahren des faulen Schweigens (keine Zeit, schluchz) mal wieder hier zu Wort melden. Für die Wörterbucharbeit muss ich ständig versuchen, Frequenzen zu ermitteln. Neben Wortschatz Deutsch und Google bemühe ich auch noch das Korpus des Instituts für Deutsche Sprache:
http://corpora.ids-mannheim.de/cgi-bin/idsforms/cosm…
und Das Digitale Wörterbuch der Deutschen Sprache des 20.Jahrhunderts
http://www.dwds.de/cgi-bin/rest/loginstart
Die beiden Letzteren sind etwas umständlicher zu handhaben, daher nicht unbedingt für den Gelegenheitsnutzer interessant. Ich finde es immer interessant, welche Unterschiede sich in der Freuquenz ergeben, je nachdem, welche Quelle man benutzt. Das hängt eben mit den Textsorten zusammen, die dort verwendet wurden.
Um festzustellen, was „man“ sagt, ist Google unschlagbar, dafür hat man keinerlei Garantie, dass das dann auch akzeptables, von der Mehrheit als korrekt empfundenes Deutsch ist. Außerdem ist bei Google natürlich der ganze Computerbereich hoffnungslos überrepräsentiert und man findet auch einigen Maschinenübersetzungsmist ( z.B. Rücksortierung(shotel) Google: 91, vgl. /t/resort/1573023
IDS und dwds sind sehr literaturlastig, da findet sich allerlei Antiquiertes, wenig Aktuelles. Wortschatz Deutsch ist eine kuriose Mischung überwiegend aus neuen Zeitungstexten und neuerdings älterer Literatur (Karl May, Thomas Mann usw.). Auch nicht unbedingt repräsentativ. Sehr interessant sind aber die Listen der häufigsten Wörter, die man sich dort runterladen kann. Leider handelt es sich dabei um Wortformen, nicht um Lemmata (sprich: Genitiv-, Plural-, Vergangenheits-, Steigerungsformen werden alle getrennt gezählt, so dass unveränderliche Wörter im Vergleich als wesentlich häufiger abschneiden, weil man bei den anderen erst die einzelnen Formen addieren müsste).
Etwas anders sieht das Ergebnis bei den zwei anderen Korpora aus:
dwds: warum 11464, weshalb 3168, wieso 1448
ids cosmas: warum 11891, weshalb 891, wieso 1224
In der Liste vermisse ich übrigens weswegen:
Google 1.560.000
WS Deutsch 1465 (wieso 2742, weshalb 12585, warum 55289)
dwds 218
ids cosmas 891
Grüße
Susi