Wortliste (als Datei) gesucht

Hallo Experten,

ich bin auf der Suche nach einer möglichst umfangreichen (Klartext-)Wortliste der deutschen Sprache in Dateiform, geeignet z.B. zur Passwortüberprüfung aber auch zur RE-Suche für Kreuzworträtsel (das ist eigentlich der wesentliche Grund). Im Netz habe ich bisher außer bei http://dict.tu-chemnitz.de - immerhin ca. 110000 Worte) nichts wirklich brauchbares gefunden, die meisten Programme, die es zum kostenlosen download gibt, legen ihre Listen als verschlüsselte/komprimierte Files ab.

Hat jemand eine brauchbare Idee, wo ich sowas kriegen könnte?

Danke für jede Hilfe.

gruss
bernhard

Kannst du damit was anfangen?
http://www.funet.fi/pub/networking/security/security…

Vielen Dank!
Hi Ulli,
genau so etwas wollte ich haben.

Danke & Gruss
bernhard

Hallo Ulli

Auch wenn ich nicht danach gefragt habe: Danke.
Ich habe eben mal in Word zählen lassen: knapp über 160’000 Worte.
Weiss du etwas über die Herkunft/Verwendungszweck/Qualität dieses „Wortschatzes“?

Gruss
Peter

Weiß ehrlich gesagt nicht viel darüber. Habe die Wortliste erst vor Kurzem bei Google gefunden. Die Qualität… könnte etwas besser sein (aber auch viel schlechter :smile:). Es gibt kein ä ö ü sondern nur ae oe ue. Für Kreuzworträtsel wahrscheinlich gut…

Hallo bernhard,

Der Tipp von Ulli war ja schon mal nicht schlecht.
Ich hab da schon länger mal was ähnliches gesucht. Bei mir besteht die Problemstellung darin,
sämtliche möglichen Kombinationen von vorgegebenen 9 Buchstaben auf ihre Gültigkeit (–> Wort in deutscher Grundform) zu untersuchen.
Da mir auch 160000 Wörter noch zu wenig sind (sind ja auch bei weitem nicht alles Grundformen - das ist noch mein Problem -), hab ich ein kleines C+±Programm geschrieben, das beliebige Textdateien durchparst, nach neuen Wörtern sucht und diese alphabetisch geordnet ohne Redundanz wieder in einer Datei ausgibt. Du kannst also damit deine Wortdatenbank selbst offline ständig erweitern.
Wenn jemand Interesse hat, soll er mich anmailen, dann schick ich ihm das Programm gerne zu.
Groß
Norbert

Hallo Norbert,

so was ähnliches hab ich auch schon angestellt (bei mir allerdings in Form eines Perl 10-Zeilers - geht einfach schneller). Ich habe damit die zugegebenermaßen schon etwas veraltete Wikipedia-Version von Herbst 2004 (gibts als Download) durchsucht und kam auf eine Wortliste von etwas über eine Mio. unterschiedlichen Worten. Da ist natürlich auch ein gewisser Prozentsatz Schrott dabei (was für ein Wort ist z.B. AABBAA?), ist aber eine sehr gute Ausgangsbasis für Erweiterungen.

gruss
bernhard

Hallo Bernhard,

Danke für den Tipp, das mit dem Wiki-Download. Is a guade Idee. Ich hab das Ganze halt in C geschrieben, da ich einen sehr schnellen Zugriff auf die Begriffe wollte. Bei 9 Buchstaben gibt es immerhin ca. 410000 Kombinationen, die dann alle durchzutesten sind.

Gruß,
Norbert