Wortlisten

Hallo,

Gibt es irgendwo Listen mit sehr vielen Wörtern?
So 100.000 bis 300.000 deutsche Wörter.
Sowas brauche ich, um z.b. ein Lexikon zu erstellen oder
um sowas wie eine Volltextsuche mit „Richtige Frage eingeben“
Mechanismus zu entwickeln.

Für Links wäre ich dankbar.

Franz

Gibt es irgendwo Listen mit sehr vielen Wörtern?
So 100.000 bis 300.000 deutsche Wörter.
Sowas brauche ich, um z.b. ein Lexikon zu erstellen oder
um sowas wie eine Volltextsuche mit „Richtige Frage eingeben“
Mechanismus zu entwickeln.

Volltextsuche ???
„Richtige Frage eingeben“ ???

wozu brauchst du denn da eine blanke Wortliste?

Das soll doch nicht etwa n brute force werden oder was?

cu
Steffen

Hi,

Gibt es irgendwo Listen mit sehr vielen Wörtern?
So 100.000 bis 300.000 deutsche Wörter.

Da faellt mir der Linux-Spellchecker Ispell ein. Das ist ein Linux-Standard-Tool zur automatischen Rechtschreibpruefung.
Entweder kannst Du das Tool direkt verwenden, oder lediglich die dazugehoerigen dictionaries benutzen. Ich weiss zwar nicht, in was fuer einem Format die vorliegen, aber das ganze duerfte open-source sein, so dass Du wohl zumindest auch gleich die Datenbank-Suchalgorithmen aus Ispell verwenden kannst.
Wenn Du natuerlich ein proprietaeres Produkt entwickeln willst, musst Du eh selbst ein Woerterbuch eintippen, oder kaufen , so Du denn keine Copyrights verletzen moechtest.

Für Links wäre ich dankbar.

http://ficus-www.cs.ucla.edu/ficus-members/geoff/isp…

Gruss

Thorsten

Hi!

Volltextsuche ???
„Richtige Frage eingeben“ ???

Ich gehe mal davon aus, dass du nicht weisst, was das ist.
Das funktioniert so:

Du gibst dem Anwender die Möglichkeit, eine normale Frage
einzugeben, eben wie Menschen das tun, wenn sie einen anderen
Menschen fragen. Daraus filtert das Progarmm dann Stopwörter
wie der, die das, wie, welche usw.
Dann bleiben nur bestimmte Wörte übrig, die dann zur weiteren
Suche verwendet werden.

wozu brauchst du denn da eine blanke Wortliste?

Damit ich nicht selbst tippen muss.

Das soll doch nicht etwa n brute force werden oder was?

Klar kann man damit auch sowas machen und ich habe erwartet,
dass so eine Frage kommt. Aber wenn ich sowas brauchen würde,
dann würde ich woanders danach suchen. Ausserdem habe ich
bestimmt besseres zu tun.

Franz

wozu brauchst du denn da eine blanke Wortliste?

Damit ich nicht selbst tippen muss.

ich hatte mal ein uralt Deutsch-Englisch-Übersetzer. Die Wörter waren in einer Excel-Tabelle oder Textdatei abgelegt. Jedenfalls mit wenig Aufwand lesbar.

Also ich würde so vorgehen, dass ich nach ganz alten DOS-Übersetzungs oder Rechtschreibprogrammen suchen würde. Da sollte sich eine ganze Menge im Internet finden glaub ich. Dann musst du nur solange suchen, bis du eine unkomprimierte Wortliste findest. Vielleicht hast du ja Glück, da ich sowas hatte, muss es ja sowas geben…

Klar kann man damit auch sowas machen und ich habe erwartet,
dass so eine Frage kommt. Aber wenn ich sowas brauchen würde,
dann würde ich woanders danach suchen. Ausserdem habe ich
bestimmt besseres zu tun.

Sorry, aber ich musste diese Frage stellen, hab einfach kein Bock irgendwelche Hacker zu unterstützen.

cu
Steffen

Hallo, Franz,

vielleicht kommst Du damit weiter:
http://wortschatz.uni-leipzig.de/index_js.html

Gruß
Chris

Danke!
Hallo,

Danke an alle. Leider hat es mir bisher noch nicht viel gebracht. Die Links waren zwar interessant, jedoch fand ich dort nichts brauchbares. Der Tipp mit dem Spell-Checker von
Linux war gut. Das Format, in dem das ganze gespeichert ist,
ist mir jedoch fremd und der Aufwand, mich da rein zuarbeiten
zu groß.

Ich werde wohl selbst ein Programm schreiben müssen und mit Texten füttern, um die Wörter zu extrahieren.

Franz

Hallo Franz!

Ich habe mal ein Programm geschrieben, das aus eine Textdatei alle einzelnen wörte herausfiltert (jedes Wort kommt nur einmal vor) Alphabetisch sortiert und in einer Textdatei ablegt.
Wenn du das bauchen kannst, dann mail ichs dir.

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo!

Vielen Dank für das Angebot. Ich kann und werde das aber auch
selbst mal in Angriff nehmen.
So ein Prg. zu schreiben ist bestimmt nicht schwer, aber das „füttern“ mit Textdateien ist bestimmt nicht so einfach.
Woher soll ich die Textdateien nehmen? Das ist viel arbeit.
Und die wollte ich mir ersparen.

Gruß, Franz

Ich habe mal ein Programm geschrieben, das aus eine Textdatei
alle einzelnen wörte herausfiltert (jedes Wort kommt nur
einmal vor) Alphabetisch sortiert und in einer Textdatei
ablegt.
Wenn du das bauchen kannst, dann mail ichs dir.