Hallo,
vielen Dank für den Tipp mit der ispell-Datei.
Hier habe ich nun auch unter /usr/src/dicts/igerman98-20021114 eine Datei namens „all.words“ gefunden, die ich nun am Editieren bin.
Hierzu habe ich mich mit sed beschäftigt und mit dem Befehl
sed '{s#v#V#g;s#w#W#g;s#x#X#g;s#y#Y#g;s#z#Z#g;}' woerters \> woerter
(für alle anderen Buchstaben ebenfalls durchgeführt, weil ich in der manpage keine kürzere Form entdecken konnte) in der Datei nun alle Kleinbuchstaben durch Grossbuchstaben ersetzt.
Mit dem Befehl sort habe ich mich ebenfalls schon beschäftigt, weil ich eigentlich dachte, dass man mit diesem erreichen könnte, dass die einzelnen Zeilen mit den Buchstaben nun so sortiert werden könnten, dass nach den dreibuchstabigen Wörtern die vierbuchstabigen folgen.
Der „normale“ Aufbau einer xscrabble-Wörterbuchdatei sieht ja so aus:
AA
AB
..
BI
..
DA
..
AAL
AKT
..
BAD
BAR
..
AALE
..
BADE
..
So hätte ich also nun gerne zunächst alphabetisch sortiert die Wörter mit 2 Buchsaben, dann ebenfalls alphabetisch die mit 3, 4, 5, … Buchstaben.
Geht das mit „sort“?
Weiterhin enthält meine Datei Umlaute, die so dargestellt werden:
Für „DRÜCKEN“ steht dort „DRU"CKEN“.
Wie kann ich alle Wörter komplett entfernen, die ein Anführungszeichen enthalten? Vor allem steht hier ja das " nicht immer an der gleichen Stelle, so dass ich nicht mit sed und ^ oder $ arbeiten kann…
Ausserdem stehen hinter manchen Wörtern noch Buchstaben, die auf einen Schrägstrich folgen, zB ABDROSSELN/DIXY. Wie kann ich diesen letzten Teil inklusive Schrägstrich entfernen? Müsste ja dann der gleiche Befehl wie oben bei den Anführungszeichen sein, nur dass nicht das ganze Wort entfernt wird, sondern nur dieser letzte Teil. Konnte diesbezüglich nichts mit sed oder cat finden…
Was übrigens die Buchstabenverteilung im Spiel angeht, so habe ich herausgefunden, dass sich die Datei „XScrabble_en“, die nach dem Entpacken des englischen Sprachpaketes im Verzeichnis /xscrabble_en/app-defaults liegt, problemlos entsprechend anpassen lässt. Dort ist festgelegt, wie die Buchstabenhäufigkeit ist und welcher Buchstabe welchen Wert hat.
Leider habe ich noch nicht herausgefunden, wie man die deutschen Umlaute Ä, Ö, Ü richtig einbinden kann, da das irgendwie von der Shell oder dem verarbeitenden Programm falsch bzw. überhaupt nicht erkannt wird und als Fehlermeldung endet.
Würde mich über Hilfestellung freuen,
Grüsse
schuelsche