Hallo allerseits,
ich benutze verschiedene Wörterbücher für diverse Programme (Textverarbeitung und Textanalyse). Die Umlaute (ö, ä, ü) in manchen Wörterbüchern werden als (a", o", u") dargestellt. Das wird aber nicht von allen Programmen korrekt verstanden. Gibt es da einen Trick oder muss ich die Wörterbücher transformieren? Wenn ich die Wörterbücher transformieren muss werden die Umlaute dann auch richtig erkannt wenn ich z.B. auf einem Rechner mit englischer Spracheinstellung und Tastatur arbeite?
Hallo soso,
ja Du wirst die Umlaute entsprechend ersetzen müssen (sollte mit den Standard-Ersetzungsbefehlen funktionieren). Die Umlaute sind dann anders codierte Zeichen, die falls der „englische“ Rechner auch den gleichen Zeichensatz hat dort auch darstellbar sind (etwas vereinfcaht dargestellt).
Aber so nebenbei gefragt, wo gibt es denn noch Worlisten mit einer solchen Zeichensatz-Codierung?
MfG Georg V.
[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]
Hallo Georg,
die Wörterbücher hab ich hier gefunden:
http://www.openwall.com/wordlists/
Es sind Wörterbücher aus über 20 Sprachen. Die Wörterbücher gehören wohl zu einem Linux-Programm und sind in ASCII-Format. Ich hab die deutschen Wörterbücher konvertiert. Wenn ich das ASCII-Format beibehalte stimmen die Umlaute aber bei einem englischen Rechner nicht mehr. Bei manchen Sprachen weiss ich auch nicht genau wie die Sonderzeichen zu konvertieren sind da ich ja nicht alle Tastaturen zur Verfügung hab. Kann ich die Wörterbücher auch nach Unicode konvertieren und wenn ja wie (möglichst automatisch)?
Gruss Dieter