Ruby: Datei verarbeiten auf UTF-8
Von: , Frage gestellt am Do, 16. Jul 2009
Hallo,
ich habe hier ein Ruby-Programm, welches mir aus einer XML-Datei Texte extrahiert und sie mir in einer Excel-Datei sowie in Po/MO-Datei ablegt.
Folgendermaßen geschieht das:
- Einlesen einer XML-Datei
- Herauslesen bestimmter Attribute
- Füllen einer Excel-Datei mit den Attributen (Win32OLE-Interface)
- Füllen einer PO-Datei mit den Attributen (Dabei wird eine Übersetzung durch Hinzufüghen von Buchstaben wie z.B. landestypische Sonderzeichen "simuliert")
- Generieren der MO-Datei durch Aufrufen von POedit
(Testen des "Wörterbuchs" in der Software und der Software mit dem Wörterbuch, bzw. Weitergabe des Excels an das "echte Übersetzungs-Büro")
Nun habe ich ein Problem mit der Codierung der Umlaute und Sonderzeichen:
Die Quell-Excel-Datei ist meistens ISO-8859-1 (und nur im Ausnahmefall UTF-8)
Ist die Quell-Datei UTF-8-codiert, hat Excel ein Problem mit der Darstellung (oder wie kann ich da UTF8 einstellen?)
Die Software erwartet eine MO-Datei, welche UTF-8-codiert ist.
Dafür muss auch die Po-Datei UTF-8_codiert sein.
Hat jemand nen einfachen Tip?
Danke vielmals
Winni
