Bei der Suche nach einem Algorithmus, um an Hand von Nach-, Vorname, Geburtsdatum und Geschlecht in einem VBA-Programm ein Pseudonym zu erzeugen, bin ich, was den Namen betrifft, auf Soundex gestoßen.
Aus dem Internet kurz ein paar Informationen dazu:
http://de.wikipedia.org/wiki/Soundex
http://www.uni-oldenburg.de/nausa/soundex.htm
„
Buchstabencodes
Ziffer: Repräsentierte Buchstaben
1: B, F, P, V
2: C, G, J, K, Q, S, X, Z
3: D, T
4: L
5: M, N
6: R
Die Vokale A, E, I, O und U, als auch die Konsonanten H, W und Y sind zu ignorieren. Erweiternd für die deutsche Sprache definiert man: Die Umlaute Ä, Ö und Ü sind zu ignorieren, das „scharfe S“ ß wird wie das einfache S als 2 codiert.
„
Beispiele: Andi=A530, Müller=M460, Miller=M460
Nun möchte ich die 6 Phonetische Klassen auf ca. 10 Klassen erhöhen und besser an die Deutsche Sprache anpassen, um mehr Möglichkeiten zu haben und eine genauere Codierung zu erreichen.
Kann mir jemand Vorschläge für eine Klassifizierung machen? Außerdem wären ein paar (überschaubare) Ersetzungsregeln interessant, z. B.:
ß in s umwandeln, oder UE in Ü (damit MUELLER = MÜLLER), AE in Ä, OE in Ö, …
Weitere Vorschläge?
Grüsse
Peter