Frage zum Huffmann Baum

Hallo zusammen,

ich beschäftige mich gerade mit der Huffman Methode zur Datenkompression und bin dabei beim „Binärbaum“ etwas am grübeln. Wie das ganze funktioniert ist mir klar, aber da gibt es einen Punkt wo ich mich fragen warum das so ist. Hier die Sache:

http://huffman.ooz.ie/?text=HUFFMANN

Wenn man auf dieser Seite das Wort „HUFFMANN“ kodiert ergeben sich die Äste folgendermaßen:

F und N sind zusammen (Weil Sie die größte Häufigkeit haben)
A und H sind zusammen und M und U sind zusammen, aber warum? Gibt es da irgendeine Reihenfolge die man beachten muss, oder könnte ich auch H und U zusammen haben und M und A? Ich weiß das die mit der kleinsten Häufigkeit immer an einem Vaterknoten zusammenhängen, da hier aber 4 Zeichen eine Häufigkeit von 1 haben, ist es doch im prinzip egal welche Zeichen an welchen Vaterknoten zusammenhängen, oder?

Hallo Fragewurm,

F und N sind zusammen (Weil Sie die größte Häufigkeit haben)

Genau!

A und H sind zusammen und M und U sind zusammen, aber warum?

Die wurden ganz einfach Alphabetisch sortiert.

Gibt es da irgendeine Reihenfolge die man beachten muss, oder
könnte ich auch H und U zusammen haben und M und A?

Es ist prinzipiell egal.

Praktisch ergibt die alphabetische Sortierung einen Vorteil, da der ASCII-Zeichensatz die Buchstaben entsprechend durchnummeriert.
Eine andere Verteilung würde zusätzlichen Softwareaufwand bedeuten und hätte keine Vorteile.

Ein Computer kennt keine Buchstaben!
Er kann nur Zahlen verarbeiten, welche irgendwie einem Zeichensatz zugeordnet sind.

MfG Peter(TOO)

Dankeschön, hat mir geholfen :smile: