Hallo,
ich möchte endliche Mengen von Zeitstempeln miteinander vergleichen.
Die Zeitpunkte verschiedener Mengen können durchaus „durcheinander“ liegen.
Ein Beispiel:
Menge A: { 01-11-2008 06:15, 02-11-2008 17:12, 02-11-2008 21:45 }
Menge B: { 01-11-2008 06:12, 02-11-2008 17:10, 02-11-2008 22:00 }
Menge C: { 01-11-2008 10:45, 02-11-2008 19:00, 02-11-2008 21:00 }
Die Mengen A und B sind offensichtlich sehr ähnlich. A und C sowie B und C sind auch relativ ähnlich, aber nicht so stark wie A und B. Nun brauche ich dafür noch ein Maß, um mir die Ähnlichkeit bzw. Distanz der Mengen berechnen zu können.
Ein Möglichkeit dies zu tun, ist die Hausdorff-Metrik. Diese berechnet den Abstand so, dass für jeden Punkt der einen Menge der Abstand zum dichtesten Punkt der anderen Menge berechnet wird. Und am Ende wird aus dieser Menge der dichtesten Abstände der Maximalwert benommen.
Dies gefällt mir nicht so gut, da einzelne Ausreißer so das Ergebnis bestimmen. Eher würde ich den Durchschnitt aus den Abständen berechnen. Dafür wäre es gut zu wissen, ob es bereits solche Metriken gibt. Ich habe leider außer der Hausdorffmetrik nicht viel gefunden, weiß aber auch nicht, nach welchen Begriffen man da am besten suchen kann.
Kennt sich jemand damit aus?