Hausdorff-Metrix - Alternativen?

Hallo,
ich möchte endliche Mengen von Zeitstempeln miteinander vergleichen.
Die Zeitpunkte verschiedener Mengen können durchaus „durcheinander“ liegen.

Ein Beispiel:
Menge A: { 01-11-2008 06:15, 02-11-2008 17:12, 02-11-2008 21:45 }
Menge B: { 01-11-2008 06:12, 02-11-2008 17:10, 02-11-2008 22:00 }
Menge C: { 01-11-2008 10:45, 02-11-2008 19:00, 02-11-2008 21:00 }

Die Mengen A und B sind offensichtlich sehr ähnlich. A und C sowie B und C sind auch relativ ähnlich, aber nicht so stark wie A und B. Nun brauche ich dafür noch ein Maß, um mir die Ähnlichkeit bzw. Distanz der Mengen berechnen zu können.

Ein Möglichkeit dies zu tun, ist die Hausdorff-Metrik. Diese berechnet den Abstand so, dass für jeden Punkt der einen Menge der Abstand zum dichtesten Punkt der anderen Menge berechnet wird. Und am Ende wird aus dieser Menge der dichtesten Abstände der Maximalwert benommen.

Dies gefällt mir nicht so gut, da einzelne Ausreißer so das Ergebnis bestimmen. Eher würde ich den Durchschnitt aus den Abständen berechnen. Dafür wäre es gut zu wissen, ob es bereits solche Metriken gibt. Ich habe leider außer der Hausdorffmetrik nicht viel gefunden, weiß aber auch nicht, nach welchen Begriffen man da am besten suchen kann.

Kennt sich jemand damit aus?

Hi, ohne jetzt darauf eingehen zu wollen, ob die Hausdorff-Metrik dann noch eine Metrik ist, kannst du diese schon veändern. Statt
δ(A,B):= max {max{D(a,B) | a∈A} , max{D(b,A) | b∈B} }
mit D(x,K):=min {d(x,k) | k∈K} und d als euklidische Metrik kannst du auch
δ’(A,B):= max {mean{D(a,B) | a∈A} , mean{D(b,A) | b∈B} }
verwenden.

Grüße,
JPL

weietre Metriken findest du unter „Distanzfunktion“ bei
http://de.wikipedia.org/wiki/Clusteranalyse
Grüüße,
JPL

weietre Metriken findest du unter „Distanzfunktion“ bei
http://de.wikipedia.org/wiki/Clusteranalyse
Grüüße,
JPL

Hallo JPL,
vielen Dank für deine Antworten.

Dass ich mir die Metrik auch selber zurechtlegen kann, ist mir bewusst. Allerdings würde ich gerne sichergehen, ob es so eine Metrik bereits gibt.

Die unter Clusteranalyse genannten Verfahren habe ich auch schon gesehen, allerdings sind diese für meinen Fall eher weniger geeignet, da sie von zusammenhängenden Clustern ausgehen, die sie zu vereinigen suchen. Ich habe hier aber keine Cluster, bei denen ich mich z.B. auf einen (sinnvollen) Mittelpunkt beziehen könnte.

Naja, trotzdem danke! Vielleicht fällt noch jemandem was ein…