Hallo,
ich habe zwei Listen an Werten, deren Verteilung ich ermitteln und vergleichen möchte. Das Ziel ist es, mit einer gewissen Sicherheit zu sagen, dass die Listen dasselbe ausdrücken (eine gleiche oder sehr ähnliche Verteilung haben) oder nicht.
Ich habe bspw. zwei Listen, welche Kleidergrößen enthalten, die eine jedoch in cm und die andere in inches. Mit einem Computerprogramm soll überprüft werden, ob die beiden Listen wohl dasselbe meinen, also beide Kleidergrößen speichern.
Beispiel:
Liste1: 75, 80, 75, 90, 100, 95, 75, 80, 75
Liste2: 32, 30, 34, 40, 36, 30, 32
Liste1: AVG = 82.7 cm
Liste2: AVG = 33.4 in (bzw. 83.5 cm)
Das Programm soll am Ende vorschlagen, dass die Listen wohl dasselbe ausdrücken und es etwa gilt: Liste2 = (2,5) * Liste1.
Mein bisheriger Ansatz war, Minimum, Maximum und Durchschnitt jeder Liste zu bestimmen und zu schauen, wie weit der Durchschnitt jeweils von Minimum und Maximum entfernt ist.
Also Liste1: (70, 82.7, 100) -> 7.7 : 17.3 = 0.445
Und Liste2: (30, 33.4, 40) -> 3.4 : 6.6 = 0.515
Wenn ein gewisser Schwellwert nicht überschritten wird (z.B. Differenz