Verteilung zweier Listen

Hallo,

ich habe zwei Listen an Werten, deren Verteilung ich ermitteln und vergleichen möchte. Das Ziel ist es, mit einer gewissen Sicherheit zu sagen, dass die Listen dasselbe ausdrücken (eine gleiche oder sehr ähnliche Verteilung haben) oder nicht.

Ich habe bspw. zwei Listen, welche Kleidergrößen enthalten, die eine jedoch in cm und die andere in inches. Mit einem Computerprogramm soll überprüft werden, ob die beiden Listen wohl dasselbe meinen, also beide Kleidergrößen speichern.

Beispiel:
Liste1: 75, 80, 75, 90, 100, 95, 75, 80, 75
Liste2: 32, 30, 34, 40, 36, 30, 32

Liste1: AVG = 82.7 cm
Liste2: AVG = 33.4 in (bzw. 83.5 cm)

Das Programm soll am Ende vorschlagen, dass die Listen wohl dasselbe ausdrücken und es etwa gilt: Liste2 = (2,5) * Liste1.

Mein bisheriger Ansatz war, Minimum, Maximum und Durchschnitt jeder Liste zu bestimmen und zu schauen, wie weit der Durchschnitt jeweils von Minimum und Maximum entfernt ist.

Also Liste1: (70, 82.7, 100) -> 7.7 : 17.3 = 0.445
Und Liste2: (30, 33.4, 40) -> 3.4 : 6.6 = 0.515

Wenn ein gewisser Schwellwert nicht überschritten wird (z.B. Differenz

Dupletten entsorgt und Listen angelichen. Oder wie sollen die Listen sonst interpretiert werden? Was heißt in diesem Zusammenhang Verteilung?
Voschlag: Lineare Regression und betrache das Bestimmheitsmaß

y = 2,6014x - 1,4865
R² = 0,9316

Also ein recht hoher linearer Zusammenhang…