Hallo CHA,
meine oberstes ziel ist es, ein skala zu erschaffen,
mit der ich messen kann, wie stark die wahrgenommene
bzw. geschätzte steuerbelastung von der tatsächlichen
abweicht.
Eben, da würde ich eine einfachen Quotienten wählen,
ganz simpel mittels Normalverteilung, grafisch einfach
darstellbar (Pareto etc.).
im zweiten schritt werde ich dann analysieren,
ob irgendwelche einflußfaktoren zu erkennen sind (zb.
medienkonsum, bildungsniveau, einkommen, etc.)
Das ist der springende Punkt! Wenn du dich apriorisch
schon von Vorurteilen leiten lässt, (das tue ich auch
zugegeben, da haben wir wohl ähnliche Erwartungen), dann
nimmst du deiner Arbeit den objektiven Charakter, weil
deine Intentionen klar erkennbar sind und deine
Konklusionen entsprechend deiner Prämisse ausfallen.
der durchschnitt der absoluten differenzen (MAD) wäre
eine einfache möglichkeit, die gewünschte kennziffer
zu berechnen.
Als ersten Schritt! Und darauf aufbauen, bzw. in die
Tiefe gehen.
ich möchte aber größere abweichungen
stärker „bestrafen“, da ich davon ausgehe, dass nur
große abweichungen einen systematischen hintergrund
haben.
(s. auch oben Vorurteile)
Das wäre der nächste Schritt, wenn du klar erkennbare
Tendenzen analysierst hast, dann kannst du diese Ausreisser
immer noch gesondert abarbeiten. Wiewohl man auch erwarten
könnte, dass auch geringe Abweichungen einen systematischen
Hintergrund haben. (z.B. Bildung, Einkommen,
ein wohlhabender Akademiker wird die steuerliche
Belastung eines Langzeitarbeitslosen nicht so falsch
einschätzen wie das umgekehrt der Fall sein wird.)
So, das wäre ein Vorurteil von mir. Wenn du das mittels
deiner empirischen Daten nachweisen kannst, kann man
damit auch herrliche logische Schlüsse und Trends,
induktiv wie abduktiv ableiten.
der RMSE (root mean square error) erfüllt genau
dieses kriterium, ist aber in der tat nicht so
anschaulich zu interpretieren.
Deshalb würde ich schrittweise vorgehen, das eine
schliesst das andere nicht aus. Und du kannst deine
individuelle Intention immer noch erfüllen.
allerdings bin ich kein statistiker und lasse
mich daher gern von einem besseren weg überzeugen! 
Es ist deine Arbeit, du kennst deine Intentionen besser als
jeder andere, lass dir nur nicht von mir dreinreden! 
Liegt die Gewichtung auf der Analyse der Ausreisser, oder
auf der der Masse? (Bei Trends werden eben
die Ausreisser am meisten bestraft, weil diese zu
vernachlässigen sind.z.B.) Willst du eine Erkenntnis für dich
selbst, oder willst du eine allgemeinverständliche
Auswertung?
Dein Beispiel unten war klar und klug, nur meine ich, dass
man das abarbeiten muss und nicht auf eine Formel bringen kann.
Schon gar nicht apriorisch! Erst einmal anschauliche Fakten schaffen.
Der RMSE wäre dann eine logisch nachvollziehbare Konsequenz und
nicht übers Knie gebrochen, ohne selbsterklärenden Charakter.
So wie unsere Diskussion hier.
Nochmals viel Erfolg und lass von dir hören!
Viele Grüße
Walden