Statistik zu Einwohnerzahlen

Hallo Sven,

Um was geht es Dir eigentlich?

Willst Du nun (a)

die Bevölkerungsentwicklung über einen bestimmten
Zeitraum auswerten

oder (b) prüfen,

ob die Einwohnerzahlen
über diese 60 Städte normalverteilt sind.

Wenn (a) das Problem ist, dann stellt sich mir die Frage, ob zu den verschiedenen Zeiten immer die selben 60 Städte betrachtet wurden. Wenn ja, ist das gut. Nun kann es sein, nur zwei Zeitpunkte analysiert wurden, oder dass mehrere Zeitpunkte betrachtet werden.

Bei mehreren Zeitpunkten kann man Regressionsanalysen machen, und zwar durchaus für jede Stadt einzeln. Man könnte ggf. Die Bevölkerungszahlen jeder Stadt auf den ersten Zeitpunkt normalisieren. Wenn der Zusammenhang zw. Zeit und Bevölkerung nicht linear ist, kann man die Daten ggf. transformieren, um die Zusammenhang zu linearisieren. Dann kann man die Steigungen der Regressionsgeraden vergleichen. Man kann auch gleich eine multiple Regressionsanalyse machen. Ganz primitiv und ohne jedwede Annahme über die Verteilung der Steigungen könnte man die Ergebnisse schlicht in „steigt“ (=1) und „fällt“ (=0) einteilen, und den Mittelwert daraus auf Verschiedenheit von 0.5 testen. Das geht exakt mit dem Binomialtest, bei 60 Werten darf man aber auch zur Normalapproximation greifen.

Sehr ähnlich kann man natürlich auch vorgehen, wenn man nur zwei Zeitwerte hat, wo statt den Steigungen schlicht die Differenzen betrachtet werden.

Ist hingegen (b) das Problem, verstehe ich nicht, warum du später schreibst, dass Du Größenklassen bildest. Das sagt dir ja dann nichts mehr über die Verteilung „über diese 60 Städte“ (s. oben).

Ganz allgemein kann man die Übereinstimmung einer gegebenen Verteilung mit der Normalverteilung gut mit Quantil-Quantil-Plots visualisieren

http://de.wikipedia.org/wiki/Normal-Quantil-Plot
http://www.itl.nist.gov/div898/handbook/eda/section3…
http://www.cms.murdoch.edu.au/areas/maths/statsnotes…

Formale Tests auf Abweichungen zur Normalverteilung sind (u.a.!) der Shapiro-Wilk-Test und der Kolmogorov-Smirnov-Test

http://de.wikipedia.org/wiki/Shapiro-Wilk-Test
http://www.itl.nist.gov/div898/handbook/prc/section2…

Oliver Walter sagte in W-W-W schonmal, dass Shapiro-Wilk heute wohl der bestes Test sei (/t/normalverteilung–3/2432537

LG
Jochen