Fragen zur Statistik, bitte um Hilfe

Kaan_G_rayer · 20. August 2010 um 20:50

Guten Tag,

ich habe sie über das Portal „Wer weiß was?“ und ich hoffe, sie können mir bei einer Statistik-Frage behilflich sein.

Es geht darum, dass ich einzelne Stadtteile bewerten möchte.

Die Bewertungskriterien sind:

* Jahreseinkommen
* Altersstruktur, also wie viel Prozent von 30 bis 59 jährige leben im besagten Stadtteil?
* Arbeitslosigkeit

Beim Jahreseinkommen gibt es 10 Stufen:

Bis 25.000 Euro

2 -> 25.643 bis 30.037 Euro

3 -> 30.037 bis 34.431 Euro

4 -> 34.431 bis 38.828 Euro

5 -> 38.828 bis 43.062 Euro

6 -> 43.062 bis 47.296 Euro

7 -> 47.296 bis 51.530 Euro

8 -> 51.530 bis 55.764 Euro

9 -> 55.764 bis 60.000 Euro

ab 60.000 Euro

Das Durchschnittseinkommen liegt übrigens bei 38.828 Euro.

Beim Alter gibt es 5 Stufen, wie viel in Prozent 30 bis 59 jährige in einem Stadtteil leben:

Bis 40 %

2 -> 40 bis 43 %

3 -> 43 bis 46 %

4 -> 46 bis 50 %

ab 50 Prozent

Der Durchschnitt für die gesamte Stadt liegt bei 45,62 Prozent.

Die Daten für die Arbeitslosigkeit, also die Quoten für die gesamte Stadt und die einzelnen Stadtteile, habe ich noch nicht. Die werde ich wahrscheinlich am Montag bekommen.

Nun zur eigentlichen Frage:

Ich möchte einen Score pro Stadtteil erstellen. Dabei soll das Jahreseinkommen 70 Prozent des Scores ausmachen, die Arbeitslosigkeit 20 Prozent und die Altersstruktur 10 Prozent.

Aber ich weiß nicht, wie ich das machen soll?

Wenn Sie bis hierher gelesen haben, erstmal ein Dankeschön dafür.
Vielleicht haben Sie auch eine passende Antwort für mich.

Mit freundlichen Grüßen!

Michael_R_E_Menzel · 21. August 2010 um 10:28

Hallo Statistik-Anfrager,
leider kann ich bei der gestellten Anfrage nicht helfen, da ich mich mit Sportstatistik beschäftige. Siehe auch www.olympische-flamme.de
Freundliche Grüße
Michael Menzel

JPL · 21. August 2010 um 11:27

Hi Kaan,

die einafchste Möglichkeit bestünde, wenn man die Daten nicht kategorisiert hätte, sondern die tatsächlichen Werte. Dann würde sich das gewünschte score einfach als das gewichtete Mittel ergeben. Wegen der Klassen kann man hier nur einen Modus-score anwenden. D.h. man sucht sich in jeder Skala den häufigste kategorie heraus und rechnet damit das oben beschriebene Mittel.
Viele Grüße,
JPL

Danie_hundt · 22. August 2010 um 13:04

Hallo,

mir würden 3 sehr leichte Berechnungswege einfallen. Vorher jedoch einige Fragen zum Verständnis.

Liegen die Daten nur aggregiert vor? Dann könntent Sie Probleme durch die unterschiedlichen Skalen bekommen.
Bei jeder Berechnung von Indices (wie auch Scores) kann man durch verschiedene Einzelwerte auf den selben Gesamtwert kommen. Das heißt, gleicher Score bei unterschiedlicher Sozialstruktur. Hier halte ich es für fraglich, ob dies der Sozialstrutur gerecht wird.
Bedingt nicht eine hohe Arbeitslosenquote auch ein geringes Durchschnittseinkommen? Hier waären Verzerrungen zu erwarten.

Wenn Sie mit evtl. die vollständige Forschungsfrage schildern, könnte ich hier mehr zu sagen.

Nun zu den Rechenwegen. Aufgrund der o.g. Fragen, weiß ich nicht ob diese tatsächlich adäquat sind.

Berechnung des Scores anhand des Kategoriewerts:

Hierzu sollten alle Variablen die gleiche Skalenlänge haben (z.b: 1-10). Liegen die Daten nur in aggregierter Form vor, geht das natürlich nicht, bzw. nur mit Verzerrung.

Score= (Kategorie1*0,7)+(Kategorie2*0,2)+(Kategorie3*0,1)

Der Score liegt dann zwischen 0 und 1.

Berechnung durch Abweichung vom Mittelwert (bei aggregierten Daten vom Median)

Score = ((x1(MW)-x1)*0,7)+((X2(MW)-x2)*0,2)+((x3(MW)-x3)*0,1)

Liegen alle Werte am Mittelwert (Median) ist der Score 0. ansonsten kann der Score Werte zwsichen -1 und 1 annehmen.

Berechnung durch die Abweichung vom Maximum
Wie 2. nur anstatt MW x(max). Der Score kann Werte zwischen -1 und 0 annehmen.

Alle Indices können natürlich leicht umberechnet werden, so dass sie Werte zwischen 0-100, etc. annehmen. Wichtig ist bei allen, dass klar ist, welcher Wert gut und welcher schlecht ist und das die Reihenfolge bei allen Variabloen die gleiche ist (1-gut, 10-schlecht).

Viel Spaß

Andreas_Kladroba · 22. August 2010 um 15:57

Hallo,

bekanntermaßen gibt es nicht die eine Methode zur Erstellung von Ratings, so dass eine Darstellung hier relativ problematisch wäre. Ich würde als Literatur empfehlen:

Kladroba, Statistische Methoden zur Erstellung und Interpretation von Rankings und Ratings, VWF, Berlin, 2005

Das Buch ist allerdings nur über Bibliotheken oder direkt über den Verlag zu beziehen.

Herzliche Grüße

Andreas

StefanieMichaela · 22. August 2010 um 19:55

Hallo,

also unächst müssen alle drei Bewertungskriterien die selbe Skala haben. Dazu sollten, nachdem für jede Statt die Werte fest liegen, diese z-transformiert werden. das geht so: (Wert - Mittel)/ standardtabweichung. oder in SPSS.

dann den wert, der 70% haben soll mal 7 rechnen, der der 20% eingehen soll mal 2 usw… dann alle zusammenzählen und durch 10 rechnen. Dann müsstest du den Score haben…

Beste Grüße!

Kaan_G_rayer · 23. August 2010 um 01:36

Hallo, trotzdem vielen Dank!

Viele Grüße!

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Kaan_G_rayer · 23. August 2010 um 01:39

Hallo, viele Dank für die Antwort.

Schönen Gruß,

Kaan_G_rayer · 23. August 2010 um 01:48

Hallo, erstmal Danke für die Antwort. Ich muss gestehen, ich habe eigentlich sehr wenig verstanden.

Aber ich bin auf eine eigene Idee gekommen und zwar gebe ich dem Jahreseinkommen, welches 70 Prozent ausmachen soll, auch nur 70 maximal zu erreichende Punkte. Ich hatte ja vorher schon die Kategorien, also bis 25.000 bis maximal 60.000 Euro und alles dazwischen.

Dann hätte Kategorie bis 25.000 Euro die Punktzahl 7, die nächste 14 usw. bis man zur maximalen Punktzahl kommt.

Dasselbe wollte ich dann mit der Arbeitslosigkeit und dem Alter machen.

Sie haben Recht, dass Arbeitslosigkeit eigentlich auch niedrigeres Jahreseinkommen bedeutet. Das möchte ich dann nochmal nachsehen, wenn ich die Arbeitslosenzahlen habe.

Als Beispiel, weil ich ja die Zahlen des Alters schon habe, dort habe ich ja 4 Kategorien und das Alter soll maximal 10 Punkte ausmachen.

Da könnte ich doch auch einfach sagen Kategorie 1 hat zwei Punkte, Kategorie 2 vier Punkte usw. bis ich die 10 voll habe.

Was halten sie davon?

Viele Grüße!

Kaan_G_rayer · 23. August 2010 um 01:49

Hallo, erstmal Danke für die Antwort. Ich muss gestehen, ich habe eigentlich sehr wenig verstanden.

Aber ich bin auf eine eigene Idee gekommen und zwar gebe ich dem Jahreseinkommen, welches 70 Prozent ausmachen soll, auch nur 70 maximal zu erreichende Punkte. Ich hatte ja vorher schon die Kategorien, also bis 25.000 bis maximal 60.000 Euro und alles dazwischen.

Dann hätte Kategorie bis 25.000 Euro die Punktzahl 7, die nächste 14 usw. bis man zur maximalen Punktzahl kommt.

Dasselbe wollte ich dann mit der Arbeitslosigkeit und dem Alter machen.

Als Beispiel, weil ich ja die Zahlen des Alters schon habe, dort habe ich ja 4 Kategorien und das Alter soll maximal 10 Punkte ausmachen.

Da könnte ich doch auch einfach sagen Kategorie 1 hat zwei Punkte, Kategorie 2 vier Punkte usw. bis ich die 10 voll habe.

Was halten sie davon?

Viele Grüße!

Kaan_G_rayer · 23. August 2010 um 02:00

Vielen Dank für die Antwort! Schönen Gruß,

Danie_hundt · 24. August 2010 um 18:54

Das ist der Weg, wie ich ihn unter 1. beschrieben habe. Kann man also machen. Elegant ist allerdings anders.

Anmerken sollte man aber, dass die Variablen mit der stärksten Gewichtugn auch die längste Skala haben sollte, da sonst Verzerrungen drohen.

Janetzko_Hans_Dieter · 30. August 2010 um 11:34

Hallo,

darauf gibt es drei Antworten.

Anmerkung. Hier werden Äpfel und Birnen und Pflaumen zusammengeworfen und eine Erdbeermarmelade soll herauskommen. (Die zweite und dritte Größe sind Prozentzahlen, die zwischen 0 und 100 liegen können, obwohl ein Stadtteil mit einer Arbeitslosenquote von über 30% ist wegen der Definition der Arbeitslosigkeit zur Aufnahme in der Statistik illusorisch!

Erstens: Wenn ich nur eine einfache Bewertung machen möchten und somit den „angenehmsten“ und den „trübsten“ Stadtteil herausfinden möchte, kann man wie folgt vorgehen: Man benote die jeweiligen Größen. Man sortiert die n Stadtteile nach dem durchschnittlichen Einkommen, vergebe Bewertungen 1, 2, …, n . Man sortiert die Stadtteile nach Altersstruktur und vergebe 1, 2, 3, …,., n Man sortiere die Stadtteile nach der Höhe der Arbeitslosigkeit und vergebe Bewertungen 1, 2, …, n. Dann hat der Stadtteil Burghausen die Plazierungen 4, 1, 8. D.h. Beim Einkommen liegt er an viert-unterster Stelle Stelle, hat die wenigsten Einwohner in der entsprechenden Altersklasse und bei der Arbeitslosigkeit liegt er auf Platz acht.
Das macht einen Score von 0.7*4 + 0.1 * 1 + 0.2*8= …
Nachteil: Extreme Ausreißer werden nicht als solche erkannt.

Zweitens: Ich bestimme für jeden Stadtteil den jeweiligen Wert und bilde dann folgende: ( „Wert des Stadtteils“ - " Durchschnittswert der Stadt")/ „Durchschnittwert der Stadt“ = „relative Abweichung“
und bilde dann 0.7* … + 0.1 * …+ 0.2 * =
kleiner Nachteil: Es gibt negative Scores. Läßt sich aber beheben. indem man den kleinsten Scor von allen Scores abzieht.

Nachteil beider Methoden: Man kann keine Theorie anwenden. Was kann der größte Scoring sein? Wie scharf werden Stadtteile getrennt ? Wie gut sind diese Scores, wenn man mit ihnen weiter arbeiten will?

Drittens: Man schaue in ein gutes Buch. Da ich kein Experte in Scoring bin, muß ich jetzt auch erst einmal nachschauen. Deswegen waren beide Vorschläge erst einmal unbeleckt der großen Theorie.

Falls das als kleine Antwort reicht, gut, wenn nicht, melde Dich bitte.

Ansonsten: ist es sinnvoll alle drei statistischen Merkmale aufsteigend zu betrachten? Sollte man nicht eines davon absteigend betrachten? oder doch nicht? Mit welcher Begründung ist es sinnvoll oder unsinnig?

MfG

H.-D.
Guten Tag,

ich habe sie über das Portal „Wer weiß was?“ und ich hoffe,
sie können mir bei einer Statistik-Frage behilflich sein.

Es geht darum, dass ich einzelne Stadtteile bewerten möchte.

Die Bewertungskriterien sind:

* Jahreseinkommen
* Altersstruktur, also wie viel Prozent von 30 bis 59 jährige
leben im besagten Stadtteil?
* Arbeitslosigkeit

Beim Jahreseinkommen gibt es 10 Stufen:

Bis 25.000 Euro

2 -> 25.643 bis 30.037 Euro

3 -> 30.037 bis 34.431 Euro

4 -> 34.431 bis 38.828 Euro

5 -> 38.828 bis 43.062 Euro

6 -> 43.062 bis 47.296 Euro

7 -> 47.296 bis 51.530 Euro

8 -> 51.530 bis 55.764 Euro

9 -> 55.764 bis 60.000 Euro

ab 60.000 Euro

Das Durchschnittseinkommen liegt übrigens bei 38.828 Euro.

Beim Alter gibt es 5 Stufen, wie viel in Prozent 30 bis 59
jährige in einem Stadtteil leben:

Bis 40 %

2 -> 40 bis 43 %

3 -> 43 bis 46 %

4 -> 46 bis 50 %

ab 50 Prozent

Der Durchschnitt für die gesamte Stadt liegt bei 45,62
Prozent.

Die Daten für die Arbeitslosigkeit, also die Quoten für die
gesamte Stadt und die einzelnen Stadtteile, habe ich noch
nicht. Die werde ich wahrscheinlich am Montag bekommen.

Nun zur eigentlichen Frage:

Ich möchte einen Score pro Stadtteil erstellen. Dabei soll das
Jahreseinkommen 70 Prozent des Scores ausmachen, die
Arbeitslosigkeit 20 Prozent und die Altersstruktur 10 Prozent.

Aber ich weiß nicht, wie ich das machen soll?

Wenn Sie bis hierher gelesen haben, erstmal ein Dankeschön
dafür.
Vielleicht haben Sie auch eine passende Antwort für mich.

Mit freundlichen Grüßen!

Kaan_G_rayer · 7. September 2010 um 13:45

Hallo, vielen Dank nochmal für ihre Antwort.

Nach reiflicher Überlegung habe ich mich entschlossen, vorläufig keine komplette Bewertung einzelner Stadtteile zu machen, sondern einfach Skalen für die jeweiligen Kriterien.

Ich möchte mich trotzdem nochmal für ihre Arbeit und ihre Mühen bedanken und verbleibe mit freundlichem Gruß.

Michael_Langecker · 8. November 2010 um 12:08

Hallo, die Frage ist zunächst, was genau am höchsten zu bewerten ist! Z.B. geringe Arbeitslosigkeit, mittlere Altersstruktur und Einkommen >60T € ?
Ausgehend davon priorisierst Du die Einzeloptionen durch (Likert Skala, z.B. 1-3-5-7-9) und multiplizierst sie dann über die verschiedenen Kategorien aus. Da reich ein EXCEL-sheet.

Macht Sinn?
Gruß, MDVTDU