Statististischer Mittelwertvergleich / (SPSS)

Hallo zusammen,

ich schreibe gerade meine Bachelorarbeit und habe ein paar kleinere Fragen bei meiner statistischen Auswertung. Hoffentlich kann mir jemand von euch helfen.

Prinzipiell vergleiche ich historische Aktienkursentwicklungen von Unternehmen mit denen vergleichbarer Indizes. Dies geschieht über drei verschiedene Industrien hinweg.

D.h. ich vergleiche 3x jeweils die Entwicklung der Unternehmen einer Industrie mit einem Index (jeweils jährlich, in der Stichprobe befinden sich jeweils ca. 30-80 Unternehmen) und überprüfe die Hypothese, dass die Industrieunternehmen sich besser entwickelt haben als der Index. Hierfür reicht daher ein einseitiger t-Test, oder? Welche anderen Tests könnte ich noch verwenden (ich besitze SPSS, kenne das Programm aber noch nicht wirklich und muss die Auswertung schnell durchführen, daher reichen mir die simpelsten Tests, um erst einmal zu Ergebnissen zu kommen)?

Am Ende möchte ich auch schauen, ob es zwischen den Industrien untereinander Unterschiede gibt. Bisher habe ich mir überlegt, dass ich einfach die signifikanten Abweichungen aus der vorherigen Überprüfung zusammenzähle und dann „Pi-mal-Daumen“ zu einem Ergebnis komme. Habt ihr eventuell Vorschläge, wie man dies wissenschaftlich fundierter untersuchen könnte? Prinzipiell hätte ich als Daten 4-5x (4-5x jährliche Entwicklungen) die Abweichungen jeder Industrie gegenüber dem vergleichbaren Index. Hiermit komme ich aber nicht zu einem statistischen Test, bzw. zu keinem mit verwertbarem Ergebnis, oder sehe ich dies falsch?

Würde mich wirklich sehr über eure Kommentare freuen, da ich gerade doch ein wenig hilflos bin.

Hi,

D.h. ich vergleiche 3x jeweils die Entwicklung der Unternehmen
einer Industrie mit einem Index (jeweils jährlich, in der
Stichprobe befinden sich jeweils ca. 30-80 Unternehmen) und
überprüfe die Hypothese, dass die Industrieunternehmen sich
besser entwickelt haben als der Index. Hierfür reicht daher
ein einseitiger t-Test, oder?

das kommt drauf an, wie schief die Verteilung der Werte aus den Unternehmen ist. schau dir mal probehalber ein Histogramm an. denn die Fallzahl reicht nicht unbedingt aus, um auf Normalverteilung schließen zu können. Alternativ kann man auch mit einem Wilcoxon auf einen Lokationsunterschied testen.

[…] kenne das Programm aber noch
nicht wirklich und muss die Auswertung schnell durchführen,
daher reichen mir die simpelsten Tests, um erst einmal zu
Ergebnissen zu kommen)?

das sind ganz schlechte Voraussetzungen …

Am Ende möchte ich auch schauen, ob es zwischen den Industrien
untereinander Unterschiede gibt. Bisher habe ich mir überlegt,
dass ich einfach die signifikanten Abweichungen aus der
vorherigen Überprüfung zusammenzähle und dann „Pi-mal-Daumen“
zu einem Ergebnis komme.

das wäre nur ein sehr grober Schätzer.

Da du mehrere Jahre hast könntest du pro Jahr die Abweichung vom Index pro Unternehmen berechnen und aus diesen Daten einen mittleren Gesamtverlauf für die Industrie schätzen. diese Verläufe müsstest du dann miteinander vergleichen. Je nachdem was für ein Verlauf sich ergibt gibts dann verschiedene Möglichkeiten.

Grüße,
JPL

Danke JPL für deine Antwort.

Ich habe mir nun Histogramme angeschaut und würde aus diesen schon schließen, dass es sich um eine Normalverteilung handelt.

Beim Vergleichen der Mittelwerte zwischen den Unternehmen und den Industrieportfolios komme ich jedoch auf keine Signifikanz (p-Wert liegt bei max 0,113 zweiseitig, sonst immer höher), obwohl die Mittelwerte stark verschieden sind (z.B. 111,6% vs. 13,58%, N jeweils =37). Das liegt vermutlich an starken Abweichern, d.h. Unternehmen mit starken Ausschlägen bei der Kursentwicklung (ebay im ersten Jahr 2200%). Kann ich diese sonst einfach entfernen? Eventuell mit der Begründung „Glättung der Daten“?

Hi,

Ich habe mir nun Histogramme angeschaut und würde aus diesen
schon schließen, dass es sich um eine Normalverteilung
handelt.

Das ist für eine Begründung, eine Normalverteilung zu verwenden allerdings noch etwas schwach. Wenigstens müsste dazu noch ein Test nicht signifikant seinn(shapiro-wilks > 0.1). wenn du aber extreme Werte hast, dann hast du auch eher „heavy tails“, was eher nach einer t-Verteilung riecht.

Beim Vergleichen der Mittelwerte zwischen den Unternehmen und
den Industrieportfolios komme ich jedoch auf keine Signifikanz
(p-Wert liegt bei max 0,113 zweiseitig, sonst immer höher),
obwohl die Mittelwerte stark verschieden sind (z.B. 111,6% vs.
13,58%, N jeweils =37).

Sind die Werte immer positiv? Ich dachte, du vergleichst die Unternehmen eines Industriezweigs mit einem Prognosewert?

Das liegt vermutlich an starken
Abweichern, d.h. Unternehmen mit starken Ausschlägen bei der
Kursentwicklung (ebay im ersten Jahr 2200%). Kann ich diese
sonst einfach entfernen? Eventuell mit der Begründung
„Glättung der Daten“?

Nein. Das wäre „Schönrechnen“ und ist in keiner Weise zu empfehlen.
Ich würde eher darauf tippen, dass du mometan noch mit dem falschen Test eine etwas unklare Fragesellung zu beantworten versuchst.

Grüße,
JPL

Wow, ich bin begeistert über die Top-Hilfe, die man hier bekommt! Vielen Dank nochmals JPL.

So langsam muss ich mich ja doch immer weiter in SPSS fuchsen, ist aber immer noch alles sehr fremd. Den Shapiro-Wilks habe ich z.B. gerade gemacht (glaube ich - Analysieren/Deskriptive Statistiken/P-P Diagramme), dort aber keinen Wert angegeben bekommen, sondern jeweils für t-Verteilung und Normalverteilung Grafiken, in denen angezeigt wurde, wie stark die Verteilung meiner Daten von der idealen Verteilung abweicht, was leider relativ groß aussah.

Die Werte sind nicht immer positiv, es kommt auch öfter vor, dass die Unternehmen (oder auch der Industrieindex) eine negative Entwicklung hatten.

Ich bin derzeit leider zugegebenermaßen ziemlich verloren, obwohl ich merke, dass du mich stark auf die richtige Fährte zu führen versuchst. Wenigstens eine Sache habe ich gelernt: Beim nächsten Mal mit der Datenauswertung früher beginnen.

So langsam muss ich mich ja doch immer weiter in SPSS fuchsen,
ist aber immer noch alles sehr fremd. Den Shapiro-Wilks habe
ich z.B. gerade gemacht (glaube ich - Analysieren/Deskriptive
Statistiken/P-P Diagramme), dort aber keinen Wert angegeben
bekommen, sondern jeweils für t-Verteilung und
Normalverteilung Grafiken, in denen angezeigt wurde, wie stark
die Verteilung meiner Daten von der idealen Verteilung
abweicht, was leider relativ groß aussah.

Ah, jetzt habe ich die Signifikanzangabe gefunden (Analysieren/Deskriptive Statistiken/Explorativ…). Dort erhalte ich Werte, die definitiv unter 0,1 sind (es wird immer 0,00 angegeben…). Das hilft mir jetzt aber natürlich auch nicht groß weiter…

Hi,

Ah, jetzt habe ich die Signifikanzangabe gefunden
(Analysieren/Deskriptive Statistiken/Explorativ…). Dort
erhalte ich Werte, die definitiv unter 0,1 sind (es wird immer
0,00 angegeben…). Das hilft mir jetzt aber natürlich auch
nicht groß weiter…

Das zeigt eine sig Abweichung von der Verteilung an => man sollte nicht unbedingt einen t-test / ANOVA verwenden.
Grüße, JPL

Wow, ich bin begeistert über die Top-Hilfe, die man hier
bekommt! Vielen Dank nochmals JPL.

Gerne :smile:

Ich bin derzeit leider zugegebenermaßen ziemlich verloren,
obwohl ich merke, dass du mich stark auf die richtige Fährte
zu führen versuchst. Wenigstens eine Sache habe ich gelernt:
Beim nächsten Mal mit der Datenauswertung früher beginnen.

Das ist schon mal gut, im Moment muss aber die Auswertung für die gegenwärtigen Daten her.
Bisher versteh ich das so: die Unternehmen bilden Gruppen (industrie) für die es einen Wert gibt, den sei erreichen sollten. Verschiedene Gruppen haben verschiedene Werte, pro Gruppen gibt es 30-80 Unternehmen.
Richtig?
Grüße,
JPL

Bisher versteh ich das so: die Unternehmen bilden Gruppen
(industrie) für die es einen Wert gibt, den sei erreichen
sollten. Verschiedene Gruppen haben verschiedene Werte, pro
Gruppen gibt es 30-80 Unternehmen.
Richtig?
Grüße,
JPL

Ja, genau. Es gibt drei Gruppen (d.h. Industrien, in casu „Medical Equipment“, „Healthcare“ & „Retail“) mit zugeordneten Unternehmen (86, 37, 37). Dem Kursverlauf jedes Unternehmens wurde ein Index zugeordnet (d.h. z.B. DAX, im konkreten Fall aber ein Portfolio aus Unternehmen derselben Industrie zur besseren Vergleichbarkeit).

Vergleichen möchte ich jetzt den Mittelwert der beispielsweise 37 Retail Unternehmen in ihrem ersten Jahr nach Börsengang mit dem Mittelwert des zugeordneten Index und diesen auf Signifikanz testen.

Für Retail beispielsweise sehen die Mittelwerte wie folgt aus:

Alter / Unternehmen / Index
1 Jahr nach IPO: 111,6% / 13,58% (n=37)
2 Jahre: 46,21% / 14,6% (n=32)
3 Jahre: 5,58% / 7,91% (n=32)
4 Jahre: 25,61% / 7,83% (n=29)
5 Jahre: 22,29% / 17,33% (n=28)

Hi,

Für Retail beispielsweise sehen die Mittelwerte wie folgt aus:

Alter / Unternehmen / Index
1 Jahr nach IPO: 111,6% / 13,58% (n=37)
2 Jahre: 46,21% / 14,6% (n=32)
3 Jahre: 5,58% / 7,91% (n=32)
4 Jahre: 25,61% / 7,83% (n=29)
5 Jahre: 22,29% / 17,33% (n=28)

okay - hast du für den Index nur den Mittelwert oder auch die einzeldaten?
Ein paar Überlegungen:

  1. es gibt keine weiteren zu berücksichtigenden Variablen
  2. Die Werte sind zwar %, sind aber nicht auf Werte zwischen 0 und 100 beschränkt, sondern können jeden reellen Wert annehmen.
  3. du willst keinen Vergleich übe den Verlauf, sondern einzeln in den Jahren
  4. Für den iIndex gibt es auch Einzeldaten

also: aus 4) und 3) folgt, dass es ein zweistichproben-problem ist, aus 2), dass diese metrisch sind und aus 1) dass man das relatov einfach halten kann. Da die abweichung von einer Normalverteilung vorliegt und 1) die Sache sehr vereinfacht, kannst du auch schlicht einen wilcoxon-test rechnen (äquivalent zu einem Mann-Whitney). Der ist zwar nicht nur sensitiv gegenüber Veränderungen der Lage, sondern auch der Streuung, wäre hier aber der einfachste Weg.
Komplexeres geht natürlich auch … :smile:
Viele Grüße,
JPL

Danke danke!! Vor allem „einfach“ klingt sehr gut :wink:

Ich werde mich jetzt einmal mit den Sachen befassen und herumprobieren und dann auf jeden Fall noch einmal Feedback schreiben.