Welcher t-test

Hallo allerseits,

Ich habe zwei verschiedene Sets an Daten sagen wir X und Y.
für X habe ich 20 Messwerte für Y sagen wir 7.
Die Daten sind Finanzdaten und werden in zeitlichen Abständen gemessen. Prinzipiell messen X und Y den gleichen Sachverhalt. Y sind dabei die 7 neusten Messwerte und X sind alle bisherigen Messwerte. Mehr als die 20 Messwerte von X (und die 7 von Y) gibt es aber nicht.

Da sich Finanzmärkte im Zeitablauf verändern ist nicht klar, ob Y noch auf der gleichen Verteilung liegt wie X. Man nennt dies Strukturbruch an den Finanzmärkten. Ich möchte nun mittels Y und X testen, ob sich ein Strukturbruch ergeben hat. Der Strukturbruch wäre deutlich daran zu erkennen, dass sich die Mittelwerte zwischen X und Y unterscheiden würden. Es gibt jetzt allerdings einige Dinge zu beachten

  • Für Y besteht die starke Vermutung dass es normalverteilt ist, könnte aber auch anders sein (z. B. Schief)
  • Y kann eine ähnliche Varianz wie X haben, könnte aber auch unterschiedlich sein

Meine Frage wäre nun mit welchem t-test ich das jetzt testen könnte. Ich habe 2 Stichproben, sie könnten mit gleicher Varianz oder mit unterschiedlicher Varianz sein. Es sind zwar 2 Stichproben aber sie gehören nicht unbedingt zu unterschiedlichen Grundgesamtheiten…

Hoffe auf eure Ideen!

Hi,

am sichersten und unter ausnutzung der maximalen Info machst du einen unverbundenen (unabhängigen) 2-Stochproben t-test für unterschiedliche Varianzen* und Stichprobengrößen.

Einziger Haken könnte sein, dass X und Y nicht unabhägig sind. Dann kannst du nur auf einen gepaarten t-test (mit unterschiedlichen Vars) zurückgreifen. Der ist identisch dazu, von den paarigen Werten die Differenzen zu bilden und einen 1-stichproben-t-test zu machen.

* das sollte man soweiso immer machen, weil die annahme ‚gleicher‘ Vars meistens eh nicht stimmt und man sich die ganze Vortesterei auch sparen kann, wenn man eben einen kleinen Bruchteil der Freiheitsgrade dafür opfert einen sog. welch-test zu machen - also gleich unterschiedliche Vars annimmt.

Viele Grüße,
JPL

Hi Jpl,

danke meine Überlegungen gingen auch in die Richtung. Ein Punkt an dem ich aber nohch etwas hänge ist: wann ist eine Grundgesamtheit eigentlich eine Grundgesamtheit?

Kommt es darauf an alle Werte zu beinhalten? Schließlich sind die 20 Werte ja alle. Oder kommt es auf eine gewisse Größe an? (Da sind 20 natürlich wenig)…

Grüße…

Hi,

danke meine Überlegungen gingen auch in die Richtung. Ein
Punkt an dem ich aber nohch etwas hänge ist: wann ist eine
Grundgesamtheit eigentlich eine Grundgesamtheit?
Kommt es darauf an alle Werte zu beinhalten?

Ja. Quasi eine Vollerhebung.
Ob die aber vorliegt kann manchmal etwas schwer zu beantworten sein.
Wenn ich eine Studie über meine Whiskysorten machen will, sind alle meine Flaschen (auch die vergangenen?) die Vollerhebung, möche ich eine Aussage über die Sammlungen aller Wer-weiss-was-user machen bin ich bestenfalls eine kleine Stichprobe. Selbst wenn man nun alle user befragt, bleibt dann noch offen, was mit den passiv-lesern ist.
Man kann also im seltensten Fall von einer Vollerhebung ausgehen, es sei denn man schränkt ganz dediziert auf eben diese Stichprobe ein.

Viele Grüße,
JPL