Hallo,
also wenn ich dich richtig verstanden habe, darf ich meine
Ergebnisse paaren, wenn es Gemeinsamkeiten gibt.
Und wenn die Varianz zwischen den verschiedenen „Gemeinsamkeiten“ größer ist als die Varianz durch das, was du eigentlich bestimmen willst.
die gibt es bei meinen Daten: ich habe einen Zelltyp bei
unterschiedlichen Patientengruppen gemessen. dabei habe ich
mir immer eine unstimulierte und eine stimulierte (bei allen
Gruppen gleich stimuliert) Version angeguckt.
Ein Patient -> Zellen -> splitten in 2 Kulturen -> 1 Kultur wird stimuliert, die andere nicht -> Messung beider Kulturen
Ein Patient stammt dabei aus einer von mehreren unterschiedlichen Gruppen.
Richtig?
Was ich mir gerne angucken möchte ist, ob es Signifikanzen
gibt zwischen den Gruppen bei der stimulierten Version bzw.
bei der unstimulierten Version.
Also vereinfacht ausgedrückt ob bzw. wie die Stimulation die
eine Krankheit im Gegensatz zur anderen beeinflusst.
Wenn das oben so stimmt, solltest du die WertePAARE PRO PATIENT auch paaren!
Es ist sehr wahrscheinlich, dass die Zellen von Patient A schon unstimuliert ganz andere Ergebnisse liefern als die unstim. Zellen von Patient B der gleichen Gruppe. Die Messungen für Pat.A könnten unstimuliert schon sehr hoch sein, und deine Frage ist ja, ob die Stimulation diesen Wert dann noch verändert. Das siehst du am besten, wenn du die beiden Werte von Pat. A vor und nach der Stimulation vergleichst. Dann ist nämlich egal, welchen Wert A_unstim. schon hatte, nur die DIFFERENZ (verursacht durch die Stimulation) interessiert.
Hättest du vielleicht auch eine Quelle, die ich meinem
Betreuer vorlegen könnte um ihn davon zu überzeugen, dass die
zeitlichen Messungen nicht relevant sind und ich statt
zeitlich auch andere Gemeinsamkeiten haben kann?
Mach Dir klar, dass „repeated measures Anova“ nur ein NAME ist. Genausogut kann man sagen „dependent-samples Anova“ (so wie beim „dependent-samples t-Test“). Der Ausdruck „paired-samples-Anova“ (wie „paired-amples t-Test“) ist hier nicht allgemein genug, weil man bei der Anova im Ggs. zum t-Test nicht genau 2 gepaarte werte haben muss, sondern mehrere -eben abhängige- Werte haben kann. Also, vielleicht nennst du es eine „dependet-samples Anova“, und die vor/nach-Stimulationswerte von ein und demselben Patienten sind halt „depending“.
Leider will
er mir nicht glauben und ich muss ihn davon überzeugen um
dieses Verfahren anwenden zu dürfen.
Das ist prinzipiell gut. Generell sollte man in der Lage sein, die Verwendung ALLER Methoden gut begründen zu können. Das gilt für die Mess-Methode genauso für die Methode der Stichprobenziehung als auch der stat. Analyse.
Ich hatte dir Links gesendet. Hast du die Sachen gelesen? Ansonsten nimm bitte ein Statistikbuch zur Hand, da steht sowas drin. Schau auch mal hier: http://faculty.vassar.edu/lowry/ch12pt1.html
noch eine weitere Frage hätte ich:
innerhalb der Gruppe würde ich um den Wert für die
Stimulierten mit dem Wert für die Unstimulierten zu
vergleichen den gepaarten t-test benutzen. Oder wäre auch hier
der repeated measures angemessener, damit ich alle vorhandenen
Werte miteinbeziehe?
Der „gepaarten t-test“ ist das selbe wie eine „repeated-measures Anova“ auf zwei Gruppen. Der F-Wert der Anova ist genau das Quadrat des t-Wertes des t-Tests (F = t²), den p-Wert des t-Tests kannst du auch anhand der F-Verteilung aus t² mit 1 und n-1 Freiheitsgraden berechnen.
Wenn du mehr als 2 Gruppen hast, kannst du die Anova machen. Die sagt dir dann, ob die Daten vereinbar sind mit der Nullhypothese, dass die Mittelwerte aller drei Gruppen gleich sind. Danach hast du aber evtl. das Problem, dass du herausfinden musst, welche Gruppen sich denn nun unterscheiden. Dazu müßtest du post-hoc-Tests verwenden…
Normalerweise macht man das, um eine Fehlerinflation zu vermeiden. Das gleiche Erreicht man aber auch, wenn man die p-Werte aus den ganzen paarweisen Gruppenvergleichen über t-Tests ordentlich gegen multiples Testen korrigiert. Hier ist die Bonferroni-Korrektur eine einfache aber bei sehr vielen Tests auch sehr stringente Möglichkeit (Korrektur: Alle p-Werte werden mit der Anzahl der Tests multipliziert; alternativ kann auch das Signifikanzniveau durch die Anzahl der Tests geteilt werden).
VG
Jochen