Repeated measures anova

Hallo,
habe eine Frage bezüglich repeated m. Anova:
und zwar was genau sind die Voraussetzungen, die erfüllt werden müssen, damit man diesen statistischen Test nutzen darf?
Habe in meiner Arbeit Blutzellen von mehreren Personen von einer Krankheitsgruppe nach einer bestimmten Stimulation untersucht und diese gegenüber unstimulierten Zellen mir angeschaut. Nun möchte ich neben dem Vergleich innerhalb der Gruppe(simuliert gegen unstimuliert) die verschiedenen Gruppen miteinander vergleichen.
Darf ich da repested m. Anova nutzen?
Oder ist es statistisch nicht zugelassen, da ich keine Messungen zu verschiedenen Zeitpunkten habe?

Würde mich über Hilfe sehr freuen, da ich selber keine Ahnung von Statistik habe und meine Ergebnisse auswerten muss.

Grüße

Hallo,

habe eine Frage bezüglich repeated m. Anova:
und zwar was genau sind die Voraussetzungen, die erfüllt
werden müssen, damit man diesen statistischen Test nutzen
darf?

Die gleichen wie bei der Anova. Die repeated-measures-Anova verhält sich zur Anova wie der gepaarte t-Test zum t-Test.

Ob die gepaarte Auswertung was bringt, hängt von der Varianzstruktur der Daten ab. Grundsätzlich gibt es hier kein „das muss man so machen“ und kein „das darf man nicht so machen“. Manchmal ist es aber blöd, keine gepaarte Analyse zu machen, wenn dadurch uninteressante Varianzbeiträge aus den Daten rausgerechnet werden und der interessierende Effekt deutlicher wird.

Eine Voraussetzung ist ja, dass die Daten für die Anova unabhängig sein sollen. Wenn man „eigentlich gepaarte Daten“ hat, dann ist diese Annahme streng genommen verletzt. Also „muss“ man paaren. Real haben Daten immer irgendwelche Komponenten, die „gepaart“ sind, und meist kennt man sie nicht und/oder hat sie auch keine Information dazu im Datensatz. Oft werden also im strengen Sinne nicht-unabhängige Daten fälschlicherweise mit einer „normalen“ Anova verwurstelt. Das ist nicht so schlimm, weil a) sind die Einflüsse meist nicht sehr groß (sonst wüsste man ja wahrscheinlich schon davon) und b) ist es im schlimmsten Falle ja so, dass ein interessierender Effekt übersehen wird (weil die Daten so stark streuen).

Oder ist es statistisch nicht zugelassen, da ich keine
Messungen zu verschiedenen Zeitpunkten habe?

Das hat mit Zeitpunkten nix zu tun. Die Sache mit den Zeitpunkten meint eigentlich nur, dass man mehrere Messungen vom SELBEN Individuum hat. Man kann sich denken, dass jedes Individuum schonmal einen anderen „Ausgangswert“ hat. Diese Varianz in den Ausgangswerten interessiert aber bei den Analysen i.d.R. nicht, sondern nur der Effekt der Behandlung (oder der Zeit). Durch Paarung der Werte, die zu einem Individuum gehören, wird dieser Varianzanteil eliminiert. Genausogut können die zu paarenden Messungen von mehreren Messstellen am selben Individuum stammen (neue vs. alte Faltencreme, getestet an der linken und der rechten Hand von Probanden), oder von Messungen am selben Tag, oder von Messungen an Zellen der gleichen Passage, oder von Messungen an verschiedenen Mäusen vom gleichen Wurf, oder oder oder. Wenn irgendeine Eigenschaft also mehreren Messwerten in gleicher Weise zugrund liegt (Ort, Zeit, Individuum, Wurf, Kulturschale, Passage, Batch eines Reagens, Experimentator, was-weiss-ich…), dann könnte/sollte man dementsprechend paaren.

Ob die Paarung lohnt oder nicht, hängt wie gesagt von der Varianzstruktur ab. Durch die Paarung verlierst du Freiheitsgrade, aber die Daten werden u.U. homogener. Wenn der Einfluß der Reduktion in den Freiheitsgraden dominiert, sollte man nicht paaren. Und man sollte auch nicht paaren, wenn man keine nachvollziehbare Hypothese über die zu eliminierende Varianzkomponente hat.

Würde mich über Hilfe sehr freuen, da ich selber keine Ahnung
von Statistik habe und meine Ergebnisse auswerten muss.

D.h.: Erstens: Methode lernen! Zweitens: Methode anwenden! (Die meisten überspringen Punkt 1 leider recht großzügig)

Ist aber kein großes Problem. Es gibt ja genug Literatur. Googel hilft da auch erstmal weiter. Hier sind schonmal ein paar Links zu einleitenden Folien ins Thema (nur so als ein Beispiel von vielen):

http://www.phonetik.uni-muenchen.de/~jmh/lehre/sem/s…
http://www.phonetik.uni-muenchen.de/~jmh/lehre/sem/s…
http://www.phonetik.uni-muenchen.de/~jmh/lehre/sem/s…

VG
Jochen

Hallo,

also wenn ich dich richtig verstanden habe, darf ich meine Ergebnisse paaren, wenn es Gemeinsamkeiten gibt.
die gibt es bei meinen Daten: ich habe einen Zelltyp bei unterschiedlichen Patientengruppen gemessen. dabei habe ich mir immer eine unstimulierte und eine stimulierte (bei allen Gruppen gleich stimuliert) Version angeguckt.
Was ich mir gerne angucken möchte ist, ob es Signifikanzen gibt zwischen den Gruppen bei der stimulierten Version bzw. bei der unstimulierten Version.
Also vereinfacht ausgedrückt ob bzw. wie die Stimulation die eine Krankheit im Gegensatz zur anderen beeinflusst.

Hättest du vielleicht auch eine Quelle, die ich meinem Betreuer vorlegen könnte um ihn davon zu überzeugen, dass die zeitlichen Messungen nicht relevant sind und ich statt zeitlich auch andere Gemeinsamkeiten haben kann? Leider will er mir nicht glauben und ich muss ihn davon überzeugen um dieses Verfahren anwenden zu dürfen.

noch eine weitere Frage hätte ich:
innerhalb der Gruppe würde ich um den Wert für die Stimulierten mit dem Wert für die Unstimulierten zu vergleichen den gepaarten t-test benutzen. Oder wäre auch hier der repeated measures angemessener, damit ich alle vorhandenen Werte miteinbeziehe?

vielen Dank schonmal im vorraus.
Gruß
H.

Hallo,

also wenn ich dich richtig verstanden habe, darf ich meine
Ergebnisse paaren, wenn es Gemeinsamkeiten gibt.

Und wenn die Varianz zwischen den verschiedenen „Gemeinsamkeiten“ größer ist als die Varianz durch das, was du eigentlich bestimmen willst.

die gibt es bei meinen Daten: ich habe einen Zelltyp bei
unterschiedlichen Patientengruppen gemessen. dabei habe ich
mir immer eine unstimulierte und eine stimulierte (bei allen
Gruppen gleich stimuliert) Version angeguckt.

Ein Patient -> Zellen -> splitten in 2 Kulturen -> 1 Kultur wird stimuliert, die andere nicht -> Messung beider Kulturen
Ein Patient stammt dabei aus einer von mehreren unterschiedlichen Gruppen.

Richtig?

Was ich mir gerne angucken möchte ist, ob es Signifikanzen
gibt zwischen den Gruppen bei der stimulierten Version bzw.
bei der unstimulierten Version.
Also vereinfacht ausgedrückt ob bzw. wie die Stimulation die
eine Krankheit im Gegensatz zur anderen beeinflusst.

Wenn das oben so stimmt, solltest du die WertePAARE PRO PATIENT auch paaren!

Es ist sehr wahrscheinlich, dass die Zellen von Patient A schon unstimuliert ganz andere Ergebnisse liefern als die unstim. Zellen von Patient B der gleichen Gruppe. Die Messungen für Pat.A könnten unstimuliert schon sehr hoch sein, und deine Frage ist ja, ob die Stimulation diesen Wert dann noch verändert. Das siehst du am besten, wenn du die beiden Werte von Pat. A vor und nach der Stimulation vergleichst. Dann ist nämlich egal, welchen Wert A_unstim. schon hatte, nur die DIFFERENZ (verursacht durch die Stimulation) interessiert.

Hättest du vielleicht auch eine Quelle, die ich meinem
Betreuer vorlegen könnte um ihn davon zu überzeugen, dass die
zeitlichen Messungen nicht relevant sind und ich statt
zeitlich auch andere Gemeinsamkeiten haben kann?

Mach Dir klar, dass „repeated measures Anova“ nur ein NAME ist. Genausogut kann man sagen „dependent-samples Anova“ (so wie beim „dependent-samples t-Test“). Der Ausdruck „paired-samples-Anova“ (wie „paired-amples t-Test“) ist hier nicht allgemein genug, weil man bei der Anova im Ggs. zum t-Test nicht genau 2 gepaarte werte haben muss, sondern mehrere -eben abhängige- Werte haben kann. Also, vielleicht nennst du es eine „dependet-samples Anova“, und die vor/nach-Stimulationswerte von ein und demselben Patienten sind halt „depending“.

Leider will
er mir nicht glauben und ich muss ihn davon überzeugen um
dieses Verfahren anwenden zu dürfen.

Das ist prinzipiell gut. Generell sollte man in der Lage sein, die Verwendung ALLER Methoden gut begründen zu können. Das gilt für die Mess-Methode genauso für die Methode der Stichprobenziehung als auch der stat. Analyse.

Ich hatte dir Links gesendet. Hast du die Sachen gelesen? Ansonsten nimm bitte ein Statistikbuch zur Hand, da steht sowas drin. Schau auch mal hier: http://faculty.vassar.edu/lowry/ch12pt1.html

noch eine weitere Frage hätte ich:
innerhalb der Gruppe würde ich um den Wert für die
Stimulierten mit dem Wert für die Unstimulierten zu
vergleichen den gepaarten t-test benutzen. Oder wäre auch hier
der repeated measures angemessener, damit ich alle vorhandenen
Werte miteinbeziehe?

Der „gepaarten t-test“ ist das selbe wie eine „repeated-measures Anova“ auf zwei Gruppen. Der F-Wert der Anova ist genau das Quadrat des t-Wertes des t-Tests (F = t²), den p-Wert des t-Tests kannst du auch anhand der F-Verteilung aus t² mit 1 und n-1 Freiheitsgraden berechnen.

Wenn du mehr als 2 Gruppen hast, kannst du die Anova machen. Die sagt dir dann, ob die Daten vereinbar sind mit der Nullhypothese, dass die Mittelwerte aller drei Gruppen gleich sind. Danach hast du aber evtl. das Problem, dass du herausfinden musst, welche Gruppen sich denn nun unterscheiden. Dazu müßtest du post-hoc-Tests verwenden…

Normalerweise macht man das, um eine Fehlerinflation zu vermeiden. Das gleiche Erreicht man aber auch, wenn man die p-Werte aus den ganzen paarweisen Gruppenvergleichen über t-Tests ordentlich gegen multiples Testen korrigiert. Hier ist die Bonferroni-Korrektur eine einfache aber bei sehr vielen Tests auch sehr stringente Möglichkeit (Korrektur: Alle p-Werte werden mit der Anzahl der Tests multipliziert; alternativ kann auch das Signifikanzniveau durch die Anzahl der Tests geteilt werden).

VG
Jochen

Hallo,

Ein Patient -> Zellen -> splitten in 2 Kulturen -> 1 Kultur
wird stimuliert, die andere nicht -> Messung beider Kulturen
Ein Patient stammt dabei aus einer von mehreren
unterschiedlichen Gruppen.

Richtig?

ja, genau das stimmt

Es ist sehr wahrscheinlich, dass die Zellen von Patient A
schon unstimuliert ganz andere Ergebnisse liefern als die
unstim. Zellen von Patient B der gleichen Gruppe. Die
Messungen für Pat.A könnten unstimuliert schon sehr hoch sein,
und deine Frage ist ja, ob die Stimulation diesen Wert dann
noch verändert. Das siehst du am besten, wenn du die beiden
Werte von Pat. A vor und nach der Stimulation vergleichst.
Dann ist nämlich egal, welchen Wert A_unstim. schon hatte, nur
die DIFFERENZ (verursacht durch die Stimulation) interessiert.

die differenz gegenüberstellen ist auch eine gute idee

Ich hatte dir Links gesendet. Hast du die Sachen gelesen?
Ansonsten nimm bitte ein Statistikbuch zur Hand, da steht
sowas drin. Schau auch mal hier:
http://faculty.vassar.edu/lowry/ch12pt1.html

dieser link ist sehr gut, danke
bei den anderen beiden hatte ich als Nichtstatistiker ziemliche Probleme etwas zu verstehen

Vielen Dank für die Hilfe, hat mir sehr geholfen

Gruß
H.

Hallo,

die differenz gegenüberstellen ist auch eine gute idee

Das IST eine gepaarte Analyse. Die Differenzen zu betrachten, ist keine *andere* Idee. Der gepaarte t-Test bzw. die repeated-measures Anova basiert auf der Verwendung der Differenzen! Wenn immer du sagst: „eigentlich interessierem mich die Differenzen“ dann ist eine gepaarte (bzw. repeated measures-) Analyse der Weg!

dieser link ist sehr gut, danke
bei den anderen beiden hatte ich als Nichtstatistiker
ziemliche Probleme etwas zu verstehen

Einfach auch mal selbst suchen, und ein Gang in die Bibliothek kann auch helfen. Da kann man in viele verschiedene Bücher reingucken und so dasjenige finden, mit dem man gut klarkommt und wo man den Autor versteht.

Vielen Dank für die Hilfe, hat mir sehr geholfen

Das freut mich!

VG
Jochen