Friedman-test zur verlaufsmessung geeignet?

Hallo!
Ich plane gerade die statistische auswertung der ergebnisse meiner diplomarbeit und habe folgendes problem:
vier treatmentgruppen (je n=12, davon eine Kontrollgruppe) werden über mehrere tage wiederholt im selben paradigma getestet (mit einer täglich fixen anzahl von trials). Als abhängige variable wird einfach die anzahl einer bestimmten reaktion in einem trial erfasst (kein lernexperiment: Das eigentliche treatment findet vorab statt und soll die entscheidungsparameter zwischen den gruppen unterschiedlich beeinflussen. Danach folgt eine trainingsphase, in der ein bestimmtes entscheidungskriterium erreicht werden muss. Es starten somit alle teilnehmer auf einem gleichen anfangsniveau ins eigentliche paradigma. In diesem wird dann die im training vorhandene entscheidungssituation für alle gruppen gleichermaßen verändert und der einfluss der jeweiligen treatments auf das entscheidungsverhalten wird erfasst.)

Mein problem ist nun, dass ich

  • aufgrund der kleinen gruppengrößen nonparametrische verfahren verwenden möchte
  • statistisch überprüfen will, ob das jeweilige treatment innerhalb der gruppen die entscheidungsparameter über die testungstage hinweg konstant beeinflusst. Hierzu hatte ich mir überlegt den verlauf der „tageswerte“ für die vier Gruppen zu erfassen und die verlaufsmuster dahingehend zu analysieren, inwiefern sich dort unterschiede zwischen den gruppen ergeben. Also z.B. zur Klärung der Frage ob ein treatment nur anfänglich zu einem Effekt führt, sich im Verlauf der Tage die Werte der betreffenden Gruppe aber an die Kontrollgruppe anpassen.

Leider weiß ich überhaupt nicht mit welchem verfahren ich das anstellen soll. Ich hatte zwar schon mit dem friedman-test als nonparametrische variante der anova mit messwiederholung geliebäugelt (in den zeilen die tage mit dem jeweiligen tagesmittelwert der 12 gruppenmitglieder, die spalten repräsentieren die vier treatmentgruppen?!), bin mir aber nicht sicher ob ich mit dem verfahren wirklich zum gewünschten ziel komme, bzw. ob ich das so überhaupt darf. Da ja auf gleichheit der rangplatz-spaltensummen getestet wird, kann ich ja auf diese weise nur testen, ob das entscheidungsverhalten aller vier gruppen über die tage gleich bleibt oder nicht (und wie sie sich unterscheiden), erfasse aber ja unter umständen nicht veränderungen innerhalb einer gruppe (solange sie nicht zu einer veränderung der rangplätze führen)?! Gibt es ein nonparametrisches verfahren, bei dem kurvenverläufe auf signifikante unterschiede hin getestet werden können, oder andere möglichkeiten der problemlösung?

Ich danke vielmals im voraus und würde mich sehr über eine antwort freuen!!!
andreas

Hi andreas,

Ich plane gerade die statistische auswertung der ergebnisse
meiner diplomarbeit und habe folgendes problem:
vier treatmentgruppen (je n=12, davon eine Kontrollgruppe)
werden über mehrere tage wiederholt im selben paradigma
getestet (mit einer täglich fixen anzahl von trials). Als
abhängige variable wird einfach die anzahl einer bestimmten
reaktion in einem trial erfasst

Dann plotte dir erstmal für jede treatmentgruppe pro person einen Verlauf der abh. Var gegen die Zeit, dann kannst du schon mal einen ersten Eindruck gewinnen.

Mein problem ist nun, dass ich

  • aufgrund der kleinen gruppengrößen nonparametrische
    verfahren verwenden möchte

Dazu würde ich auch deswegen raten, weil die AV nciht stetig ist.

1)- statistisch überprüfen will, ob das jeweilige treatment
innerhalb der gruppen die entscheidungsparameter über die
testungstage hinweg konstant beeinflusst.
2)Hierzu hatte ich mir
überlegt den verlauf der „tageswerte“ für die vier Gruppen zu
erfassen und die verlaufsmuster dahingehend zu analysieren,
inwiefern sich dort unterschiede zwischen den gruppen ergeben.

  1. beantwortet aber 1) nicht. Bei 1) untersuchst du nur eine Gruppe und analysier´st deren Verlauf, bei 2. analysierst du Gruppenunterscheide an verschiedenen Tagen. 1) beantwortet die Frage: Sind die Effekte innerhalb der Gruppe konstant? 2) beantwortet die Frage: Gibt es an einem Tag Unterschiede zwischen den Gruppen?
    Zu 1) würde ich empfehlen: step-down testing nach Tamhane und Hochberg, mit linearen Kontrasten in einem Permutationstest. Damit kannst herausfinden, ab welchem Tag sich die Ergebnisse sig. vom ersten unterscheiden. Ausserdem ist das Verfahren nicht-parametrisch, hält das signikanzniveau ein und du kannst ggf. nach Geschelcht stratifizieren.
    zu 2) würde ich eine Art Dose-reposnse-analyse empfehlen. Du kannst nichtparametrisch der Verlauf mittels eines Emax-Modells schätzen und die ED50 als Charakterisierung der Kurve heranziehen. Mittels weiterer Verfahren - die ich dir hier mal erspare - kann man dann die ED50-Werte vergleichen.

allerdings wäre da noch eine Frage: Wieso gibt es Mehrfachmessnugen? Was erwartest du dir davon? Sollen die Reaktionen über die Tage ansteigen oder nicht?

Viele Grüße,
JPL

Hey JPL!!!

Vielen vielen Dank für die schnelle und gute Antwort!!! Die Verfahren (kenne beide nicht :smile: )hören sich genau nach dem an was sich suche!
kannst du mir vlt. einen tipp geben (buch, internet-quellen etc.) wo ich mehr über diese verfahren lesen kann?

allerdings wäre da noch eine Frage: Wieso gibt es
Mehrfachmessnugen? Was erwartest du dir davon? Sollen die
Reaktionen über die Tage ansteigen oder nicht?

die mehrfachmessungen gibt es weil meine „versuchsteilnehmer“ ratten sind und pro tag jedes tier nur 5 trialsabsolviert. optimalerweise sollte es keinen anstieg/ abfall bei den reaktionen über die tage hinweg geben, aber die planung des experiments, so wie es mein dozent mir vorgelegt hatte, sah eine überprüfung von eben dieser möglichkeit nicht vor. da ich aber noch nicht so ganz von der effektivität der verwendeten methode, also unseres treatments, überzeugt bin, würde ich mir gern die zusätzliche arbeit machen um ggf. kritik an mir selbst zu üben :smile:

zu 2) würde ich eine Art Dose-reposnse-analyse empfehlen. Du kannst :nichtparametrisch der Verlauf mittels eines Emax-Modells schätzen und die :ED50 als Charakterisierung der Kurve heranziehen. Mittels weiterer Verfahren :- die ich dir hier mal erspare - kann man dann die ED50-Werte vergleichen.
vielen vielen dank nochmals!!!

wie liesse sich die dose-response-analyse vom prinzip her auf meine daten anwenden? Ich habe ja quasi von den tieren pro tag einen relativen anteilswert (z.B. 3/5), wie oft sie in den 5 trials eine bestimmte reaktion (ist eine wahl aus zwei möglichen alternativen) getroffen haben. geht die zeit (also die jeweiligen tagesmessungen) dann sozusagen als dosis-parameter in die analyse mit ein oder versteh ich das grundlegend falsch (würde mich nicht wundern :smile: )?

mfg,
andreas

Hi Andreas,

Vielen vielen Dank für die schnelle und gute Antwort!!! Die
Verfahren (kenne beide nicht :smile: )hören sich genau nach dem an
was sich suche!

Gern geschehen.

kannst du mir vlt. einen tipp geben (buch, internet-quellen
etc.) wo ich mehr über diese verfahren lesen kann?

Zum Permutationstest kann ich dir nichts konkretes empfehlen. Zur Durchführung wäre SAS praktisch, weil dort genua dieses feature unetrstützt wird (in der PROC MULTTEST), wie das bei anderen Paketen implementiert werden kann weiß ich nicht.
Für das Emax-Modell bzw. dose-response kann ich dir „dose finding in drug development“ von Naitee Ting empfehlen (2006) ganz allgemein ist das Emax-Modell dem logistischen Modell mit 4 Parametern angelehnt, wenn du das googelst müsstest du eine Menge finden.

die mehrfachmessungen gibt es weil meine „versuchsteilnehmer“
ratten sind und pro tag jedes tier nur 5 trialsabsolviert.
optimalerweise sollte es keinen anstieg/ abfall bei den
reaktionen über die tage hinweg geben, aber die planung des
experiments, so wie es mein dozent mir vorgelegt hatte, sah
eine überprüfung von eben dieser möglichkeit nicht vor. da ich
aber noch nicht so ganz von der effektivität der verwendeten
methode, also unseres treatments, überzeugt bin, würde ich mir
gern die zusätzliche arbeit machen um ggf. kritik an mir
selbst zu üben :smile:

Sehr gut, wenn du deinen Versuch selbst hinterfragst! Ausserdem Danke für ausführliche Beschreibung. Damit ist der dose-response dann allerdings nur eine Krücke. Wenn es keinen Anstieg oder Abfall gibt, wirst du für die ED50 nur Schmarrn herausbekommen. (Bei Ratten wundert mich das aber, die sind doch nicht gerade dämlich). Von daher wäre ein Friedman-test dann doch wieder sinnvoll :smile:

zu 2) würde ich eine Art Dose-reposnse-analyse empfehlen. Du kannst :nichtparametrisch der Verlauf mittels eines Emax-Modells schätzen und die :ED50 als Charakterisierung der Kurve heranziehen. Mittels weiterer Verfahren :- die ich dir hier mal erspare - kann man dann die ED50-Werte vergleichen.
vielen vielen dank nochmals!!!

wie liesse sich die dose-response-analyse vom prinzip her auf
meine daten anwenden? Ich habe ja quasi von den tieren pro tag
einen relativen anteilswert (z.B. 3/5), wie oft sie in den 5
trials eine bestimmte reaktion (ist eine wahl aus zwei
möglichen alternativen) getroffen haben. geht die zeit (also
die jeweiligen tagesmessungen) dann sozusagen als
dosis-parameter in die analyse mit ein oder versteh ich das
grundlegend falsch (würde mich nicht wundern :smile: )?

Kurz zum allgemeinen dose-repsonse: Es gibt mehrere Dosisstufen, die verabreicht werden, wobei man davon ausgeht, dass ein Anstieg oder Abfall mit Erhöhung der Dosis einhergeht. Zur Veranschaulichung trägt man die Dosis auf der y-achse und den repsonde auf der y-Achse auf und erhält zum Beispiel eine ansteigende S-Kurve (sigmoide Form) oder einen Teil davon. Diese Schätzung der Kurve erfolgt mit dem Emax-Modell, das von 4 Parametern abhängt: Effekt bei minimalder Dosis (E0), maximal möglicher Effekt (Emax), ED50 (Dosis, die zu 50% des maximalen Effektes führt) und einem „Slope“-Parameter (h).
E0 und Emax kann man i.a. fix setzen, so dass nur h und ED50 geschätzt werden müssen, wobei eigentlich nur ED50 von Interesse ist.
Man kann den Begriff „Dosis“ alleridngs ausweiten auf eine beliebige stetige ZV (z.B Zeit oder Masse oder Luftfeuchte) und das Modell genauso anwenden. Von daher ließe sch das Modell auch auf deine Daten anwenden, es wäre dann ein Zeit-response-Modell.
Dieses Modell kann man in SAS oder R sehr gut fitten, berücksichtigt aber keine KOrrelationen zwischen den Zeitpunkten. Die Schätzung für die Parameter ist davon nicht tangiert, aber die Varianzschätzung wird verzerrt sein, von daher Vorsicht mit den Konfis und Standardfehlern, die da mit ausgespuckt werden.

Soviel erstmal dazu, viel Spaß und viele Grüße,
JPL

Für das Emax-Modell bzw. dose-response kann ich dir „dose
finding in drug development“ von Naitee Ting empfehlen (2006)
ganz allgemein ist das Emax-Modell dem logistischen Modell mit
4 Parametern angelehnt, wenn du das googelst müsstest du eine
Menge finden.

danke für den tipp! das buch gibt es über meine uni-bib online und kostenlos im volltext :smile:

Sehr gut, wenn du deinen Versuch selbst hinterfragst!
Ausserdem Danke für ausführliche Beschreibung. Damit ist der
dose-response dann allerdings nur eine Krücke. Wenn es keinen
Anstieg oder Abfall gibt, wirst du für die ED50 nur Schmarrn
herausbekommen. (Bei Ratten wundert mich das aber, die sind
doch nicht gerade dämlich). Von daher wäre ein Friedman-test
dann doch wieder sinnvoll :smile:

nein das sind sie ganz gewiss nicht, auch wenn viele das nach außen hin so darstellen. und auch deswegen find ich es wichtig, gerade in den (oft) relativ einfach aufgebauten tierversuchen möglichst viele möglichkeiten in betracht zu ziehen und nicht stur auf die effektivität des treatments zu hoffen und die komplette datenauswertung auch nur danach auszurichten. aber das ist vielleicht n diskussionsthema für sich :smile:

ich werde, auch wenn das emax-modell und die ed50 nicht optimal sein mögen, mich trotzdem mal in das verfahren reinlesen und mal sehen was ich draus machen kann (und von vorneherein den friedman-test noch mit einplanen). nichtsdestotrotz vielen dank für die ausführlichen und prompten hilfen!!!
super sache!
mfg,
andreas

Hi Andreas,

danke für den tipp! das buch gibt es über meine uni-bib online
und kostenlos im volltext :smile:

Coole Uni :smile:

ich werde, auch wenn das emax-modell und die ed50 nicht
optimal sein mögen, mich trotzdem mal in das verfahren
reinlesen und mal sehen was ich draus machen kann (und von
vorneherein den friedman-test noch mit einplanen).
nichtsdestotrotz vielen dank für die ausführlichen und
prompten hilfen!!!
super sache!
mfg,
andreas

Das ist eine gute Einstellung. Viel Glück beim Auswerten. Meld dich, wenn du noch Fragen hast.

Grüße,
JPL