Hallo Experten !
Vorweg die Frage: Wie bekomme ich das Konfidenzintervall für eine Interaktion?
Ich will so eine Art BACI-Design auswerten:
Messwerte: Genexpression (die Werte sind approx. normalvert.) Je stärker das Gen in einer Probe exprimiert ist, desto größer der Meßwert; Der Meßwert ist auch noch abh. von der eingesetzten Probenmenge (trivial, aber wichtig).
Gruppen: „Kontrolle“ und „Behandelt“
Fragestellung: Unterscheidet sich die (auf die eingesetzten Probenmengen normalisierte) Genexpression zwischen den Gruppen?
Durchführung: Von jeder biologischen Probe wird die Expression des interessierenden Zielgens UND auch die Expression eines Referenzgens gemessen. Das Referenzgen dient als „Ladekontrolle“, weil die Menge des eingesetzten Probenmaterials nicht bekannt ist. Die Messungen werden wiederholt, weil die Messtechnik selbst nicht sonderlich präzise ist. Die gemessenen Rohdaten entsprechen den logarithmierten Mengen, so dass die Normalisierung auf eine einfache Subtraktion hinausläuft.
Üblicherweise wurden die Auswertungen schrittweise und „von Hand“ gemacht, indem zunächst die Messwiederholungen gemittelt wurden. Diese gemittelten Werte werden dann als „Messwerte“ weiterverwendet. Im Zweiten Schritt wird für jede biologische Probe die Differenz zwischen Ziel-Gen und Referenz-Gen berechnet (=Normalisierung auf die Probenmenge). Jetzt liegt für jede biol. Probe ein Differenzwert vor. Diese Differenzwerte werden über die Gruppen (Kontrolle/Behandelt) gemittelt. Schließlich testet man, ob ein sig. Unterschied in den Mittelwerten zwischen den Gruppen besteht (t-Test, df = Anzahl biologischer Proben - 2).
Ich glaube, dass dieses Verfahren suboptimal ist, weil es die Varianzinformation aus den Messwiederholungen praktisch nicht nutzt.
Um das zu verbessern, dachte ich, kann man die Daten auch mit einer zweifaktoriellen ANOVA mit Messwiederholung über die biol. Proben und über die techn. Messwiederholungen auswerten, wobei die Interaktion zwischen den Faktoren „Gruppe“ und „Gen“ die eigentlich interessierende Größe ist.
Ich habe das mal in R und mit simulierten Daten gemacht und bekomme auch die erwarteten Ergebnisse raus. Ich bekomme als Koeffizient der Interaktion den selben Wert, der auch „per Hand“ berechnet wird und eben auch gleich die Aussage, ob die Interaktion signifikant ist. Soweit so gut.
Frage: Wie bekomme ich das Konfidenzinterval zu diesem Wert?
Ich habe die komplette ANOVA-Tabelle mit den Quadratesummen und Freiheitsgraden und sogar eine Größe, die sich „Residual standard error“ nennt. Ganz naiv dachte ich, ich kann „Residual df“ und diesen „standard error“ nehmen und mit der t-Verteilung das KI berechnen. Ich würde erwarten, dass das KI die Null nicht einschließt, wenn die Interaktion signifikant ist. Das ist so aber nicht der Fall. Das so berechnete KI ist deutlich breiter und schließt die Null auch bei signifikanten Interaktionen mit ein.
Danke schonmal für eure Hilfe & ein schönes WE
Jochen