Vergleich zweier Mittelwerte

Hallo zusammen,

ich schreibe gerade meine Diplomarbeit und habe ein Problem beim Auswerten der Ergebnisse. Hoffentlich kann mir jemand von euch helfen.

Meine Aufgabe ist es eine Ultraschallgenerator optimal zu parametrieren. Der US-Generator dient zur Zerkleinerung (Desintegration) der Feststoffpartikel in Rindergülle, um die Feststoffpartikel bioverfügbarer für die Mikroorganismen in einer Biogasanlage zu machen. In meinen Versuchen habe ich die Beschallungsdauer verändert und somit auch den Energieeintrag. Mit einem Mikroskop habe ich jeweils 12 Bilder von einer Probe aufgenommen und habe sie anschließend mit einer „Zählsoftware“ auszählen lassen. Die Ergebnisse der 12 Bilder habe ich zuammengefügt und versucht eine Größenverteilung in Excel zu erstellen. Es hat sich herausgestellt, dass die Werte Linksschief sind und ich sie erst logarithmieren muss, um eine Normalverteilung zu bekommen. Mit einem TTEST (Excel) habe ich versucht die ausgezählten Ergebnisse von einer unbehandelten Probe mit einer behandelten Probe zu vergleichen. Es gab leider kein gescheites Ergebnis. Kann mir vielleicht jemand von euch weiterhelfen? Wende ich überhaupt den richtigen Test an? Gibt es bei dem TTEST Probleme mit einer großen Anzahl von Werten (z.B. 14000/Probe)? Ich weiß auch nicht ob es sich um einen zweiseitigen Test oder einen unabhängigen handelt. War noch nie so gut in Statistik.
Vielen Dank im Voraus.

Gruß
Sven

Hallo an das neue Mitglied.

ich schreibe gerade meine Diplomarbeit und habe ein Problem
beim Auswerten der Ergebnisse. Hoffentlich kann mir jemand von
euch helfen.

Welcher Fachbereich und vor allem welches Thema ? Das könnte schon wertvolle Hinweise liefern…

Meine Aufgabe ist es eine Ultraschallgenerator optimal zu
parametrieren. Der US-Generator dient zur Zerkleinerung
(Desintegration) der Feststoffpartikel in Rindergülle, um die
Feststoffpartikel bioverfügbarer für die Mikroorganismen in
einer Biogasanlage zu machen. In meinen Versuchen habe ich die
Beschallungsdauer verändert und somit auch den Energieeintrag.
Mit einem Mikroskop habe ich jeweils 12 Bilder von einer Probe
aufgenommen und habe sie anschließend mit einer „Zählsoftware“
auszählen lassen. Die Ergebnisse der 12 Bilder habe ich
zuammengefügt und versucht eine Größenverteilung in Excel zu

An dieser Stelle könnte der geneigte Leser -zwecks Fehlerüberprüfung- die Bilder sowie die Ergebnisse einsehen wollen…

erstellen. Es hat sich herausgestellt, dass die Werte
Linksschief sind und ich sie erst logarithmieren muss, um eine
Normalverteilung zu bekommen. Mit einem TTEST (Excel) habe
ich versucht die ausgezählten Ergebnisse von einer
unbehandelten Probe mit einer behandelten Probe zu
vergleichen. Es gab leider kein gescheites Ergebnis. Kann mir
vielleicht jemand von euch weiterhelfen? Wende ich überhaupt
den richtigen Test an? Gibt es bei dem TTEST Probleme mit
einer großen Anzahl von Werten (z.B. 14000/Probe)? Ich weiß
auch nicht ob es sich um einen zweiseitigen Test oder einen
unabhängigen handelt. War noch nie so gut in Statistik.
Vielen Dank im Voraus.

Hypothese wie folgt -> H0: Mittelwert(unbehandelt) = Mittelwert(behandelt), H1: MW(unbehandelt) != MW(behandelt)
Aufgrund der zu schätzenden Werte bzgl. Mittelwert und Varianz ist der doppelte t-Test zu verwenden. Zweiseitig, abhängig und Normalverteilung vorausgesetzt…
Der F-Test, wenn die geschätzten Varianzen getestet werden sollen: H0 -> sigma1^2 = sigma2^2 vs. H1 sigma1^2 != sigma2^2
Siehe auch http://de.wikipedia.org/wiki/Statistik
…man sieht: der geneigte Leser braucht noch ein paar Informationen :wink:

HTH
mfg M.L.

Hallo Markus,

danke für die schnelle Antwort. Ich studiere Umwelttechnik und schreibe meine DA im Bereich Energetische Biomassenutzung mit dem Thema „Optimale Parametrierung eines Ultraschallgenerators zur Zerkleinerung von Feststoffpartikeln in Rindergülle“.

Unbehandelte Probe:
Mittelwert= 3,956
Stadw= 1,597
Varianz= 2,55
N= 8084

Behandelte Probe:
Mittelwert= 3,381
Stadw= 1,598
Varianz= 2,555
N= 14639

Das sind die Ergebnisse (transformierten Auszählergebnissen (ln)). Ich möchte eigentlich nur den Mittelwert vergleichen und eine Aussage darüber bekommen, ob die Messergebnisse zufällig zustande gekommen sind oder signifikant sind. In Excel habe ich die Matrix 1 (unbehandelt), Matrix 2 (behandelt), 2 für zweiseitigen Test und Typ 2 eingegeben. Das Ergebnis war 1,1222E-146. Ich weiß nicht wie ich das Ergebnis deuten soll. Vielleicht mache ich auch was falsch.
Übrigens nehme ich eine Stichprobe aus der Grundgesamtheit und aus der Stichprobe untersuche ich nur die Partikel, die

Hallo nochmal.

danke für die schnelle Antwort. Ich studiere Umwelttechnik und
schreibe meine DA im Bereich Energetische Biomassenutzung mit
dem Thema „Optimale Parametrierung eines Ultraschallgenerators
zur Zerkleinerung von Feststoffpartikeln in Rindergülle“.

Aha :smile:

Unbehandelte Probe:
Mittelwert= 3,956

= MW1

Stadw= 1,597

= sigma1

Varianz= 2,55

= sigma1^2

N= 8084

=n1

Behandelte Probe:
Mittelwert= 3,381

= MW2

Stadw= 1,598

= sigma2

Varianz= 2,555

= sigma2^2

N= 14639

=n2

Das sind die Ergebnisse (transformierten Auszählergebnissen
(ln)). Ich möchte eigentlich nur den Mittelwert vergleichen
und eine Aussage darüber bekommen, ob die Messergebnisse
zufällig zustande gekommen sind oder signifikant sind. In
Excel habe ich die Matrix 1 (unbehandelt), Matrix 2
(behandelt), 2 für zweiseitigen Test und Typ 2 eingegeben. Das
Ergebnis war 1,1222E-146. Ich weiß nicht wie ich das Ergebnis
deuten soll. Vielleicht mache ich auch was falsch.
Übrigens nehme ich eine Stichprobe aus der Grundgesamtheit und
aus der Stichprobe untersuche ich nur die Partikel, die Testgrösse =

[(MW1-MW2)/ SQRT((n1-1)*sigma1^2 + (n2-1)*sigma2^2)] *

SQRT[n1*n2*(n1+n2-2)/ (n1+n2)]

Die Testgrösse ist t-verteilt mit n1+n2-2 Freiheitsgraden. Signifikanzniveau alpha geraten ~5% -> t0.05, n1+n2-2
H0 kann verworfen werden, wenn Testgrösse > tabelliertem Wert

So, nachrechnen mit Windowstaschenrechner + Bleistift: testgrösse ~25,985898
-> grobe Schätzung ohne Tabelle: Mittelwerte sind zum Niveau alpha=0,05% unterschiedlich -> H0 kann verworfen werden

HTH
mfg M.L.

Hallo Sven,

Den t-Test auf die logarithmierten Daten anzuwenden usw. ist alles korrekt. Dein Wert, den Excel dir ausspuckt, ist der empirische alpha-Fehler. Das ist der Wert des alpha-Fehlers, mit welchem der gefundene Mittelwertunterschied gerade noch als statistisch signifikant betrachtet werden kann. Will heißen, wenn dieser Wert kleiner ist als die von dir gesetze Grenze für den alpha-Fehler, dann kannst du H0 verwerfen und davon ausgehen, dass die beiden Stichproben nicht aus der selben Grundgesamtheit stammen. Der alpha-Fehler ist die Rate and falsch-positiven Ergebnissen, die bei Vergleichen rauskommen, wo in Wahrheit keine Mittelwertunterschiede sind (In den Biowissenschaften hat sich hier ein Wert von 0.05 (5%) eingebürgert. Unter 20 Tests in Wahrheit gleicher Stichprobenproben bekommt man also - durchschnittlich - einmal falschen Alarm). Der von dir genannte Wert ist praktisch Null (10 hoch minus hastenichtgesehen), also _deutlich_ kleiner als 0.05. Soweit so gut.

Du hast aber ein ganz anderes Problem:

Sehr viele Meßwerte. Nicht, das der Test dabei nicht funktionieren würde - das tut er gut, sehr gut sogar - aber das Ergebnis ist oft nicht bedeutungsvoll. Du bemerkst den Unterschied: statistisch signifikant wissenschaftlich signifikant ist nicht das selbe!

Das Problem ist nun, dass ein t-Test bei sehr, sehr geringen Unterschieden der Mittelwerte immer „signifikant gemacht“ werden kann, indem hinreichend große Stichproben gemessen werden. Deine Stichproben sind, nun ja, gewaltig. So 20-50 Werte pro Gruppe sind schon viel - und du hast mehr als 10000… Also nicht verwunderlich, das der Test „positiv“ ist.

Die entscheidende (weil wissenschaftliche) Frage ist aber: Ist der (durch den Test nachgewiesene) Unterschied von praktischer Bedeutung bzw. relevant ? Da kann dir leider kein Statistiker helfen, da ist dein Fachwissen gefragt. Wenn du vorher schon weißt, dass die Behandlung die mittlere Partikelgröße um mindestend einen bestimmten Betrag verändern muss, kannst du das im t-Test einfach berücksichtigen. Wenn du keine Ahnung hast, hilft dir Cohen vielleicht weiter (google mal!). Stichwort „Effektgröße“. Effekt ist der Mittelwertunterschied im Verhältnis zur Standardabweichung. Ein Wert = 0.7 zeichnen einen „starken Effekt“ aus, dazwischen spricht man von einem „mittleren Effekt“. Schwache Effekte werden als praktisch bedeutungslos gehandelt, bei mittleren Effekten kann man sich streiten und bei straken kann man guten gewissens von einer praktischen Relevanz ausgehen.

Deine Werte ergeben übrigends eine Effektgröße von 0.36, also einen mittleren Effekt.

LG
Jochen

Hallo Sven!

Ich verstehe das ned so ganz…

Wie kommen die „hohen“ N-Werte zustande? Das ist doch wohl nicht die Anzahl der Proben…? Wenn ich das im Ausgangsposting richtig verstanden hatte, hast Du 12 Proben insg. mikroskopiert ausgewertet, also n=12?

Ansonsten: Wenn keine Normalverteilung vorliegt, liegt keine vor - nicht weiter schlimm.

Dafür gibt es ja Tests, welche ohne Normalverteilungsannahme funktionieren, und die sind in der Regel ohnehin besser.

Ich denke da an den Mann-Whitney-U-Test, der über Rangbildung zwei unabhängige Stichproben vergleicht. Wenn ich das Testproblem hier richtig verstanden habe, liegt hier Unabhängigkeit der Datensätze vor.

Es gäbe aber Notfalls auch als „Pendant“ für 2 abhängige Stichproben, den Wilcoxon-Vorzeichen-Test, oder aber den exakten Vorzeichentest oder den Lam-Longnecker-Test.

Wie kommst Du darauf, dass die Daten nicht Normalverteilt sind? Kann Excel das (wusste ich nicht). „Chi-Quadrat-Anpassungs-Test“ oder „Kolmogoroff-Smirnov“?

Bei 12 Daten rechne ich Dir gerne den U-Test, von Hand oder SPSS - sind es aber doch über 10.000 Daten in 2 Datensätzen, erkläre ich Dir gerne, wie es theoretisch funktioniert… :wink:

Lieben Gruß
Patrick