Statistischer Vergleich von Messreihen

Hallo,

ich würde gerne wissen, wie ich statistisch einigermassen sinnvoll Messreihen vergleichen kann, also bestätigen, dass sich 2 Gruppen von Messungen unterscheiden oder nicht.
Vorliegen habe ich für jede Gruppe ca. 3 Messungreihen (für jede Messreihe alle 10s ein Wert, das ganze über jeweils mehrere Minuten).
Wäre es z.B. möglich, von meinen Gruppen jeweils eine mittlere Messkurve zu bilden und für diese dann eine Art Vertrauensintervall?! zu bestimmen? Wenn jede meiner beiden Kurven jeweils im Intervall der anderen liegt, kann man sie als gleich bezeichen? Wie geht man in diesem Fall mit „Ausreissern“ vor? Die würden ja auch den Mittelwert deutlich verändern!
Oder wie könnte man das Problem sonst sinnvoll analysieren?

Vielen Dank & Gruss,
Vroni

Hi,

Soweit ich dich verstehe, wird die Lösung deines Problems die Kreuzkorrelation sein. Über sie lässt sich leicht die Ähnlichkeit zwischen zwei Signalen feststellen. Ich gehe davon aus, dass du digitale Signale hast:
y und x seien Signale mit jeweils 1000 Werten. (ich schreib mal auf vbasic, da ist es am lesbarsten)
for i=-1000 to 1000
for j=0 to 1000
phi(i)=y(j)*x(j-i)
next
next

Wenn du nun die Kurve phi(i) aufträgst, kannst du schnell erkennen, wo (bei welcher relativen Verschiebung der x-Kurve) die grösste Übereinstimmung ist: am Maximum. Natürlich müsstest du programmiertechnisch x mit 1000 nullen vorher und 1000 nullen nachher auffüllen…

frag weiter, wenn was nicht klar sein sollte.

Omar Abo-Namous

http://www.islaminhannover.de

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo meinerseits,

ich habe die starke Vermutung, dass die „Varianzanalyse“ (einfach und doppelt) hier weiterhilft.

Ich hoffe das hilft
mfg M.L.

Hi,

habe ich das richtig verstanden, dass die Varianzanalyse eigentlich den Einfluss von Parametern auf ein "Versuchs-"Ergebnis bestimmt? Dann ist es aber nicht, wonach er gefragt hat. Oder??

bis dann,

Omar Abo-Namous

http://www.islaminhannover.de

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

also im Prinzip habe ich den Einfluss eines Parameters ja schon mit einer Messung „bestätigt“ und will ihn nicht berechnen. Ich will jetzt nur wissen, ob diese Parameteränderung wirklich einen signifikanten Einfluss hat. Was du mir vorhin geschrieben hast hab ich zwar denk ich verstanden, ich weiss nur nicht, wie ich diese Rechnung praktisch (hab leider nur Excel/ ExcelStat) umsetzen soll. Und ich bin ausserdem auf den t-test gestossen, wäre der auch eine Möglichkeit?

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

also im Prinzip habe ich den Einfluss eines Parameters ja
schon mit einer Messung „bestätigt“ und will ihn nicht
berechnen. Ich will jetzt nur wissen, ob diese
Parameteränderung wirklich einen signifikanten Einfluss hat.
Was du mir vorhin geschrieben hast hab ich zwar denk ich
verstanden, ich weiss nur nicht, wie ich diese Rechnung
praktisch (hab leider nur Excel/ ExcelStat) umsetzen soll. Und
ich bin ausserdem auf den t-test gestossen, wäre der auch eine
Möglichkeit?

Wenn du keine zeitliche Verschiebung messen willst, sondern einen einfachen Korrelationsfaktor herausbekommen willst, gibt es in Excel eine eingebaute Funktion:
=CORREL(B1:B17;C1:C17)
gibt die Korrelation zwischen den beiden Vektoren (Signale) in der Spalte B und C.
Bei „1“ sind die beiden Signale gleich.

ich versuch mal weiterzusuchen, wie man das noch besser machen könnte. Ich würds im Normalfall mit Matlab machen…

Omar Abo-Namous

http://www.islaminhannover.de

Hi,

die Ausfuehrungen von Markus und Omar in Ehren -
aber wenn du nicht genau weisst, was du willst, dann hat die ganze Auswerterei keinen praktischen Sinn.
Wie lautet denn die Aufgabenstellung?
Um was dreht es sich denn?
Gruss,

Hallo,

ich messe bei einem chemischen Auflösungsversuch Leitfähigkeiten. Dabei führe ich eine Messung 3x durch, dann ändere ich einen Parameter und messe noch 3x. Und- wie gesagt- nehme ich pro Messung alle 10s einen Wert auf, über mehrere Minuten. Ich bekomme dadurch ähnliche, aber nicht völlig identische Kurven für die Messreihen mit gleichem Parameter.

Was ich möchte, ist die jeweils 3 zusammengehörigen Reihen zusammenzufassen (wie weiss ich leider nicht, vielleicht am besten mit einer Mittelwertskurve, in die ich irgendwie die Abweichungen einbringen muss?).

Die beiden resultierenden „Mittelwertskurven“ will ich dann untereinander vergleichen, also sagen, es gibt einen Unterschied bei Parameteränderung (oder eben nicht). Das ganze sollte zum Schluss übersichtlich darstellbar und auch bei nur je 3 Messungen einigermassen aussagekräftig sein.

Oder was musst du noch wissen, um daraus eine Auswertung machen zu können???

Gruss,
Vroni

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Vroni,

Bevor Du die Daten verarbeitest, solltest Du schon eine Idee haben, welches mathematische Modell dahintersteckt. Vielleicht musst Du Deine Daten mitteln, vielleicht auch den log Deiner Daten. Aber du verrätst ja nicht, um was es geht.

ich messe bei einem chemischen Auflösungsversuch
Leitfähigkeiten. Dabei führe ich eine Messung 3x durch,

Ich verstehe das nicht. Du kannst doch nicht die gleiche Messung dreimal durchführen, das geht bei Deiner Art von Versuch ja gar nicht. Du kannst das Experiment 3x machen, aber die Messung (also ohne Wiederholung des Experiments) alleine wird es ja wohl nicht möglich sein (Also, wenn Du die Masse eines Metallblocks misst, kannst Du die Messung (=wägen) beliebig oft wiederholen. Bei einem Auflöseversuch kannst Du nur das ganze Experiment wiederholen. Verbunden mit dem ganzen Aufwand: Reinigen, Kalibieren, Wägen usw. ).
Hast Du eine Zeitabhängigkeit, evtl. exponentiell? Wie sieht es mit der Temperaturabhängigkeit aus?
Wenn Du exakt den gleichen Versuch dreimal hintereinander machst (d.h. Temperatur, Menge des gelösten Stoffes, Start der Messung zum gleichen Zeitpunkt), dann erscheint mir Mitteln als Methode der Wahl. Bei bestimmten Systemen ist es geschickter, zuerst zu normieren (auf eine für das jeweilige Experiment zu bestimmende Zeitkonstante) und dann zu mitteln.

Was ich möchte, ist die jeweils 3 zusammengehörigen Reihen
zusammenzufassen (wie weiss ich leider nicht, vielleicht am
besten mit einer Mittelwertskurve, in die ich irgendwie die
Abweichungen einbringen muss?).

naja, bei drei Kurven kannst Du ja auch noch einfach alle drei plotten, wenn Du etwas über die Streuung wissen willst. Mit drei Messpunkten kann man schlicht und einfach noch keine Statistik machen , auch wenn das viele Mediziner zu glauben scheinen *fg*

Die beiden resultierenden „Mittelwertskurven“ will ich dann
untereinander vergleichen, also sagen, es gibt einen
Unterschied bei Parameteränderung (oder eben nicht). Das ganze
sollte zum Schluss übersichtlich darstellbar und auch bei nur
je 3 Messungen einigermassen aussagekräftig sein.

Also, wenn der Effekt schwach ist, wirst Du um ein paar sorgfältige Messungen mehr nicht herumkommen. Bei einem starken Effekt reichen Deine drei Messungen u.U. völlig.
Allerdings macht es keinen Sinn irgendeine Statitik an Daten zu machen, wenn Du nicht die geringste Idee hat, welche Hypothese Du überhaupt testen willst.
Solltest Du also rein explorativ arbeiten müssen (d.h. Du hast einfach noch keine Ahnung, welche Gesetzmässigkeit dahinterstecken könnte), ist es am besten, wenn Du mit verschiedenen Auswertemethoden „herumspielst“. Von statistischen Tests würde ich bei einer Leitfähigkeitsmessung allerdings die Finger lassen. Erste Auswertungen können dann Mittelwerte, log-lin oder log-log Plots oder ähnliches sein.

Ciao R.

1 „Gefällt mir“

Hallo,

Was ich möchte, ist die jeweils 3 zusammengehörigen Reihen
zusammenzufassen (wie weiss ich leider nicht, vielleicht am
besten mit einer Mittelwertskurve, in die ich irgendwie die
Abweichungen einbringen muss?).

das sollte doch leicht sein. Du hast Excel? Pro Messung/Versuch wirst du ja 6 (od. 7) Werte (jede 10 sec, 1 Minute lang) haben. Diese kannst du in einer Spalte in Excel eintippen, jeden Versuch, neben dem anderen. Dann kannst du den Mittelwert bilden und du hast eine Mittelwertkurve. (Zum Verständnis (meinerseits): Die drei Versuche sollten eigentlich die selben Ergebnisse (theoretisch) liefern?! Wenn nicht, dann vergiss die Mittelwertgeschichte.)

Dasselbe tust du mit den 3 Versuchen mit dem veränderten Parameter. Dann müsstest du dir am besten die Kurven plotten lassen, dann kannst du weiterentscheiden.

Wie ich dein System verstehe, müsste jeweils eine Sättigungskurve zu sehen sein. (?) Bei vollständiger Auflösung des Salzes sollte der Widerstand der Flüssigkeit minimal/die Leitfähigkeit maximal sein. Welchen „Parameter“ willst du dann ändern ? Das Salz? Die Menge des Salzes?..
Die Bewertung (Unterschied oder kein Unterschied) musst du schon manuell machen, es macht keinen Sinn von vornherein eine Formel dazu auszuformulieren…

Omar Abo-Namous

http://www.islaminhannover.de

1 „Gefällt mir“

Hallo Vroni,

wie bereits geschrieben: um ordentliche Statistik zu machen, reichen drei Meßwerte nicht aus. Dazu müsste man das Experiment vielleicht zehn mal unter identischen Bedingungen wiederholen. Was Du vielleicht tun kannst:

Du mittelst die drei Kurven zu jedem der beiden Parameter. Dann hast Du zu jedem Parameter vier Kurven. Du plottest alle 8 Kurven. Liegen sie übereinander oder in der Nähe

(Beispiel: Parameter 1, nach 30 Sekunden: Meßwerte: 7, 8, 9, Mittelwert: 8
Parameter 2, nach 30 Sekunden: Meßwerte: 9, 10, 11, Mittelwert: 10)

dann kannst Du schon mal keine begründete Aussage machen. Falls sich die Kurven nicht berühren, hast Du eine erste Ahnung von Deinem zufälligen, statistischen Fehler (aber auch nur eine Ahnung).

Danach bringst Du den Meßfehler Deines Meßgerätes in Erfahrung (muss irgendwo angegeben sein, meist in der Art „5 % des Endwertes“). Wenn der Endwert z.B. 100 ist, kann das Gerät bei einem „wahren Wert“ von 20 auch 15 oder 25 anzeigen. Dannn legst Du um Deine Meßwerte so eine Art Fehlerstreifen, d.h. Du addierst zum jeweils höchsten Meßwert die Meßungenauigkeit des Meßgerätes und vom niedrigsten Meßwert zu einem Zeitpunkt ziehst Du sie ab. Dieser Fehlerstreifen gibt Dir grob an, um welchen Betrag ein Meßwert unter identischen Bedingungen schwanken kann. Wenn sich die Fehlerstreifen der beiden Parameter nicht berühren, kannst Du mit einiger Sicherheit sagen, dass der Parameter was tut.

Genau genommen muss man die Fehlerrechnung weiter treiben und untersuchen, wie die einzelnen Parameter auf das System wirken. Wenn Du z.B. 100 g Salz in 1 l Wasser auflösen willst, bekommst Du vielleicht einmal 95 g Salz auf 1,02 l Wasser und einmal 105 g Salz auf 0,95 l Wasser (übertrieben). Die Fehler, die Du da machst, müssen natürlich auch untersucht oder abgeschätzt werden.

Hoffentlich konnte ich Dir etwas helfen.

Grüße, Thomas

Die drei Versuche sollten
eigentlich die selben Ergebnisse (theoretisch) liefern?! Wenn
nicht, dann vergiss die Mittelwertgeschichte.)

Es gibt Messungen, bei denen die Ergebnisse sehr gut reproduzierbar sind, da werde ich wohl wirklich einfach die Mittelwerte berechnen und das Ganze so darstellen.
Bei anderen sind vermutlich die Abweichungen wirklich zu gross und ich werd sie einzeln darstellen, auch wenn das ein ziemliches Gewirr werden wird.

Wie ich dein System verstehe, müsste jeweils eine
Sättigungskurve zu sehen sein. (?) Bei vollständiger Auflösung
des Salzes sollte der Widerstand der Flüssigkeit minimal/die
Leitfähigkeit maximal sein. Welchen „Parameter“ willst du dann
ändern ? Das Salz? Die Menge des Salzes?..
Die Bewertung (Unterschied oder kein Unterschied) musst du
schon manuell machen, es macht keinen Sinn von vornherein eine
Formel dazu auszuformulieren…

Nur noch falls es dich interessiert was ich mache, und wie sich die Leitfähigkeit dabei verhält:
Ich löse 3 verschiedene Salze, die in Schichten angeordnet sind mit einem kontinuierlichen Wasserstrom auf. Eine Sättigungskurve entsteht dabei nicht, weil das Wasser mit Salz immer wieder abfliesst. Bei dem Versuch kann ich dann z.B. die Schichtenanordnung verändern, oder die Granulierung eines Salzes.
Und dadurch entstehen einfach mehr oder weniger flache Graphen, die ihr Maximum sofort oder zeitverzögert haben.
Was ich dann z.B. wissen wollte, ob allein die Verwendung eines anderen Granulats einen entscheidenenden Unterschied bei der Schnelligkeit der Auflösung macht…

Vielen Dank für deine Hilfe!
Gruss,
Vroni

Hallo R,

Bevor Du die Daten verarbeitest, solltest Du schon eine Idee
haben, welches mathematische Modell dahintersteckt. Vielleicht
musst Du Deine Daten mitteln, vielleicht auch den log Deiner
Daten. Aber du verrätst ja nicht, um was es geht.

wenns dich noch interessiert, siehe Omar…

Du kannst doch nicht die gleiche
Messung dreimal durchführen, das geht bei Deiner Art von
Versuch ja gar nicht. Du kannst das Experiment 3x machen.

ja, da hab ich mich wohl nicht eindeutig oder eindeutig falsch ausgedrückt: ich wiederhole natürlich die Experimente…

Was ich möchte, ist die jeweils 3 zusammengehörigen Reihen
zusammenzufassen (wie weiss ich leider nicht, vielleicht am
besten mit einer Mittelwertskurve, in die ich irgendwie die
Abweichungen einbringen muss?).

naja, bei drei Kurven kannst Du ja auch noch einfach alle drei
plotten, wenn Du etwas über die Streuung wissen willst.
Mit drei Messpunkten kann man schlicht und einfach noch keine
Statistik machen
, auch wenn das viele Mediziner zu glauben
scheinen *fg*

Ja, das war mir schon klar, deshalb wollte ich ja wissen, wie ich eine sinnvolle Darstellung machen kann, auch wenn ich jeweils nur 3 Werte habe.

Allerdings macht es keinen Sinn irgendeine Statitik an Daten
zu machen, wenn Du nicht die geringste Idee hast, welche
Hypothese Du überhaupt testen willst.

Ja, vermutlich findet sich da auch keine vernünftige Methode, ausser den Mittelwerten…

Vielen Dank trotzdem für deine Mühe!
Gruss,
Vroni