2 Punkte aus einem Punktediagramm Signifikanz test

Hallo ihr Statistikwisser,

leider bin ich voll der Statistikkrüppel, deshalb würde ich gern wissen, ob es eine Analyse/Methode gibt, mit der ich zwei bestimmte Punkte aus einem Streu-/Punktediagramm (was zum Beispiel insgesamt 50 Punkte hat) auf signifikanz testen kann. Hat jemand eine Idee? Kann mir jemand helfen? Vielen Dank im Voraus für einen Tipp.

Hallo Unwissender :smile:

Deine Frage ist völlig unklar. Warum, will ich kurz erklären:

Der Ausdruck „statistisch Signifikant“ meint, dass ein Wert hinreichend ungewöhnlich ist, wenn alle Ursachen, die zu diesem Wert führen, nur Zufallsbedingt sind (man sagt dann auch: der Wert ist „überzufällig“). So ein Wert ist irgendeine sogenannte Prüf- oder Test-Größe, die sich aus deinen beobachteten (Meß-)Werten berechnen läßt. Das _kann_ irgendwas sein, tatsächlich hängt die Berechnung der Testgröße - natürlich! - ab von dem, WAS du testen willst.

Genau da liegt das Problem in deiner Frage:

WAS willst du testen?

Normalerweise testet man Hypothesen und nimmt das Testergebnis her, um sich für oder eben gegen die Hypothese zu entscheiden. Daher nennt man diese Tests auch Hypothesentests. Eine solche Hypothese kann nun sein: „Das neue Medikament wirkt besser als das alte“ oder „Männer sind dümmer als Frauen“ oder „Frauen reden mehr als Männer“ oder „Die Füllmenge in den Biergläsern ist 0,4L“ usw usw.

Das generelle Problem bei all den Sachen ist, a) dass das Ergebnis der Beobachtung variabel ist, dass du also nicht bei jeder Beobachtung exakt das selbe siehst und b) dass man für viele Aussagen eigentlich (theoretisch) unendlich viele Beobachtungen machen müßte (was ja nicht geht) und man sich auf Stichproben beziehen muß (wobei wir wieder bei Punkt a wären, weil jede neue Stichprobe sich wieder von den anderen unterscheidet).

Mit seinen Hypothesen offenbart man ja üblicherweise „Nichtwissen“. Klar, sonst brauchte man den Zirkus ja nicht. Ich will ja anhand meiner Beobachtungen zu neuen Erkenntnissen kommen. Durch die Variabilität („Varianz“) in den Beobachtungen sind die Daten aber niemals wirklich eindeutig. Ich kann mir also nie so ganz 100%ig sicher sein, anhand der Daten (Beobachtungen) die ich habe, die richtige Entscheidung zu treffen (also entweder für oder gegen die Hypothese).

Der „Zufall“, der uns diesen Schlamassel einbrockt, bietet uns aber auch einen Lösungsweg. Mit dem Zufall lässt sich nämlich rechnen. Wenn also NUR und AUSSCHLIESSLICH Zufall im Spiel ist, dann kann ich ausrechnen, wie wahrscheinlich ich bestimmte Beobachtungen machen werde. Genau dazu braucht man diese Testgrößen. Sie werden so geschickt berechnet, dass man von ihnen die reine Zufalls-Verteilung kennt. Nun hat man aber auch einen konkreten Wert für diese Größe anhand der konkreten Beobachtungen bestimmt. Natürlich _kann_ so ein Wert zufallsbedingt auftreten, aber jetzt können wir berechnen, wie wahrscheinlich ein solcher Wert rein zufällig auftritt. Diese Wahrscheinlichkeit nennen wir mal „p-Wert“ (p für probability). Wenn das recht wahrscheinlich (p groß) ist, dann begeben wir uns auf dünnes Eis, wenn wir behaupten würden, dass außer dem Zufall eben noch was anderes im Spiel gewesen ist. Ist es hingegen unwahrscheinlich, rein zufällig einen solchen Wert zu erhalten (p klein), dann können wir mit besserem Gewissen behaupten, dass wohl außer dem Zufall noch etwas das Ergebnis beeinflusst hat.

Allgemein gibt es also (fast) immer die prüfbare Hypothese „das war alles nur Zufall“. Diese Hypothese wird auch Nullhypothese genannt (weil man Null Effekt hat, sondern eben nur Zufall). Getestet wird also diese Nullhypothese. Wenn p sehr klein ist, dann entscheiden wir uns gegen die Nullhypothese.

Wie klein ist „sehr klein“? Nun, das hängt davon ab, wie gut du mit einer falschen Entscheidung gegen die Nullhypothese leben kannst.

Wenn du die Nullhypothese ablehnst, wenn p kleiner ist als ein willkürlich gewählter Wert „α“, dann wirst im schlimmsten Fall mit höchstens alpha%iger falsch liegen. Das nennt man auch den „Typ-I-Fehler“ oder die Irrtumswahrscheinlichkeit, d.h. die Wahrscheinlichkeit, mit deiner Entscheidung GEGEN den Zufall falsch zu liegen.

In der bio/medizinischen Forschung werden üblicherweise α = 5% akzeptiert, bei wichtigen Sachen (zB. klinischen Studien) sind 5% Irrtumswahrscheinlichkeit natürlich viel zu hoch und man setzt α = 1%, 0,1% oder noch weniger an.

In der Praxis berechnet man also die Wahrscheinlichkeit dafür, dass der beobachtete Testwert rein zufällig auftreten kann §. Wenn nun diese Wahrscheinlichkeit kleiner ist als die gewünschte Irrtumswahrscheinlichkeit (p ≤ α), dann bezeichnet man das Ergebnis als „statistisch Signifikant“ und verwirft die Hypothese, dass die Beobachtungen nur zufallsbedingt waren.

Hoffentlich hilft dir das, deine Frage genau zu formulieren. In aller Regel werden für die Beantwortung solcher Fragen auch sehr genaue Kenntnisse der Daten nötig sein. Du solltest also alles möglichst genau beschreiben:

Woher sind die Daten? Was sind das für Daten? Welche Annahmen oder Kenntnisse über die Verteilung der Daten gibt es? Was soll anhand der Daten gezeigt werden? Worum handelt es sich bei dem einen Wert, von dem du sprichst? Welche Hypothese soll für diesen Wert getestet werden? - Das ist wohl mindestens alles zu klären, bevor man sinnvoll antworten kann…

LG
Jochen

Hallo Jochen,

hab vielen Dank für deine „kurze“ jedoch sehr hilfreiche Antwort. Folgendes ist gegeben:

Ich habe ein Punktediagramm, indem ca. Wachstumsparameter dargestellt sind die nach Methode A ermittelt wurden. Einen dieser Punkte würde ich nun gern mit einem „neuem Punkt“ der Wachstumsparameter wiedergibt, die nach einer Methode B ermittelt wurden, vergleichen. Mich interessiert also ob Methode A und B ungefähr ein gleiches Ergebnis liefern bzw. die Wachstumsparameter sich nicht signifikant unterscheiden.

Ich hoffe diese Details reichen, damit mir eventuell einer wie Jochen erneut unter die Arme greifen kann. Ich suche nach wie vor einen Test mit dem ich diese Geschichte prüfen kann. Vielen Dank für eine erneute Antwort.

Hallo,

zunächst: Wenn du nur EINEN Punkt herausgreifst, kannst du nicht die Methoden vergleichen. Im besten Fall kannst du nur etwas über genau diesen Punkt sagen. Wenn du nur einen Punkt mit Methode B bestimmt hast, dann fehlt dir eine Schätzung der Varianz für die Methode B. Ohne die bist du aber recht verloren.

Ich habe ein Punktediagramm,

Was für ein Punktediagramm? Ein (X/Y)-Streudiagramm? Was ist die unabhängige Größe? Gibt es einen funktionalen Zusammenhang zwischen den Größen?

Einen
dieser Punkte würde ich nun gern mit einem „neuem Punkt“ der
Wachstumsparameter wiedergibt, die nach einer Methode B
ermittelt wurden, vergleichen.

Was? Willst du zwei Punkte vergleichen? Oder willst sehen, ob ein Punkt B innerhalb eines Konfidenzintervalls von A liegt? Oder willst du wissen, ob die Methoden A und B vergleichbare ergebnisse liefern? Oder was?

Mich interessiert also ob
Methode A und B ungefähr ein gleiches Ergebnis liefern bzw.
die Wachstumsparameter sich nicht signifikant unterscheiden.

  1. Das kannst du nicht anhand nur eines Punktes. Am besten hast du ALLE Punkte SOWOHL mit A als auch mit B bestimmt.

  2. Eine GLEICHHEIT kannst du nicht testen. Du kannst nur UNTERSCHIEDE testen. Hier führt dich der Hypothesentest nicht zum Ziel! Besser ist es, wenn du aufzeigst, wie sehr sich die Methoden unterscheiden und urteilst fachmännisch, ob dieser Unterschied relevant ist oder nicht.

Ich hoffe diese Details reichen,

Nee, leider nicht…

LG
Jochen