Regression am Oberrand einer Punktwolke

Hallo,

möchte eine quadratische Regression am Oberrand einer Punktwolke berechnen. Wer weiss, ob dies mathematisch-statistisch möglich ist, und wie man das macht? Hatte die Idee, eine stufenweise Regression zu berechnen und jeweils die Punkte unterhalb der Kurve zu verwerfen und mit den übrigen Punkten weiterzurechnen und mich so immer weiter der oberen Begrenzung anzunähern. Suche auch Literatur dazu. Bin bisher in Statistiklehrbüchern unter Regression bezüglich dieses speziellen Problems noch nicht fündig geworden.

Gruß von Anja

Hi,

Meinst du ausschliesslich am oberen Rand?
Oder stückchenweise die gesamte Punktewolke ?
mathematisch ist das gut möglich, ich sehe leider noch nicht das eigentliche Problem.
Gruss,

Hallo,

letztendlich möchte ich eine Regressionkurve erhalten, die nur die Punkte am Oberrand der Wolke beschreibt, aber ich denke, ich komme mathematisch nur durch stufenweise Regression dahin. Ich habe das bisher manuell gemacht, d.h. jeweils die Pkt. unterhalb der Kurve gestrichen und mit dem Rest wieder eine Regression berechnet. Das geht auch nur, weil ich nur 180 Pkt. in der Wolke habe, aber eigentlich müßte man dies vor allem, wenn die Wolke umfangreicher wird, automatisieren können mit irgendwelcher Software. Bisher nutze ich Excel und SPSS. Außerdem habe ich bisher in keinem Lehrbuch etwas über diese Verfahren gefunden.
Kannst Du mir hier weiterhelfen?
Vielen Dank erstmal für Deine Antwort.
Viele Grüße Anja

Hallo,

letztendlich möchte ich eine Regressionkurve erhalten, die nur
die Punkte am Oberrand der Wolke beschreibt, aber ich denke,
ich komme mathematisch nur durch stufenweise Regression dahin.

Hilf mir doch mal von dem Schlauch auf dem ich stehe runter.
Wieso stufenweise? Warum nicht die obere Punktewolke nehmen und den Rest einfach weglassen?
Ich verstehe das so, dass du die unteren Punkte gar nicht haben willst.

Ich habe das bisher manuell gemacht, d.h. jeweils die Pkt.
unterhalb der Kurve gestrichen und mit dem Rest wieder eine
Regression berechnet. Das geht auch nur, weil ich nur 180 Pkt.
in der Wolke habe, aber eigentlich müßte man dies vor allem,
wenn die Wolke umfangreicher wird, automatisieren können mit
irgendwelcher Software. Bisher nutze ich Excel und SPSS.
Außerdem habe ich bisher in keinem Lehrbuch etwas über diese
Verfahren gefunden.

Ich hab’s leider nach dem 2. Mal immer noch nicht verstanden.
Deshalb klopfe ich mal vorsichtig an und gebe zu bedenken, ob du dich da nicht eventuell verrennst.
Könnte aber auch an meiner Auffassungsgabe liegen.

Kannst Du mir hier weiterhelfen?

Bis jetzt leider nicht.

Vielen Dank erstmal für Deine Antwort.
Viele Grüße Anja

Gruss,
Helge

Hallo,

ich kann , bin ich der Meinung, nicht einfach willkürlich irgendwelche Punkte am Oberrand auswählen. Das muss doch irgendwie statistisch- mathematisch fundiert sein.Deshalb dachte ich eben, dass ich schrittweise vorgehe. Ich hatte gehofft, irgendjemand kennt das Verfahren oder weiss, wo ich das nachlesen kann. Außerdem muss es eine Software geben, die das automatisch macht.

Ich hoffe, Du verstehst nun mein Problem.

Viele Grüße
Anja

Ausklink
Hi Anja,

ich klink mich jetzt aus.
Meiner meinung nach ist das fragwürdige Datenmanipulation.
Mathematische Fundiertheit und Sinn sind zweierlei Dinge.
Trotzdem, viel Erfolg bei deinem Vorhaben.

Gruss,
Helge

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo Anja,

ich bin kein Statistiker, eher ein Theoretiker, deshalb wäre mein Einwand vielleicht etwas grundsätzlicher. Deine Fragestellung enthält keine genaue Information, was die Gerade leisten soll. Ein Verfahren/einen Algorithmus kann man natürlich nur dann angeben, wenn dies geklärt ist. (Das wird wohl Helge auch gemeint haben).

Einfaches Beispiel:

Wir haben die Punkte (1,5), (2,1), (3,6). Soll Deine Gerade den ersten und letzten Punkt verbinden - da der mittlere „zu tief“ liegt? Was ist aber wenn wir ihn auf (2,4) oder (2,3.8) oder… verlegen, gehört er dann zu der Geradenbestimmung dazu…? Wo ist die Grenze? Wenn Du „Dein“ Verfahren anwendest (quadratische Regression, dann Punkte unterhalb der Geraden weglassen und wieder Regression), was ist das Abbruchkriterium? Bis nur zwei Punkte übrig sind? Welche Aussage soll Deine Gerade eigentlich am Ende haben?

Bei der quadratischen Regression (das wirst Du vermutlich wissen) will man eigentlich „die Fehler“ (bzw. das Rauschen - waschechte Statistiker werden da ihre eigenen Bezeichnungen haben) herausfiltern. Voraussetzung ist allerdings, dass man bereits eine lineare Abhängigkeit der Daten vermutet (sonst könnte man z.B. zu Kurven höherer Ordnung oder Splines etc. übergehen). Man sucht also im einfachsten Fall eine Gerade die, salopp gesagt, in der Summe den minimalen Abstand zu allen Punkten hat. Da die Punkte oberhalb und unterhalb der Geraden liegen und die Abstände daher verschiedene Vorzeichen haben, nahm Gauss damals deren Quadrate.

Eine ähnlich präzise Forderung fehlt bei Deiner Aufgabenstellung, daher kann es auch keine präzise Antwort geben.

Viele Grüße,
Martin