Wahrscheinlichkeit von Messwerten?

Hallo an alle Experten,

als Nicht-Mathematiker hoffe ich doch noch auf einen grünen Zweig in Bezug auf mein Problem zu kommen.

Annahme (Zahlen sind fiktiv):
(1) Ich habe einen Messdatensatz für 10 Jahre (Jahresdurchschnitte der Windgeschwindigkeiten).
(2) Die Messunsicherheit beträgt 5%.
(3) Die Standardabweichung beträgt 3%.

Nun möchte ich Wahrscheinlichkeitsszenarien erstellen in der Form P50 (=Probability 50), P75, P90 mit Ergebniserwartungen erstellen (für 25 Jahre (optional 5, 10 ,x ,…)).
Ich erwähne die 25 Jahre, da ich mir vorstellen kann, dass (z.B.) der P75-Wert mit der Dauer des betrachteten Zeitraums durchaus variieren kann.

Ich bedanke mich schon im Voraus für jede Form der Hilfe.

Viele Grüße,
Halim

Hi Halim,

ich glaube das Problem wird nicht wirklich klar - willst du die Werte extrapolieren? Und was sind P50-Werte?
I.a. würde man die gegebenen Werte durch eine geeignete Funktion approximieren, ein prediction interval drum basteln und dann auf 25 Jahre extrapolieren.
Grüße,
JPL

Hallo Halim,

Annahme (Zahlen sind fiktiv):
(1) Ich habe einen Messdatensatz für 10 Jahre
(Jahresdurchschnitte der Windgeschwindigkeiten).
(2) Die Messunsicherheit beträgt 5%.
(3) Die Standardabweichung beträgt 3%.

Nun möchte ich Wahrscheinlichkeitsszenarien erstellen in der
Form P50 (=Probability 50), P75, P90 mit Ergebniserwartungen
erstellen (für 25 Jahre (optional 5, 10 ,x ,…)).
Ich erwähne die 25 Jahre, da ich mir vorstellen kann, dass
(z.B.) der P75-Wert mit der Dauer des betrachteten Zeitraums
durchaus variieren kann.

Jetzt fehlt dir noch das richtige Klimamodell.
Und ein Weltwirtschaftsmodell, für den CO2-Ausstoss und politische, klimawirksame Entscheidungen.

MfG Peter(TOO)

Hallo,

(1) Ich habe einen Messdatensatz für 10 Jahre

warum gibst du deine zehn Zahlenpaare nicht einfach hier an?
Jahr x und Durchschnitts-Windgeschwindigkeit y in km/h.

(3) Die Standardabweichung beträgt 3%.

Die Standardabweichung wird immer in der Dimension angegeben die gemessen wurde.

Gruß

watergolf

Guten Morgen watergolf,

vielen Dank für Deinen Beitrag.

Hier die Zehn Zahlenpaare:
1995 = 7,8 m/s
1996 = 9,5 m/s
1997 = 10,3 m/s
1998 = 6,4 m/s
1999 = 8,7 m/s
2000 = 9,1 m/s
2001 = 7,1 m/s
2002 = 10,6 m/s
2003 = 6,1 m/s
2004 = 11,1 m/s
2005 = 8,3 m/s

Werte gemessen mit einer (fiktiven) Unsicherheit von 5%
Standardabweichung (absolut) = 1,681233
Durchschnittsgeschwindigkeit = 8,636364 m/s
Standardabeichung in Prozent (Standardabweichung/Durschnittsgeschwindigkeit) = 19,46691 (die 3% waren falsch berechnet).

Gruß,
Halim

Hi JPL,

vielen Dank für Deinen Beitrag.

Da ich nicht aus dem Statistikfach bin, weiß ich nicht, ob man da von Extrapolieren sprechen kann. P50 heist „mit 50%iger Wahrscheinlichkeit liegen die Werte darüber“, entsprechendes gilt für P75 und P90.

Hintergrund ist Folgender:
Banken investieren in Projekte. Bei erneuerbaren Energien möchten die Banken etwas sicher gehen, daher verlangen Sie, dass man bei der Annahme der zur Verfügung stehenden Naturressource (in dem Fall Wind) konservativer herangeht. Die Kraftwerksprojekte werden dabei typischer Weise über einen Zeitraum von 25 Jahren betrachtet.

In Bezug darauf möchte ich nun diese P50, P75 und P90-Modelle bestimmen. Und falls die Betrachtungszeit von 25 Jahren eine Rolle spielt (in Hinblick auf die Messunsicherheit vielleicht?), diese natürlich auch rechnerisch beücksichtigen.

Gruß,
Halim

Hallo Halim,

deine Zeilen an „JPL“ habe ich auch gelesen. Der Anwendungsfall für die Statistik ist also ein rein praktischer.

Eine Frage für die Banken stellt sich: „Wird die mittlere Jahresgeschwindigkeit des Windes am Meßort bzw. Investitionsort in Zukunft gleich bleiben?“

Diese Frage kann man guten Gewissens aus deinen Zahlen (von 1995 bis 2005) heraus mit „Ja“ beantworten. Sieben Jahre nach deinem letzten Wertepaar weht immer noch der Wind.

Unterwirft man die Werte einer linearen Regressionsanalyse, so ergibt sich als Trendanalyse eine – zur Zeitachse nahezu parallele - Gerade in die Zukunft hinein.
Der Korrelationskoeffizient der Geraden ist natürlich sehr niedrig (ca. 0,06), aber das sieht man den Werten bereits an wenn man sie in ein Streudiagramm einträgt.
Aus der „Punktewolke“ ist statistisch nicht viel herauszuholen. Man hätte auch mit einem Dartpfeil auf ein Stück Papier, das in der Mitte einen Zielpunkt enthielt, werfen können um diese Verteilung zu bekommen.
In der Statistik gibt es verschiedene spezielle Verteilungen die nach dem Namen ihrer Entwickler benannt sind. In der Firma nannten wir früher solche Verteilungen wie bei dir immer spaßeshalber eine: „Verteilung nach Schrot“, da man sie auch mit einer Schrotflinte erzielen kann.
Der Chef war dann immer sauer, weil er aus unseren Betriebsmessungen heraus Verbesserungen sehen wollte, was aber bei solchen Verteilungen nicht funktioniert.

Du könntest dir das Buch: Richard Mohr, „Statistik für Ingenieure und Naturwissenschaftler“ expert verlag 2. Aufl. (2008) besorgen, falls deine Chefs keine statistische Ruhe geben sollten.
Es ist für Praktiker geschrieben und man braucht ja nicht alle Kapitel zu lesen, wenn man die Statistik nicht zu umfassend benötigt.

Über die „Meßunsicherheit“ deiner Geschwindigkeitsdaten brauchst du dir keine Gedanken zu machen. Die Werte hast du sicher vom Deutschen Wetterdienst bekommen. Dort könntest du nachfragen, die Geräte werden laufend kalibriert.
Wichtiger ist meiner Ansicht nach, ab welcher Windgeschwindigkeit der wirtschaftliche Betrieb einer Anlage beginnt. Diese Geschwindigkeit soll etwa bei 5 – 6 m/s liegen. Über welchen Zeitraum (z.B. pro Jahr) hielten diese Minimalwerte an deinem Meßort an?

Viel Erfolg

watergolf

Hi Halim,

wie watergolf schon schreibt ergibt die Regression keine besonders sinnvollen Werte -was auch nicht wundert, denn warum sollte sich die Windgeschwindigkeit über die Jahre ändern, bzw. davon abhängig sein.
Deine Px-Werte sind sogenannte Perzentile, P50 entspricht dem Median.
Diese Perzentile aber aus nur 10Werten zu bestimmen ist etwas dünn, weil man eben nur 10%-schritte machen kann.
Ferner, wie gesagt, eine Prognose für in 25 Jahren geht nur über Extrapolation, aber da sich kein wirklicher Zusammenhang zwischen Jahr und Wind-v ergibt ist das nicht besonders zielführend.
Also: sinnvoll wäre es, die Daten pro Monat oder gar Woche zu bekommen und dann eine saisonale Abhängigkeit über die Monate zu berechnen (=Zeitreihenanalyse).

Grüße,
JPL

Hi watergolf,

vielen Dank für Deine schnelle Antwort!

Deine Schilderungen haben mir sehr geholfen bzw. mir ein Gefühl gegeben von welcher Richtung her ich mich an die Thematik „heranwagen“ sollte.

Ebenso vielen Dank für den Verweis auf das Fachbuch.

Beste Grüße,
Halim

Hi JPL,

auch Dir vielen Dank für Deine schnelle Antwort!

Dein Hinweis, dass eine Prognose für 25 Jahren (und vor allem wie diese Prognose durchgeführt wird) in meinem Falle nicht besonders zielführend ist, war sehr gut für mich. Ich werde versuchen, die Thematik so anzupacken, wie es aus der Perspektive von Euch Experten richtig wäre.

In diesem Kontext waren die Antworten aller Experten wirklich sehr hilfreich für mich. Danke an alle!

Beste Grüße,
Halim