Hallo,
erst mal danke für die schnelle Reaktion 
Die Daten der Leerstandsraten wurden sinnvoll erhoben, das
heißt sie basieren auf gewisse „Vorschriften“ nach
gif(Gesellschaft für Immobilienforschung) zur Ermittlung der
Leerstandsraten.
Das heißt nicht unbedingt, dass diese Form der Datenerhebung sich für deine Fragestellung eignet. Ich sage das nur so ganz generell - ich habe von dem Them, der Art deiner Daten und den Zusammenhängen keine Ahnung. Es geht mir nur darum, klarzumachen, dass man schon bei der Art der Datenerhebung aufpassen muss wie ein Fuchs, wenn das Ergebnis am Ende einigermassen Sinn machen soll.
Natürlich ist die Büronutzung auch abhängig von den
Mietpreisen. Allerdings soll ausschließlich der Einfluss von
Konunktur untersucht werden, da die Konjunktur als kurz-bis
mittelfristiger einflussparameter auf den Immobilienmarkt
angesehen wird.
Genau das ist ja das Problem: Die Büronutzung hängt sicher nicht _nur_ von der Konjunktur ab. Wenn du die anderen (zumindest die bekannten und offensichtlichen) Parameter einfach außeracht läßt, dann tut die Analyse ja so, als wären die Büronutzungen _nur_ bedingt durch die Konjunktur. Wenn man schon weiß, dass es andere, bedeutsame Einflussgrößen gibt, weiß man auch vorher schon, dass das Ergebnis der Analyse schlichtweg sinnfrei ist. Zur Verdeutlichung Beispiele(!!) zweier Extremfälle:
a) Die Büronutzung sinkt, weil Unternehmen wegziehen oder Pleite machen (Zusammenhang zur Konjunktur); sie steigt aber auch, weil es durch die Durchsetzung von Umweltauflagen für andere Firmen attraktiver wird, hier Produktionsstandorte aufzugeben und ins Ausland zu verlagern, im Gegenzug hier aber die Verwaltung und Entwicklung auszubauen. Beide Effekte mögen sich in der Summe aufheben. Somit zeigt deine Untersuchung nichts, obwohl zwei wesentliche Vorgänge stattfinden.
b) Sowohl die Konjunktur als auch die Büronutzung hängen beide ab von einem dritten Faktor (mir fällt jetzt kein Beispiel ein; vielleicht vom Ölpreis - - egal). Eine Analyse, welche diesen Faktor berücksichtigt, würde vielleicht zeigen, dass die Konjunktur direkt praktisch keinen Einfluss auf die Büronutzung hat (weil sich die Änderung in Büronutzung UND Konjunktur BEIDE alleine durch die Änderung des dritten Faktors erklären lassen), während eine Analyse nur der Beiden Faktoren eine starke Korellation zeigen.
Die Wirklichkeit ist sicher komplizierter.
Ich bin tatsächlich von einem linearen Zusammenhang
ausgegangen. Ich ging davon aus, dass wenn das Bip steigt,
dass die Leerstandsflächen zurückgehen und gleichzeitig die
Mietpreise anziehen.
Ob das plausibel ist, musst du beurteilen können. Ich habe zu wenig Ahnung, würde es aus dem Bauch heraus aber eher für unwahrschenilich halten.
Ja,die Werte streuen sehr weit, liegt daran,dass die
Leerstandsrate in einem Jahr u.a. von 1,5 Prozent auf 4,5
Prozent angestiegen ist.Diese beiden Werte sidn aus den
Krisenjahren 2001 und 2002.
Tjaaaa, jetzt gibt es zwei Möglichkeiten:
a) Krisen beeinflussen die Konjunktur sehr stark und diese beiden Werte sind die einzigen, die einen Nennenswerten Effekt aufweisen oder
b) Krisen beeinflussen Tod&Teufel und ein möglicher Zusammenhang zur Büronutzung ist zu verwischt oder verfälscht, so dass diese Werte das Ergebnis unbrauchbar machen und somit nicht in die Analyse mit einbezogen werden sollten.
Aus das läßt sich nur mit Sachverstand entscheiden, den ich nicht habe.
die 0,04 ist ja das Bestimmtheitsmaß, es gibt ja das
Verhältnis der Varianz der Beobachteten Werte und der
geschätzten Werte an. oder?
Korrekt.
Ich habe das Signifikanzniveau innerhalb meiner Arbeit auf 0,1
gesetzt. Ist das zu hoch?
Nein. Das ist in Ordnung. Es bedeutet, dass wenn viele derartige Analysen gemacht würden, ohne dass in Wirklichkeit Zusammenhänge bestünden, etwa 10% der Analysen fälschlicherweise zum Schluss führen würden, dass es doch einen Zusammenhang gäbe (Typ-I-Fehlerrate). Anders: Sollte es in deinem Fall KEINEN Zusammenhang geben, dann würde dein Ergebnis mit einer Wahrschenilichkeit von 10% zum (falschen) Schluss kommen, dass es einen Zusammenhang gäbe. Wenn du damit leben kannst, ist das ok.
Ich hatte das so verstanden, dass man einen einseitigen Test
dann macht, wenn man schon vorher weiss in welche Richtung es
korreliert, und einen zweiseitigen Test wenn man sich darüber
nicht sicher ist? Ist das falsch?
Im Prinzip schon, aber nicht ganz. Beim einseitigen Test ist es wichtig, dass man „signifikante“ Ergebnisse „in die falsche Richtung“ auch tatsächlich ignoriert. Das macht aber praktisch keiner, und so glaubt man auch keinem, der behauptet, das zu tun. Würde ich eine solche Publikation deiner Daten/Auswertung lesen, würde ich mir denken: „Klasse, _eigentlich_ liegt sein Signifikanzniveau bei 0.2 (und nicht bei 0.1), also ist das Ergebnis mit bis zu 20%iger Wahrscheinlichkeit falsch-positiv - damit verschwende ich nicht weiter meine Zeit…“
Besser ist es, nur dann eineitig zu testen, wenn aus zwingenden logischen Gründen der Zusammenhang nur in eine Richtung laufen _kann_.
Sicherlich habe ich wenig Daten, liegt nun mal an der
mangelnden Transparenz der Immobilienwirtschaft.
Hey, das war kein Vorwurf. Es muss halt nur klar sein, dass man mit Statistik nicht mehr aus Daten rausholen kann, als ohnehin schon drinsteckt. Ich kann aus 100g Mehl kein 2kg-Brot backen.
Ich konnte jetzt aber nochmal drei weitere Datensätze
hinzugewinnen.
Mehr ist immer besser. Hierbei zumindest 
Die Korrelation (auf Basis der Wachstumsraten) sind jetzt nach
Pearson:
r=-0,010551075
sig: 0,486
Also: überhauptgarnichts.
Berücksichtige ich einen time lag von einem jahr(da der
Immobilienmarkt immer erst zeitverzögert reagiert), erhalte
ich eine Korrelation von -0,425 (timelag von 2 Jahren = -0,36)
und ein sig. von 0,074 (sig. für 2 jahre = 0,125). Bei einem
angesetzten Signifikanzniveau von 10 Prozent hätte ich eine
signifikante Korrelation gefunden? oder?
Die Idee mit der Zeitverzögerung ist gut. Problematisch ist die Willkür, wieviele Jahre das sein sollen. Wenn du aus anderen Studien / Daten gute hinnweise auf eine SINNVOLLE Verzögerungsdauer hast, dann solltest du das so rechnen. Einfach mal durchprobieren, wann du was signifikant bekommst, ist KEINE gute Idee; die Wahrscheinlichkeit, dass du irgendein signifikanntes Ergebnis bekommst (wenn in Wahrheit KEIN Zusammenhang besteht), ist dann nämlich deutlich größer als die von dir gewünschten (und gerade noch akzeptablen!) 10% ! (Stichwort: multiples Testen)
ist die anwendung des Prason`schen Korrelationskoeffizienten
vertretbar?
Ja, wenn der Zusammenhang begründbar linear sein sollte.
Ich bin von einem linearen Zusammenhang
ausgegangen. Ist der ansatz der Wachstumsraten doch nicht
optimal?
Das kann ich nicht beurteilen. Das hängt wirklich vom genauen Problem ab. Wenn sich Änderungen an Grenzen abspielen (Sättigungseffekte oder Ausdünnungseffekte), sind Zusammenhänge praktisch nie linear. Theoretisch nicht-lineare Zusammenhänge können aber in bestimmten BEREICHEN durchaus hinreichend gut linear sein.
Ich denke mal, dass meine Ausreiser nach oben das
Ergebnis extrem verfälschen.
Oder dass es die einzigen Daten sind, die dir überhaupt was sagen…
Macht es Sinn den Rangkorrelationskoeefizient zu verwenden?
Ja. An deiner Stelle würde ich den Rangkorrelationskoeefizienten nutzen.
Ich dachte bei metrisch skalierten Daten wäre der nicht
anzuwenden
Doch, doch. Bei nicht-metrisch skalierten Daten kann man Pearson nicht verwenden, weil sowas wie Linearität dann ja nichtmal definiert ist. Andersherum kann man aber eine mögliche Information über einen linearen Zusammenhang in metrischen Daten ignorieren. WENN die Daten linear zusammenhängen, verliert man damit eben Information, d.h., Teststärke (ist wird schwerer, einen Zusammenhang nachzuweisen). WENN die Daten nicht-linear zusammenhängen, ist das Ergebnis von Pearson schlicht falsch.
Kannst du mir vielleicht aufgrund meiner oben gemachten
Angaben nochmal weiterhelfen? 
Hat das geholfen? (was ist eigentlich die einfache Vergangenheitsform von ‚helfen‘: ‚half‘? klingt so komisch…)
LG
Jochen