Statistik - Frage nach Verfahren

Hallo Ihr,

im Zuge meiner Examensarbeit beschäftige ich mich nun erstmals mit Statistik, bin also leider Anfänger.

Ich habe einen Fragebogen ausgegeben und werte diesen nun aus.

bsp1:
Wie stark ist der Einfluss von Kraft auf das Turnen Ihrer Meinung nach?
stark - mittel - untergeordnet - kein Enfluss.

bsp2:
Die Anforderungen des Turnens an den Organismus sind zu hoch
trifft voll zu - trifft zu - teilweise - weniger - überhaupt nicht

Die Menge meiner Befragten ist in einer Studie 4, in einer 65 und in der dritten 88

Meine Fragen nun, um die Daten auszuwerten und sie im meiner Arbeit entspr. darzulegen bieten sich bestimmte Verfahren an.
Zwar könnte ich angeben, 75% sagen mittel, 12% sagen stark, also ergibt sich blabla.
Alternativ könnte ich auch sagen mittel mit eine Mittelwert von x und einer Standardaweichung von s.

a) macht es bei dieser Frage Sinn die Antwort über Mittelwert und Standardabweichung zu machen und
b) sollte ich mit Signifikanz der Irrtumswahrscheinlichkeit arbeiten?

wenn b) zurtrifft, könnte mir wer an folgendem Beispiel p berechnen?

kein Einfluss 34
untergeordneter 20
mittlerer 5
starker 3
(Mittelwert 1,629, Varianz 0,6849, Standardabweichung 0,82765)

Irgendwie bin ich verwirrt wie ich meine Daten am besten auswerte und vor allem, ob sofern Mittelwert sinn macht eine Signifikanzberechnung nötig ist.

Gruß und Danke,

Hi Nupsnups,

abgesehen davon, dass es nie besonder klug ist, erst Daten zu erheben und sich dann die Auswertung zu überlegen (weil dann das design nicht passt, die Fragestellung gar nicht klar ist, Kovariablen nicht erhoben werden etc), stellen Fragebögen eine immer wieder gern unterschätzte Anforderungen an die Auswertung, da es sich meist nur um Häufigkeiten ordinaler Daten handelt.

zu a)

bsp1:
Wie stark ist der Einfluss von Kraft auf das Turnen Ihrer Meinung :nach?
stark - mittel - untergeordnet - kein Enfluss.

Hier liegt eine klassische ordinale Skala vor. Diese kann eigentlich NUR mit deinen genannten Häufigkeitsaussagen beschrieben werden, denn MW und SD sind 1. massgeblich davon abhängig, welche Werte den Kategorien zugeordnet werden und 2. ob diese Zurodnung auch das Wertverstädnis der Befragten widerspiegeln würde. 3. würde eine Aussage: Im Mittel war die Antwort 2.2485 keinen Sinn, weil es keine solche Kategorie gibt. 4. wird bei deiser Art der Einteilung die SD völlig falsch geschätzt, da nur Werte der Kategorien vorkommen , aber keine dazwischen.
zu b)

b) sollte ich mit Signifikanz der Irrtumswahrscheinlichkeit arbeiten?

?? Die Irrtumswahrscheinlichkeit ist dein Signifikanzniveau (http://de.wikipedia.org/wiki/Irrtumswahrscheinlichkeit) sein sollte.
Signifikanz (http://de.wikipedia.org/wiki/Statistische_Signifikanz) ist eine Eigenschaft des Ergebbnisses.
So gesehen, hast du danach gefragt, ob deine Irrtumswahrscheinlichkeit signifikant sein soll … kurzum: Setze erstmal die üblichen 5% für deine Irrtumswahrscheinlichkeit an. Wenn du dann noch verrätst, was deine Hypothese ist, kann man evtl. einen entsprechenden Test finden.
Grüße,
JPL

Schon mal vielen Dank für Deine Antwort :smile:

Ich habe es mir so gedacht, dass ich meinen Antworten Nummern zuordne:

kein - 1
untergeordnet - 2
mittlerer - 3
starker - 4
(Einfluss)

bekomme ich nun 2,225 heraus raus ist es gerundet „untergeordneter Einfluss“ mit einer Standardabweichug von X
Das könnte man doch entsprechend interpretieren a la „Den Einfluss der Kraft auf das Turnen wird überwiegend als untergeordnet eingeordnet“

Ist dieser Ansatz regelrecht falsch oder einfac untypisch?

Signifikanz, Irrtumswahrscheinlichkeit hab ich wohl ziemlich quer verwendet. Liegt einfach daran, das mir die Begriffe nicht sonderlich klar sind (auch durch Wiki-Erklärungen).
Habe halt gelesen, dass immer wenn von Standardabweichungen und Mittelwert in Studien gesprochen wurde auch die Begriffe der Signifikanz nicht weit waren. Aber nirgendwo habe ich gefunden, verständlich formuliert, wie ich die im Konkreten Fall ausrechne.

Mein Hypothese lautet: Kraft hat einen "großen2 (oder sollte hier das Wort einer der möglichen Antwortkategorien stehen? . dann wäre es „starken“) Einfluss auf das Turnen.

Ich hoffe es ist alles einigermaßen verständlich formuliert :smile:

Gruß,

Hi,

Ich habe es mir so gedacht, dass ich meinen Antworten Nummern :zuordne:
kein - 1
untergeordnet - 2
mittlerer - 3
starker - 4

Das setzt aber wie gesagt voraus, dass den Befragten diese Äquidistanz auch so bewusst ist und sie entsprechend bewerten. Die Untersuchungen darüber gehen etwas auseinander, aber insbesondere, wenn es den Befragten nicht (wie bei einer Likert-skala) bewusst war, dass hier eine Äquidistanz vorliegen soll, wäre ich sehr vorsichtig mit solchen Annahmen.
Dementsprechend ist dieser Ansatz (gleichwohl gerne gemacht) stat. gesehen völliger Quatsch. Wenn man Zwischenwerte als Ergebnis zulässt, dann müsste man auch entsprechende Bewertungen zulassen.

Habe halt gelesen, dass immer wenn von Standardabweichungen und :Mittelwert in Studien gesprochen wurde auch die Begriffe der :Signifikanz nicht weit waren. Aber nirgendwo habe ich gefunden, :verständlich formuliert, wie ich die im Konkreten Fall ausrechne.

Signifikanzen entstehen, wenn die Wahrscheinlichkeit für das eintreten eines Ereignissen kleiner ist als das vorgebene Signifikanzniveau (oft 5%). Diese W’keit berechnet man anhand einer sog. Teststatistik (z.B. t-Wert), die sich aus bestimmten Kennwerte (z.B. Mittelwert und SD) ergibt. Diese Teststatistik folgt dann einer bestimmten Verteilung (z.B. t-Verteilung) anhand derer man dann bestimmen kann, wie wahrscheinlich es ist, ein noch extremeres ereignis zu bekommen als das, was durch die Teststatistik dargestellt wird. Das ist das allgemeine Vorgehen.

Mein Hypothese lautet: Kraft hat einen „großen“ (oder sollte hier :das Wort einer der möglichen Antwortkategorien stehen? . dann :wäre es „starken“) Einfluss auf das Turnen.

Das kannst du gar nicht zeigen :smile:
1.:Ja, da sollte eine mögliche antwortkategorie stehen, sonst hast du selber das Problem, welchen Wert/kategorie du „groß“ zurordnen willst.
2.: Anhand deiner Befragung hast den Einfluß der Kraft auf das Turnen
gar nicht gemessen (dazu hättest du die Kraft der Turner in Beziehung zu ihrer Leistung erheben müssen), sondern du schätzt die (subjektive) Meinung der Befragten.
3. Hypothesen werden immer so formuliert, dass man sie ablehnen muss um das gewünschte Ergebnis zu bekommen (deswegen kann nie eine Hypothese belegen, sondern immer nur falsifizieren). Wenn dein gewünschter outcome also sinngemäß „starker Einfluss der Kraft auf das Turnen“ ist, musst du umgekehrt ansetzen. H0 (Nullhypothese): „Kraft hat keinen starken Einfluss auf’s Turnen“ versus H1 (Alternativhypothese): „Kraft hat einen starken Einfluss auf’s Turnen“
4. Sieht man sich 3. an, frage ich mich, warum du 4 antwortmöglichkeiten vorgegeben hattest. du hättest auch einfach die Frage stellen können: Glauben sie, dass Kraft einen starken Einfluss aufs Turnen hat [Ja/Nein]
5. Versuche, deine Hypothese matematisch zu formulieren, etwa: H0:„Die Mehrheit der Befragten ist der Meinung, dass Kraft keinen starken einfluss aufs Turnen hat“ bzw. H0: p 1/2, wobei der p der Anteil der Befragten ist, die in Kategorie 1,2 oder 3 Antworten.
Hieran kannst du schon sehen, warum ich Punkt 4 anführte und ausserdem führt es einen schon (fast) zur Analyse.

Weiterhin: Du hast was von drei Erhebungen geschrieben - worin unterschieden die sich, bzw. was war der Hintergrund dafür.
Hast du befragt oder einen Zettel ausfüllen lassen?
Hast du mehrere Leute einer Gruppe (gleichzeitig) befragt?
Wie hast du die Leute ausgewählt?

Das sollte erstmal zum nachdenke reichen :wink:
Viele Grüße,
JPL

So langsam verstehe ich aber die Problematik :smile:

Wegen den Mittelwerten spreche ich am besten mit meinem Prof. ob er es als qutasch ansieht oder nicht (was er ja eigtl. tun sollte…) Ich frage deshalb, da es anscheinend doch öfters gemacht wird und er sie letztendlich bewerten wird. Auf jeden Fall werde ich erst mal aufhören Mittelwerte und Standardabweichungen zu berechnen (ein Mords-Aufwand bei meiner Datenmenge) bis das geklärt ist.

Danke für den Hinweis mit der Hypothesenformulierung. Werde das entsprechend noch mal überarbeiten müssen.

Zu 2:
Natürlich erfrage ich die subjektive Meinung, es handelt sich bei der Untersuchung um ein Expertenrating :smile:

Zu 4.
Ich habe bewusst Kategorien ausgewählt um später nicht nur aufzuzeigen, dass ein Einfluss vorhanden/nicht vorhanden ist, sondern auch wie groß dieser ist. Insg. habe ich auch mehr als eine Hypothese die ich mir erhoffe durch die empirische Untersuchung zu beantworten.
Wobei die Intensität kein Einfluss ist. Ich fand es einfach gut nicht nur zu sagen ob Einfluss oder nicht, sondern auch die Intensität aufzuzeigen.

Drei Erhebungen habe ich gemacht, da es drei Personengruppen sind die zu den Hypothesen aussagen können. Dabei kann jeweils jede Gruppe zu zwei Hypothesen aussagen wodurch sich entsprechend Frageteile überschnieden in den Bögen, was natürlich gewollt ist.
Nur eine Gruppe hat mir alle drei Hyptohesen beantworten können, aber es sind leider nur 4 Personen. Ausgewählt habe ich die Leute nach einem Bewußten Auswahlverfahren (Konzentrationsprinzip).

Das oben formulierte Beispiel ist nicht meine Untersuchung, ich habe es nur analog übersetzt.

Die Befraung fand in Form eines Fragebogens statt mit überwiegend geschlossenen Fragen (das sind zum. die, die ich Werte. die offenen dienen nur zum Aufwärmen und Eindenken in das Thema)

Gruß,

Hi,

ich wage zu prognostizieren, dass es MW&SD als völlig legitim ansieht, mit Begründung, dass es ja schon immer … und alle anderen auch …
Naja, zweimal falsch ist auch nicht einmal richtig. Da kommt noch Arbeit auf dich zu. Entweder zu kannst sinnvoll belegen, dass man Werte zuordnen kann (aber keine Veröffentlichung von 1978, sondern dann eine etwas frischere) oder du beziehst dich auf andere Quellen, die belegen, dass es eben nicht geht. Dann kann dein Prof da eigentlich auch nichts mehr sagen.

Wobei die Intensität kein Einfluss ist. Ich fand es einfach gut :nicht nur zu sagen ob Einfluss oder nicht, sondern auch die :Intensität aufzuzeigen.

Verstehe ich nicht. Aber versuche einfach, diese Hypothese so zu formulieren wie die andere, dann kapier ich das auch :wink:
damit kommst du dann auch schon in das Feld des multiplen Testens rein: http://en.wikipedia.org/wiki/Multiple_comparisons

Die drei Gruppen werden dann vermutich eine etwas andere Ansicht der Dinge haben. Das ist nicht schlimm, angebracht wäre es dann aber, auch diese Information mit in die Analyse einfliessen zu lassen.

Grüße,
JPL

Danke für Deine Mühen, hat mir gut weiter geholfen :smile: