Hilfe beim Auswerten einer Umfrage

Hallo Statistiker

Ich muss eine Umfrage auswerten, habe aber keine Ahnung, auf welche Probleme ich stossen könnte. z.B. ob eine Aussage signifikant ist, aber gibt es noch andere? Kennt jemand eine „Anleitung“ dazu? Ich muss nicht nur Antwort a mit b zu Frage 1 vergleichen, sondern auch mit a und b von Frage 2… :frowning:(

Kann mir jemand auf die Sprünge helfen? Sollte sich jemand bereit erklären, vielleicht sogar mit zu helfen bin ich gerne bereit, die Person zu entlöhnen…

Lg,
Tomate

Hi,

Ich muss eine Umfrage auswerten, habe aber keine Ahnung, auf
welche Probleme ich stossen könnte.

auf die erste bist du schon gestossen - es liegt eine Umfrage vor und keiner hat sich vorher(!) mit der auswertung beschäftigt …

z.B. ob eine Aussage
signifikant ist, aber gibt es noch andere? Kennt jemand eine
„Anleitung“ dazu? Ich muss nicht nur Antwort a mit b zu Frage
1 vergleichen, sondern auch mit a und b von Frage 2… :frowning:(

Nein, um Gottes willen! dann vergleichst du alles mit allem und am ende wird herausgefischt, was einem passt.

Kann mir jemand auf die Sprünge helfen? Sollte sich jemand
bereit erklären, vielleicht sogar mit zu helfen bin ich gerne
bereit, die Person zu entlöhnen…

Es selber zu machen, erleichtert das Verstädnis. Aber das msst du selber entscheiden. ansonsten musst du dich durch Hypothesentesten, -formulierung, multiples testen, Skalenniveau und Zusammenfassen von items druchbeissen.

Viele Grüße,
JPL

Vielen Dank für deine Hilfe.
Und ja ich muss Frage 1 mit 2 vergleichen um zu sehen, wieviele Leute ihre Meinung geändert haben.

Tomate

Hi,

nun, um dir helfen zu können, müsste man etwas mehr über die ganze Studie wissen: warum wurde sie gemacht, wieviele Fragen gibt es, wie viele wurden befragt und wie oft …

Grüße,
JPL

Hallo und danke fürs lesen von dem was kommt (konnte nicht kürzer),

Es geht um die Allokation vor Organen. Beantwortet wurde die Studie von 850 Studenten, einmalig. Es geht darum zu wissen, welche Kriterien man darin einbeziehen sollte und welche nicht (Losentscheid, Überlebenschance, Wartezeit etc).
2 Typen von Fragen: erste Hälfte - die Studenten kriegen eine Situation (z.B. verteile eine Niere), zur Auswahl stehen zwei Patienten, Kind und Erwachsener. Das war die erste Frage. Zweite: Kind und Arzt. Dann nächste: Zwischen sehr krankem Patienten und einem, der die viel grössere Überlebenschance hat.
Ich weiss aus den %, dass sich mehr Leute für den Erwachsenen entscheiden, wenn er Arzt ist. Aber wie weiss ich z.B., dass die, die bei Frage 1 den Erwachsenen retten, auch bei Frage 2 den Arzt retten (logisch wäre es, aber sicher sein kann man ja nicht, falls z.B. einige Leute Ärzte hassen würden).

zweiter Type: Gewicht geben den einzelnen Kriterien von 1 - 5. Also Tabelle mit all den Kriterien die mir in den Sinn kamen und jetzt habe ich die % und Anzahl der Leute und kann sehen, wieviele Leute welchem Kriterium welches Gewicht geben. (Sie software hat das berechnet). Ich glaube, den Teil kann ich einfach so verwenden (ausser für die Aggregation, siehe unten), oder muss ich hier auch noch irgendwelche Fehlerquoten beachten?

Und dann ganz allgemein drei Fragen:

  • ich habe x Anworten der Fakultät A
  • z Antworten der Fakultät B
  1. Wie kann ich die zwei vergleichen, was muss ich wie umrechnen, damit ich sagen kann, die Leute aus A retten doppelt so viel mal den Patienten p?

  2. Wie berechne ich die Gesamtsumme der %…? Die software sagt: 20% von Fakultät A retten den, aber bloss 15% der Fakultät B. Wie kann ich nun wissen, wieviele Studenten unabhängig der Fakultät den Patienten retten, weil ja die Anzahl Antworten unterschiedlich sind (also: wie kann ich aggregieren?)

  3. Wie berechnet man sowas wie eine Fehlerquote? Ich weiss eigentlich gar nicht genau, was das ist… :S

Danke.
Tomate

Hi,

das wichtigste ist ermla ein vernünftiges datenmanagement.
dazu ordnest du die Beantworter zeilenweise an (es gibt also 850 Zeilen) und die Antworten spaltenweise und kodierst mit 0 und 1 (0=nein, 1=ja)
dann sieht das etwa so aus:

Student-No F1:child F1:adult F2:child F2:stuck\_out\_tongue:hysician F1\*F2:child
1 0 1 0 1 0
2 1 0 0 1 0
3 0 1 1 0 0
4 1 0 1 0 1
...

:

dabei ergeben die summe der Antworten zu jeweils F1 und F2 1 (wenn es etwas anderes ist, ist die antwort ungültig).
damit kannst du dann pro Antwort und frage die Häufigkeiten und % ausrechnen, die vorkommen (einfach pro Spalte rechnen).
Deine weiterführende Frage, ob der Kindesrette in F1 sich auch für das Kind bei F2 entschiedet kannst du dann über Multiplikation der Antworten und speicher in eine neue variable ermitteln.

zweiter Type: Gewicht geben den einzelnen Kriterien von 1 - 5.
Also Tabelle mit all den Kriterien die mir in den Sinn kamen
und jetzt habe ich die % und Anzahl der Leute und kann sehen,
wieviele Leute welchem Kriterium welches Gewicht geben. (Sie
software hat das berechnet). Ich glaube, den Teil kann ich
einfach so verwenden (ausser für die Aggregation, siehe
unten), oder muss ich hier auch noch irgendwelche Fehlerquoten
beachten?

Ja, das kannst du erstal so übernehmen. Fehlerquoten, bzw Konfidenzintervalle zu den % machen das Ganze noch besser verständlich.

wenn du Häufigkeit für eine Antwort auf eine Frage ermittelt hast, z.B. 70% entsprechen 595 Ja-Antworten, kannst du ein 95% Konfi wie folgt berechnen:
r = anzahl Ja-antworten (595)
n = anzahl befragte (850, vorausgesetzt, dass keiner falsch geantwortet hat)
p = r/n (0.7)
q = 1-p (0.3)
(**) z = 97.5 quantile der Standardnormalverteilung (1.959964)
A = 2*r + z^2 (1193.841)
B = z*sqrt(z^2 + 4*r*q) (52.51246)
C = 2*(n + z^2) (1707.683)
lcl = (A-B)/C (0.6683495)
ucl = (A+B)/C (0.7298509)

d.h., für 70% Ja-antworten ist das 95% Konfidenzinterval 66.83% bis 72.99%

Unterschiede für 2 Häufigkeiten gehen ähnlich. Zuerst musst du die % und das Konfi für beide ausrechnen (wie oben beschrieben), und dann miteinnder verrechnen:
z.B. p1=0.7, lcl1=0.6683495 ucl1=0.7298509 (von oben)
und p2=0.5, lcl2=0.4664626 ucl2=0.5335374 (fiktive Werte)

dann ist der Unterschied d=p1-p2 und das 95% Konfi berechnet sich als
lcl = d - sqrt((p1 - lcl1)^2 + (ucl2 - p2)^2)
ucl = d + sqrt((p2 - lcl2)^2 + (ucl1 - p1)^2)
ergiebt: d=0.2 mit dem 95% Konfi 0.1538859 bis 0.244898.

(REF: Altman D. G., Machin D., Bryant T. N., Gardener M. J. (2000).
Statistics with Confidence. Brit. Med. J. Books, 2nd ed., JW Arrowsmith Ltd., Bristol, 46-50.)

aus dem Konfi füt fen Unterschied kannst du nun sehen, dass 0 nicht enthalten ist. daraus kann man schließen, dass der p-Wert für den zugehörigen Test 95% Konfi) z.B. mittels Bonfoerroni-Korrektur anpasst (bei 3 Tests z.B. 5%/3=1.666667% und das entsprechende Konfi berechnet (98.33333%). Das macht man, indem man oben bei (**) nicht das 97.5 quantil nachschlägt, sondern das 100-(5%/3)/2 (99.16667%).

Soviel zur technischen anleitung. :smile:
Verstanden wirst du es noch nicht haben, aber bevor ich hier ein statistik-buch schreibe, warte ich lieber deine konkreten fragen ab.

viele Grüße,
JPL

Ähhh… du hast recht! Ich habe nichts verstanden! :smile:

Eine Frage: wieviel müsste ich dir denn bezahlen, dass du mir diese Arbeit abnimmst? Falls du Zeit hättest? :smile:
Ja klar, blöde Frage, aber ich stell sie mal. Ich muss das eben bis im Sa/So haben, damit ich weiter arbeiten kann. Bis dahin muss ich aber noch edn ganzen Rest meiner Arbeit schreiben… :frowning:

(Also die software im Internet hat schon die einzelnen Prozente berechnet. Man kann die Resultate auch in eine Exceltabelle übertragen.)

Tomate.