ich schreibe an meiner Bachelorarbeit und hab folgendes statistisches Problem:
Mein erster Datensatz (n=100) ist nicht normalverteilt. Die anderen Daten (sind normalverteilt) stammen aus einer großen Studie (n = 15000), weshalb ich davon keine Rohdaten habe, sondern nur MW, SE (bzw. SD) und Perzentile. Nun möchte ich gerne die MW meiner nicht normalverteilten Daten mit den MW der Studie hinsichtlich einer Signifikanz prüfen. Wie mach ich das am Besten? Ich komme irgendwie auf keinen grünen Zweig (Mann-Whitney geht nicht, t-Test auch nicht). Ich arbeite mit GrapPad Prism.
da gäbs jetzt 3 Möglichkeiten:
a) du berechnest für den nicht-normalverteilten Datensatz (NND) ein nichtparametrisches Konfidenzintervall für den mean und schaust, ob sich das mit dem parametrischen Konfi des notmalverteilten datensatzes (ND) überdeckt. Wenn nicht: fein, wenn doch, hast du nix gewonnen.
b) du baust mittels bootstrap einen t-test für den Unterschied zwischen den beiden datensätzen nach. Dabei bootstrappest du aber nur die Daten vom NND und verwendest die gegebenen Schätzer vom ND. Damit erhälst du ein nichtparametrisches Konfi für den Unterschied, wenn 0 da nicht drin liegt hast du einen sig. unterscheid, wenn 0 drin liegt, hast du keinen sig. Unterschied.
c) Du simulierst Daten für ND auf basis der gegeben MW und SD und verfährst dann wie bei b).
a) ist noch relativ simpel, aber ggf. ungenügend, um Unterschiede zu finden. c) ist wegen dem großen n der ND ganz okay, aber die Rohdaten wären besser. AM sichersten fährst du mit b), in R http://cran.r-project.org/bin/windows/base/ ist das kein größeres Problem, mit GraphPad denk ich schon.
Allerdings muss ich leider gestehen, dass ich von Statistik zu gut wie keine Ahnung habe und dementsprechend auch noch nie etwas von „bootstrapping“ gehört hab. Hab da jetzt mal ein bisschen was darüber gegoogelt. Leider habe ich auch mit R keinerlei Erfahrung. Könntest du mir weiterhelfen, wie ich da nun mit R vorgehe? Installiert hab ich es mir schonmal .
Der reine Vergleich der Konvidenzintervalle ist für mich glaub wirklich zu ungenau. Zudem überlappen sich die meisten CI.
Vielen Dank nochmals für deine Hilfe (ich glaub sonst wäre ich aufgeschmissen oder müsste hoffen, dass mein Betreuer genau so ne Statistik-Niete ist wie ich und das wollen wir ja nicht hofffen)
ja ich kann dir schon helfen, einfacher ist dann aber nicht über das Forum (es sei denn jemand anderes wollte es noch wissen), sondern privat.
Grüße,
JPL