Wie geht ein T-Test und eine Itemanalyse?

Hallo,

ich würde gerne wissen, wie genau ein T-Test und eine item-analyse funktioniert. Gegeben sind 20 Datensätze mit je 13 items. Die 20 Datensätze sind in 2 Gruppen zu je 10 aufgeteilt. Jede Gruppe hat eine unterschiedliche Informationsbasis für die Abfrage der items erhalten. Um die Daten zu analysieren, muss nun ein T-Test (Ich vermute, das ist dann ein Zweistichproben t-Test) und eine Itemanalyse gemacht werden.

Kann mir Jemand beides möglichst simpel, unmathematisch und Schritt für Schritt erklären? Ich bin völlig unmathematisch und komme mit den gängigen Erklärungen dank der mathematischen Begriffe und Formeln überhaupt nicht klar. Alternativ wäre mir auch ein Link zu einer entsprechenden Seite genehm.

Danke.

Hi Ghizmo,

Um die
Daten zu analysieren, muss nun ein T-Test (Ich vermute, das
ist dann ein Zweistichproben t-Test) und eine Itemanalyse
gemacht werden.

Wir können dir hier zwar die beiden Verfahren erklären, aber „Muss“ ist leider schon der falsch Ansatz. Was genau willst du wissen (Hypothese), wie ist das Skalenniveau der Daten und gibt es weitere Kovariablen? Wie sind die Items sonst struktutiert?
Das sind leider Fragen mit denen du dich mehr oder weniger intensiv auseinandersetzen musst, wenn du eine halbwegs vernünftige stat. Analyse machen willst.

Grüße,
JPL

/// Wir können dir hier zwar die beiden Verfahren erklären, aber „Muss“ ist leider schon der falsch Ansatz.

Da mir die konkrete Aufgabenstellung gegeben wurde, mit den vorgegebenen Daten die besagte Itemanalyse und den T-Test zu machen, ist die Tatsache, dass ich beides machen muss zu meinem Leidwesen leider undiskutierbar. Solltest du meinen, dass es bessere Alternativen zu einer Datenanalyse gibt, stehen mir diese leider nicht zur Auswahl.

/// Was genau willst du wissen (Hypothese), wie ist das Skalenniveau der Daten und gibt es weitere Kovariablen? Wie sind die Items sonst struktutiert?
Das sind leider Fragen mit denen du dich mehr oder weniger intensiv auseinandersetzen musst, wenn du eine halbwegs vernünftige stat. Analyse machen willst.

Ich gebe mal eine genauere Versuchsbeschreibung und versuche dann, die Fragen zu beantworten. Ich bitte aber nochmals um Nachsicht, da ich mathematisch leider völlig unwissend bin:

Es geht darum, dass wir 200 Testpersonen in 4 Gruppen unterteilt haben.
Die erste Gruppe hat einen Radiobeitrag von 1Live zu hören bekommen, die andere Gruppe einen Beitrag zum gleichen Thema von WDR5.
Gruppe 3 und 4 haben jeweils den 1Live bzw WDR5-Beitrag in Textform bekommen.
Wir haben, nachdem die Testpersonen die Beiträge gehört haben, 20 items abgefragt, wobei uns interessiert hat, welchem Artikel mehr Glaubwürdigkeit geschenkt wird und ob die Tatsache, dass die Vorabinformation, von welchem Radiosender der Beitrag stammt, die Frage nach der Glaubwürdigkeit des Beitrags beeinflusst. Beide Beiträge behandelten das gleiche Thema, jedoch natürlich unterschiedlich aufbereitet.

Wenn ich den Begriff Skalenniveau richtig verstehe, handelt es sich um folgendes: Jedes item konnte mit einem Wert zwischen 0 und 9 bewertet werden, wobei 0 keine Zustimmung und 9 die größtmögliche Zustimmung bedeutet (Zb wie glaubwürdig ist der eben gehörte Beitrag auf einer Skala von 0 bis 9).

Der Begriff Kovariablen bereitet mir Schwierigkeiten. Wäre die Unterteilung neben der Gruppierung in 1Live und WDR5 Höhrer in die Gruppe der Textleser und der Beitragshöhrer eine Kovariabel? Weitere Unterscheidungen in den Gruppen gibt es jedoch nicht.

Über die vorgegebene Strukturierung der items wurden nicht viele Informationen ausgegeben. Von den 20 abgefragten items behandeln circa 7-10 das entscheidende Thema der Glaubwürdigkeit direkt, während die anderen items das abgefragte Thema verschleiern oder nur indirekt abfragen (Zb wie „fair“ der Beitrag erschien). Ich schätze mal, dass es Ziel der itemanalyse ist, die entscheidenden items herauszuarbeiten, aber das weiss ich leider auch nicht genau und hoffe, dass mir etwaige Erklärungen hier weiterhelfen könnten, dies zu verstehen.

Danke und Grüße

Hi,

Ich gebe mal eine genauere Versuchsbeschreibung und versuche
dann, die Fragen zu beantworten.
Es geht darum, dass wir 200 Testpersonen in 4 Gruppen
unterteilt haben. Die erste Gruppe hat einen Radiobeitrag von 1Live zu hören bekommen, die andere Gruppe einen Beitrag zum gleichen Thema
von WDR5. Gruppe 3 und 4 haben jeweils den 1Live bzw WDR5-Beitrag in
Textform bekommen.
Wir haben, nachdem die Testpersonen die Beiträge gehört haben,
20 items abgefragt, wobei uns interessiert hat, welchem
Artikel mehr Glaubwürdigkeit geschenkt wird und ob die
Tatsache, dass die Vorabinformation, von welchem Radiosender
der Beitrag stammt, die Frage nach der Glaubwürdigkeit des
Beitrags beeinflusst.

Schwierig ist hier die Zuordnung, welche Gruppe nun gewusst hat, von welchem Sender sie etwas erzählt bekommt. Wie wurde das gemacht?

Wenn ich den Begriff Skalenniveau richtig verstehe, handelt es
sich um folgendes: Jedes item konnte mit einem Wert zwischen 0
und 9 bewertet werden, wobei 0 keine Zustimmung und 9 die
größtmögliche Zustimmung bedeutet (Zb wie glaubwürdig ist der
eben gehörte Beitrag auf einer Skala von 0 bis 9).

OKay, das ist ziemlich üblich.

Der Begriff Kovariablen bereitet mir Schwierigkeiten. Wäre die
Unterteilung neben der Gruppierung in 1Live und WDR5 Höhrer in
die Gruppe der Textleser und der Beitragshöhrer eine
Kovariabel? Weitere Unterscheidungen in den Gruppen gibt es
jedoch nicht.

Keine Latersunterschiede oder Geschlechtseffekte? Bildung, Vorwissen, etc. irgendetwas, das als „base data“ erfasst wurde?

Über die vorgegebene Strukturierung der items wurden nicht
viele Informationen ausgegeben. Von den 20 abgefragten items
behandeln circa 7-10 das entscheidende Thema der
Glaubwürdigkeit direkt, während die anderen items das
abgefragte Thema verschleiern oder nur indirekt abfragen (Zb
wie „fair“ der Beitrag erschien). Ich schätze mal, dass es
Ziel der itemanalyse ist, die entscheidenden items
herauszuarbeiten, aber das weiss ich leider auch nicht genau
und hoffe, dass mir etwaige Erklärungen hier weiterhelfen
könnten, dies zu verstehen.

doch, so ist das. Der Wiki-artikel ist gar nicht so übel zu dem Thema. Konkret geht es darum, Items zu selektieren, die auf eine mögliche Unterscheidung der untersuchten Gruppen ansprechen. hier gibt es verscheidene Verfahren eine davon ist die Itemanalyse. Annhame dafür müsste aber sein, dass 1Live einen ganz anderen eindruck hinterlässt (insgesanmt höhere oder niedrigere Itemwerte) als WDR5. Zudem habt ihr auch noch einen Mediumunterschied (papier versus audio), was bei einem Vergleich zwar angibt, ob die Items ebensogut anwendbar sind, allerdings ist die Analyse durch das Medium stark gebiased. Würde man hier eine Itemanalyse verwenden, können allerdings ganz andere Items bei hören und lesen herauskommen.
Da man beachten muss, dass die Itemanalyse ein strukturgebendes und kein -prüfendes Verfahren ist, ist es für diese Fragestellung nicht geeignet.
Die letzte Frage nach dem Einfluss des Wissens um den Sender lässt sich wahrscheinlich weder mit eurem design, aber aus den eben genannten Gründen auch nicht mit der Itemanalyse überprüfen.
Hier könnte(!) der t-test ins Spiel kommen; wieder bietet Wiki einen brauchbaren Artikel. Mit ihm kann man zwar alle möglichen Items gegeneiander testen, aber man muss ich a) die Hypothese genau überlegen (Unterlegenheit/ Überlegenheit/ Äquivalenz/ kein Unterschied) und daran denken, dass bei allen paarweisen Vergleichen von 20 Items in 4 Gruppen 3240 Vergleiche herauskommen, hier muss man sich also schon mal die sinnvollen vorab überlegen und dann immer noch eine anassung des p-Wertes wegen Vielfachtestung vornehmen.

Also, lies dich mal in die Standardliteratur ein und probier dann mal ein paar Tests selber per Hand zu rechnen und dann sehen wir weiter.

Grüße,
JPL