IQ Test, wie ist sowas erstellt?

Hiho,

also ich hab mich gerade gefragt, wie ein IQ Test erstellt wird? Was machen die und wie verteilen die die Punkte?

Für Informationen bin ich dankbar :smiley:

Liebe Grüße

Stephan

Hallo Stephan,

Deine Frage zu beantworten, ist ein umfangreiches Unternehmen, für das ein Universitätsseminar gerade richtig wäre. Aber versuche ich es trotzdem so kurz wie möglich zu machen. Auf Fachbegriffe werde ich dabei auch weitgehend verzichten.

Intelligenztests stellen bestimmte psychologische Tests dar. Verkürzt gesagt werden solche Tests auf folgende Weise erstellt (die Numerierung gibt einen Hinweis, wie die zeitliche Abfolge ist, manche Schritte werden sich jedoch zeitlich überschneiden):

  1. Überlege Dir, welches Merkmal Du mit dem Test erfassen willst und vor welchem Hintergrund Du dies tun willst (z.B. vor dem einer bestimmten Theorie).

  2. Überlege Dir, wie die Testaufgaben (Items) aussehen sollen: Mit welchen Aufgabentypen will ich das Personenmerkmal erfassen (Analogieaufgaben, Rechenaufgaben, Kartenlegeaufgaben, Wortfindungsaufgaben etc.) Wie sollen die Items formuliert werden?
    Wie soll das Antwortformat sein (offen vs. gebunden)?
    Welche Informationen müssen / können / sollen bereits in den Items vorhanden sein (-> Formulierung von Iteminstruktionen)

  3. Erstelle vorläufige Testaufgaben (bis zu 3mal soviel, wie Dein Test schließlich enthalten soll).

  4. Überprüfe und ändere ggf. Deine vorläufigen Testaufgaben. Achte dabei u.a. auf

sprachliche Verständlichkeit,
Eindeutigkeit von Formulierungen,
Lesbarkeit von Abbildungen und Tabellen,
Vorhandensein von Legenden und Beschriftungen,
Farbgestaltung von Bildern,
praktische Handhabbarkeit des Materials

  1. Formuliere eine Einführung in den Test bzw. eine Handanweisung für die Personen, die die Testdurchführung leiten sollen (Testleiter).

  2. Überlege Dir, wie bestimmte Antworten der Testpersonen auf die Testaufgaben bewertet werden sollen, z.B. „2 Punkte“ für Antworten, die sounso aussehen, „1 Punkt“ für Antworten, die soundso aussehen, „0 Punkte“ für Antworten, die sounso aussehen. Formuliere Regeln für die Zuordnung von Punkten zu Testantworten. Stelle Leute an und bilde sie aus, damit sie die Testantworten mit großer Übereinstimmung gleich bepunkten.

  3. Stelle Deine Testaufgaben zu einer Testvorform zusammen. Achte dabei u.a. auf

die Reihung der Aufgaben
die Art der Itempolung (positiv vs. negativ; bei Fragebogen)
die Testzeit (pro Item, für den Test insgesamt)

  1. Lege die Testvorform einer möglichst repräsentativen Stichprobe von mehreren Hundert Testpersonen vor. Analysiere anhand der Ergebnisse die Güte der Testaufgaben nach bestimmten statistischen Kriterien. Sondere die Aufgaben aus, die diesen Kriterien nicht entsprechen. Überprüfe auch die Verteilung der Punkte, die die Testpersonen für die Antworten auf die Testaufgaben erhalten.

  2. Stelle die Testendform aus den Aufgaben zusammen, die in Schritt 7 die Kriterien erfüllt haben.

  3. Lege die Testendform einer repräsentativen Stichprobe von mehreren Hundert Testpersonen vor und bestimme die Meßgenauigkeit des Tests.

  4. Lege die Testendform einer repräsentativen Stichprobe von ca. 1000 bis 10.000 Personen vor und bestimme die Verteilung des untersuchten Merkmals (anhand der vergebenen Punkte) in Abhängigkeit von bestimmten anderen Merkmalen (z.B. Alter, Beruf, Geschlecht). Überführe die Punkteverteilungen in Verteilungen gemäß einer international definierten Skala (z.B. IQ-Skala mit Mittelwert 100 und Streuung 15).

  5. Stelle viele wissenschaftliche Untersuchungen an, ob Dein Test auch wirklich das mißt, was er eigentlich messen soll.

Bis alle Schritte abgearbeitet sind - zumindest der letzte ist theoretisch niemals beendet -, dauert es viele Monate bis Jahre. Die Konstruktion eines guten psychologischen Tests kostet auch sehr viel Geld. Am Beispiel des deutschen Naturwissenschaftstests von PISA 2003, den ich mitentwickelt habe, will ich einen Eindruck vermitteln: Die Arbeiten zu diesem Test begannen 2001, die Testvorform (70 Testaufgaben) wurde im Mai 2002 an einer großen Stichprobe von 1951 Schülerinnen und Schüler aus 4 Bundesländern untersucht, eine letzte Voruntersuchung habe ich im November 2002 durchgeführt. Dann ging der Test noch in die Endredaktion, wurde gedruckt und dann im Mai 2003 in der PISA-Hauptuntersuchung angewendet. Am 7. Dezember 2004 wird der 1. Bericht zu PISA 2003 veröffentlicht. Insgesamt haben über 20 Wissenschaftler an der Konstruktion nur dieses einen (!) Tests von PISA 2003 mitgewirkt. Die zahlreichen wissenschaftlichen Hilfskräfte und Testleiter sind noch hinzuzählen. Bei den großen Intelligenztests ist der Konstruktionsaufwand zumindest bei der Erstkonstruktion vergleichbar groß oder noch größer.

Gruß,

Oliver Walter

Hallo,

vielen Dank für die Antwort :smiley:

Gibt es eine Vorlage, bei der man sich mal so einen IQ-Test mit allem drum und dran ansehen kann? Also mit Punkteverteilung etc?

Danke schon mal

Stephan

Nachfrage (Vertiefung)
Hi,

danke erstmal für die ausführliche Schilderung.

So wie ich das verstanden habe, bildet man das gegenwärtige „Antwortvermögen“ einer humanen Stichprobe auf eine Skala ab und setzt den Mittelwert zu 100.
Den Einfluss der Vorbildung der Stichprobenpopulation kann man dabei sicher gut eliminieren.
Aber wie steht es denn mit persönlichen Neigungen?
Bsp? Wer regelmässig Logikaufgaben löst, kann bei logischen Fragen sehr deutlich besser abschneiden als jemand, der hierin zwar talentierter wäre, jedoch einen anderen Schwerpunkt für sich entdeckt hat.
Ich bin auf diesen Punkt gekommen, weil mir mal ein Test über den Weg lief, bei dem ich sehr schlecht abgeschnitten habe, obwohl dies (auch für andere offensichtlich) nicht sein kann.

Ich bin der Meinung, dass IQ Tests das gegenwärtige „Können“ einer Schicht wiederspiegeln, und innerhalb -sagen wir 1 sigma- keine sicheren Schlüsse auf die Intelligenz einzelner Individuen gezogen werden können.

Gruss,

Hi,

Gibt es eine Vorlage, bei der man sich mal so einen IQ-Test
mit allem drum und dran ansehen kann? Also mit
Punkteverteilung etc?

im Internet gibt es alle möglichen IQ-Tests, weniger seriöse aber auch sehr seriöse. Du findest auch Seiten mit kompletten Sammlungen unterschiedlicher Tests. Sogar Tests für extrem hohe IQs sind dort vorhanden. Die beginnen zum Teil bei einem IQ von 100 und gehen bis 200.

wer googelt der findet :smile:

Hallo Helge,

danke erstmal für die ausführliche Schilderung.

gern geschehen.

Du gehst anscheinend davon aus, daß die von Dir genannten Faktoren nicht mit dem Intelligenzkonstrukt in Zusammemhang stehen sollten, weil Du unter Intelligenz etwas relativ Konstantes ansiehst, womöglich eine vererbte Fähigkeit, die sich über die Zeit kaum ändert. Ich möchte deshalb auf einen mir wichtig erscheinenden Aspekt hinweisen, der vermutlich Deinem Statement gerecht wird: Die Erblichkeit von Intelligenz ist sehr wahrscheinlich recht hoch. Das heißt jedoch nicht, daß Intelligenz vollständig genetisch determiniert oder nicht veränderbar ist. Intelligenz wird oft als mehr angesehen als ihr genetischer Anteil. Das heißt, daß es nicht falsch ist (der Intelligenz-Test nicht invalide ist), wenn man Intelligenz auch mit Aufgaben mißt, bei denen solche Faktoren eine Rolle spielen, die Du genannt hast. Man kann sogar weiter gehen: Die Ausprägung der genannten Faktoren kann durch den genetischen Anteil der Intelligenz modifiziert werden.

Beispiel: Ein Kind mit einer hohen genetisch determinierten Fähigkeit im räumlich-geometrischen Denken kann aufgrund dieser Fähigkeit ein großes Interesse an räumlich-geometrischen Aufgaben entwickeln und seine Leistungen in diesen Aufgaben steigern. Man würde also geradezu einen Zusammenhang zwischen vererbter Fähigkeit, Präferenz und Intelligenz (Leistung) gemessen durch solche Aufgaben erwarten und diese Aufgaben daher nicht aus dem Test ausschließen wollen.

Ich bin auf diesen Punkt gekommen, weil mir mal ein Test über
den Weg lief, bei dem ich sehr schlecht abgeschnitten habe,
obwohl dies (auch für andere offensichtlich) nicht sein kann.

Ich denke, daß Du und die anderen eine zwar ähnliche Vorstellung von Intelligenz habt, diese aber anscheinend nicht mit der Definition von Intelligenz gemessen durch den Test übereinstimmte (sofern es bei der Testung keinen Fehler gab). Daß so etwas geschieht, ist nicht ungewöhnlich. Intelligenz ist nicht einheitlich definiert. Jeder Intelligenztest bringt seine eigene Definition mit sich. Simpel ausgedrückt: Es gibt so viele Intelligenzen, wie es Intelligenztests gibt. Ein Mensch hat also nicht nur einen IQ, sondern so viele, wie er Intelligenztests macht, bei denen ein IQ ermittelt wird. „Den“ IQ gibt es also nicht. Jemand kann 20 unterschiedliche IQs haben, die alle „richtig“ sind. Deshalb sollte man, wenn man einen IQ angibt, immer auch das Testverfahren nennen, mit dem dieser IQ gemessen wurde.

Daß trotzdem relativ ähnliche Intelligenztests existieren und nicht völlig unterschiedliche, liegt daran, daß die Testkonstrukteure eine gewisse ähnliche Vorstellung davon haben, was sie unter Intelligenz verstehen.

Ich bin der Meinung, dass IQ Tests das gegenwärtige „Können“
einer Schicht wiederspiegeln, und innerhalb -sagen wir 1
sigma- keine sicheren Schlüsse auf die Intelligenz einzelner
Individuen gezogen werden können.

Hier sprichst Du 2 Punkte an:

Zum einen sollten die IQ-Werte eines Tests an einer repräsentativen Stichprobe geeicht sein, so daß man die Referenzpopulation angeben kann, auf die sich der IQ-Wert einer Person bezieht. Das ist eine weitere notwendige Angabe, wenn man einen IQ-Wert interpretieren will. Der Wert bedeutet nur etwas im Verhältnis zu einer Gruppe von Personen.

Zum anderen gehst Du auf die Frage der Genauigkeit (Reliabilität) der Intelligenzmessung ein. Aus der Höhe der Reliabilität kann man ableiten, ob bestimmte IQ-Unterschiede (Unterschiede in den Meßwerten) wirklich auf Merkmalsunterschiede (Unterschiede in der Intelligenz) zurückzuführen sind. Es gibt mathematische Formeln, mit denen man diese Frage beantworten kann. Das von Dir genannte Kriterium von einer Standardabweichung halte ich auch für eine gute Faustregel. Wenn die Reliabilität nämlich mindestens 0,9 beträgt, dann irrt man sich in weniger als 5% der Fälle, wenn man Deine Regel verwendet.

Gruß,

Oliver Walter

PS: Vielleicht waren Dir die meisten Aspekte schon bekannt. Ich habe sie jedoch breiter ausgeführt, damit der eine oder andere, dem sie noch nicht bekannt waren, mehr Chancen hat, die doch einigermaßen sophistizierten Gedankengänge nachzuvollziehen.

3 Like

Hallo helge,

So wie ich das verstanden habe, bildet man das gegenwärtige
„Antwortvermögen“ einer humanen Stichprobe auf eine Skala ab
und setzt den Mittelwert zu 100.

Soweit so gut.

Den Einfluss der Vorbildung der Stichprobenpopulation kann man
dabei sicher gut eliminieren.

Hier fängt das Problem aber schon an.
Wenn du die Sprache nicht beherscht, hast du schon einmal Pech gehabt. Versuch einmal einen IQ-Test in einer Fremdsprache zu machen, da gehen dir schon einige Finessen in der Fragestellung durch die Lappen, geschweige denn, du kannst die Spracher überhaupt nicht lesen.

Ein weiteres Problem hat mit der Übung in einer Tätigkeit zu tun, was eigentlich allgemein nicht als Intelligenz verstanden wird.
Wenn du den ganzen Tag Dreiecke sortierst, wirst du bei den entsprechenden Aufgaben wesentlich besser abschneiden, zumal die Test ja auch noch unter dem Zeitlichen Aspekt bewertet werden.
Hinzu kommt noch, dass es Leute gibt die etwas schneller denken können und andere die langsamer sind. Ist das auch mit Intelligenz gleichzusetzen, wenn beide zum richtigen Resultat kommen, aber unterschiedlich lange dazu benötigen ?

Ein weiteres Beispil zum nachdenken:
Die bekannte Anektote von Gauss, alle Zahlen von 1 bis 100 zusammenzuzählen.
Wer ist nun intelligenter; Ein Schnellrechner der stur alle Werte addiert oder Gaus, der zuerst die Formel entwickelt und dann rechnet, wenn beide gleich lange für die Aufgabe benötigen ?

MfG Peter(TOO)

Hallo Peter,

Wenn du die Sprache nicht beherscht, hast du schon einmal Pech
gehabt. Versuch einmal einen IQ-Test in einer Fremdsprache zu
machen, da gehen dir schon einige Finessen in der
Fragestellung durch die Lappen, geschweige denn, du kannst die
Spracher überhaupt nicht lesen.

ja, deshalb gibt es Intelligenztests in verschiedenen Sprachen. :smile:

Ein weiteres Problem hat mit der Übung in einer Tätigkeit zu
tun, was eigentlich allgemein nicht als Intelligenz verstanden
wird.

Doch, Übung hat auch einen Einfluß auf Intelligenz. Stell Dir mal einen Mathematiker vor. Sollte sich seine Übung in logischem Denken nicht auch in seiner Intelligenz niederschlagen? In meiner Antwort an Helge habe ich ein weiteres Beispiel gegeben. Intelligenz ist halt keine angeborene, unveränderliche Fähigkeit, auch wenn es einen genetischen Beitrag gibt.

Hinzu kommt noch, dass es Leute gibt die etwas schneller
denken können und andere die langsamer sind. Ist das auch mit
Intelligenz gleichzusetzen, wenn beide zum richtigen Resultat
kommen, aber unterschiedlich lange dazu benötigen ?

Klar, warum denn nicht? Die Zeit bis zur Aufgabenlösung geht ja in vielen Untertests mit in die Bewertung ein.

Wer ist nun intelligenter; Ein Schnellrechner der stur alle
Werte addiert oder Gaus, der zuerst die Formel entwickelt und
dann rechnet, wenn beide gleich lange für die Aufgabe
benötigen ?

Ich glaub´, das sind Äppel und Birnen.

Gruß,

Oliver Walter

3 Like

Schnellrechner ist intelligenter
Hi,
(…)

Wer ist nun intelligenter; Ein Schnellrechner der stur alle
Werte addiert oder Gaus, der zuerst die Formel entwickelt und
dann rechnet, wenn beide gleich lange für die Aufgabe
benötigen ?

Der Schnellrechner ist eindeutig der Intelligentere, sofern er wirklich schneller ist, denn seine Methode funktioniert immer. Die Formellösung entsteht ja nur, weil jemand eine Aufgabe nicht herkömmlich lösen kann.
Gruss,

Hi,

Der Schnellrechner ist eindeutig der Intelligentere, sofern er
wirklich schneller ist, denn seine Methode funktioniert immer.
Die Formellösung entsteht ja nur, weil jemand eine Aufgabe
nicht herkömmlich lösen kann.

Auch bei Problemen, die mit n^2 oder log(n) oder exp(n) skalieren? Schließlich ist das menschliche Leben endlich :wink:

Ciao R.