Clusteranalyse mit Ausweichkategorie

Hallo zusammen,

ich habe im Rahmen meiner Diplomarbeit das Image einer Marke erhoben. Ich möchte jetzt prüfen, ob es innerhalb meiner Probanden Gruppen gibt, die eine unterschiedliche Wahrnehmung des Images haben. Dabei habe ich ein kleines Problem mit den Daten.

Fast alle Items haben folgende Struktur:

passt gar nicht passt völlig
Merkmal 1--------------1-----2-----3-----4-----5

so weit so gut. Jetzt habe ich aber noch ein paar Merkmale die eine Ausweichkategorie aufweisen. Die Merkmale erfassen, inwieweit bestimmte Produkte als typisch oder nicht typisch für die Marke angesehen werden. Die Probanden könnten wieder auf einer Skala von 1-5 eine Einschätzung abgeben. Falls den Probanden ein Produkt nicht bekannt war, könnten sie die Ausweichkategorie „Produkt unbekannt“ wählen.

Bei Mittelwertberechnungen und Korrelationen habe ich die Daten immer wie ein Missing Data behandelt. Wenn ich das aber bei der Clusteranalyse mache, kriege ich das Problem, dass mir SPSS alle VPN rausschmeißt, die ein Missing Data haben. Von meinen über 300 Probanden bleiben dann nur noch 10 übrig - was der Clusteranalyse dann doch etwas den Reiz nimmt.

Ich habe mir dann überlegt, dass ich bei allen Probanden die „Produkt unbekannt“ gewählt haben, den Mittelwert der übrigen Probanden bei dem jeweiligen Merkmal eintrage und damit dann die Clusteranalyse rechne (Ward verfahren/quadrierte Euklidische Distanz)

Hat jemand eine elegantere Lösung für dieses Problem?

Viele Grüße Tobi

Hi,

300 Probanden, aber leider sagst du nichts über die Anzahl Items.
Wenn jedes Item von der überwiegenden Anzahl Probanden (sagen wir, 90%, mit 1 bis 5 , also nicht Ausweichkategorie bewertet worden ist, dann kann man es so machen wie von dir vorgeschlagen.

Ich würde alternativ noch eine weitere Clusteranalyse machen mit einer 0-5 oder 1-6 Skala, 0 bzw. 6 für missing data, je nachdem, was besser zu interprätieren ist.
Gruss,

Hallo Helge,

erst mal vielen Dank für die Antwort.

Also zu den fehlenden Daten. Insgesamt mussten die VPN 88 Merkmale beurteilen. Bei 16 Merkmalen hatten sie die Möglichkeit die Ausweichketegorie zu wählen.

Damit konnten insgesamt 28 766 „Kreuze“ gesetzt werden. Die Kategorie unbekannt wurde dabei 1 468 mal gewählt, also knapp 5 % der Antworten.

Bauchschmerzen habe ich bei vier Merkmalen, da dort 2/3 der VPN gesagt haben „Produkt unbekannt“ Ich überlege deshalb diese vier Merkmale aus der Clusteranalyse rauszuschmeißen. Damit wären auch schon 943 Stimmen für „Produkt unbekannt“ raus. Den Rest würde ich dann durch den Mittelwert ersetzen. Was hälst du davon?

Viele Grüße

Tobi

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hi,

ok, dein Vorschlag klingt gut, würde ich auch so machen.

Dennoch würde ich alternativ eine Clusteranalyse mit 0-5 oder 1-6 versuchen, vielleicht ergibt sich ja eine Erkenntnis.
Schaden wird es auf jeden Fall nicht.

Gruss,