Datenanpassung

Pascal_2b5ca7 · 22. Oktober 2008 um 17:02

Hallo zusammen!
Für eine Seminararbeit möchte ich folgendes Untersuchen:
Es gibt zwei Volumentarife, der eine kostet 50€, der andere 135€.
Ich möchte gerne untersuchen, ob sich Nutzer hinsichtlich ihres Kündigungsverhaltens unterscheiden, wenn sie den Tarif nicht voll ausnutzen.
Meine Hypothese lautet folgendermaßen: Nutzer des höheren Tarifs weisen eine höhere Sensitivität hinsichtlich des nicht-Ausnutzens des Tarifs auf als Nutzer des niedrigeren Tarifes und werden diesen schneller kündigen.
Nun fehlt mir allerdings eine geeignete Idee, dies vergleichbar zu machen. Vergleiche der folgenden Art

10€ weniger bei beiden Tarifen
10% weniger bei beiden Tarifen
scheinen mir tendenziell wenig sinnvoll, da die Anfangsausgaben nicht ausreichend berücksichtigt werden. Irgendwie habe ich das Gefühl, dass man so „Äpfel mit Birnen“ vergleicht.

Hat vielleicht jemand eine Idee, wie man die Daten sinnvoll anpassen und vergleichen kann? (Hoffe, das Problem ist einigermaßen anschaulich dargestellt)

Vielen Dank!

Ingo_von_Borstel · 22. Oktober 2008 um 17:24

Moin,

Für eine Seminararbeit möchte ich folgendes Untersuchen:
Es gibt zwei Volumentarife, der eine kostet 50€, der andere
135€.
Ich möchte gerne untersuchen, ob sich Nutzer hinsichtlich
ihres Kündigungsverhaltens unterscheiden, wenn sie den Tarif
nicht voll ausnutzen.

Ich würde als erstes mir angucken, ob das tatsächlich so ist und sie ersteinmal nicht direkt vergleichen. Eine mögliche Art das zu untersuchen bzw. darzustellen ist eine kumulative Darstellung der beiden Datensätze:

ich nehme dafür an, dass Deine Daten der Art sind:
Tarifart (50€/135€)
Ausnutzung des Volumentarifs (ob nun % oder absolut ist egal) —> x-Achse
Kündigung innerhalb des betrachteten Zeitintervalls ja/nein. —> kumuliert 0/1 auf Y-achse

sprich, Du legst Dich auf Dein Beobachtungsintervall fest und weist jedem Kunden, der kündigte eine 1 zu und jedem, der nicht kündigte eine 0.
Dann plottest Du die Anzahl aller Kunden die kündigten, deren Ausnutzung unter X Prozent lag über X.
Ebenso machst Du das gleiche nicht in Prozent sondern mit Absolutwerten.

Wenn es Unterschiede gibt, wirst Du das in der Kurvenform sehen und Du wirst wissen, bei welchen prozentualen oder Absolutwerten die Unterschiede (so vorhanden) auftauchen.

Diese Auftragung ist auch sehr gut für geringe Anzahl Datenpunkt geeignet.

Gruß in der Hoffnung einen Ansatz geliefert zu haben,
Ingo

Pascal_2b5ca7 · 22. Oktober 2008 um 17:33

Hallo Ingo!
Besten Dank schon einmal.

Dann plottest Du die Anzahl aller Kunden die kündigten, deren
Ausnutzung unter X Prozent lag über X.
Ebenso machst Du das gleiche nicht in Prozent sondern mit
Absolutwerten.

Könntest Du mir diesen Schritt vielleicht noch etwas genauer erläutern, insbesondere was Du mit „plotten“ meinst.

Vielen Dank!

Ingo_von_Borstel · 22. Oktober 2008 um 22:22

Moin Pascal,

Dann plottest Du die Anzahl aller Kunden die kündigten, deren
Ausnutzung unter X Prozent lag über X.
Ebenso machst Du das gleiche nicht in Prozent sondern mit
Absolutwerten.

Könntest Du mir diesen Schritt vielleicht noch etwas genauer
erläutern, insbesondere was Du mit „plotten“ meinst.

plotten im Sinne von auftragen oder darstellen

Beispiel für die Daten (muß nach prozentualer Auslastung sortiert, sonst stimmt die Kumulierung nicht):

Kundenname Ausnutzung Kündigung kumulierter Wert
kd1 0.2 0 0
kd2 0.34 1 1
kd3 0.38 0 1
kd4 0.45 0 1
kd5 0.47 1 2
kd6 0.53 0 2
kd7 0.60 1 3
kd8 0.62 0 3
...

Du solltest Dir angucken wie die Kurve aussieht, wenn Du die vierte Spalte über der zweiten aufträgst.

Gruß,
Ingo