Statistische Auswertung von Kosten! Regeln?!

Hallo liebe Expertenrunde,

Derzeit führe ich eine Untersuchung durch, bei der ich leider feststecke und keine passenden Unterlagen finde.
Hab leider bisher keinen gefunden, der da einen Rat hatte.

Grob gesagt, geht es um folgendes:

Auf der einen Seite steht eine hohe Zahl an Problemen die während der
Produktion von Teilen aufgetreten sind.
Auf der andere Seite die verursachten und damit verbundenen Kosten
(wie z.B. eine Werkzeugänderung).

Jedes Problem hat also seine eigenen Änderungskosten.

Problem 1 - 10€

Problem 2 - 150€

Problem 3 - 30€

Nun habe ich die Probleme Problemarten zugeordnet, sozusagen Cluster
gebildet.
Das Ergebnis soll veranschaulichen, wieviel im Durchschnitt ein
aufgetretenes Problem einer Problemart gekostet hat.

Leider weiß ich nicht genau, wieviele Daten (Anzahl Probleme)
nötig sind um eine anständige Auswertung zu fahren.

Nehmen wir an es sind etwa 1000 Probleme, diese können 20
verschiedenen Problemarten zugeordnet werden.

Reichen 1000 Probleme für eine Statistik aus?
Wie ist hier der Ansatz / Formeln?

Oder hängt das auch damit zu tun, wie genau meine Auswertung im
Endeffekt sein soll?

Die Anzahl der Probleme ist in erster Linie nicht auf 1000 begrenzt.
Eher geht es auch darum, wieviele Daten (Problemwerte) ich für eine
saubere Auswertung benötige!

Macht eine Auswertung von Kosten Sinn, wenn auf 20 Probleme z.B. nur
im Durchschnitt 5-15 Kosten kommen?

Was wenn die Kosten hohe Unterschiede aufweisen: z.B. Problemart A

Problem 1 - 10€

Problem 2 - 150€

Problem 3 - 30€

Muss ich dann nicht mit einer hohen Anzahl an Werten rechnen um
aussagekräftig zu sein?

Das Wichtigste ist, dass die Methode, die Mathematisch stimmt und
korrekt ist.

Leider finde ich hierzu keine für mich verständliche Literatur.

Für ein paar Tipps und Links zur Quelle wäre ich sehr sehr dankbar.

Vielen Dank.

Grüße,
Friedl

Hallo,

wie ich das verstanden habe, willst Du einen Eindruck gewinnen, welche Probleme wie häufig auftreten welche Kosten dadurch entstehen. Das Ganze willst Du nach Problemarten trennen.

Zunächst würde ich dazu einfach die Daten (die Du hast) mal graphisch darstellen. Die Verteilungen der Häufigkeiten stellt man mit einem Häufigkeitsdiagramm (Histogramm oder einfach nur ein Balkendiagramm) dar. Wenn du hinterher herausfinden willst, ob es Unterschiede zwischen den Häufigkeitsverteilungen für verschiedene Promlemarten gibt, kannst du dazu Fishers Exakten Test (oder den Chi²-Test) verwenden.

Bei mehr als 50 Problemen pro Problemart und Stichprobe kann man davon ausgehen, dass die mittleren Kosten der Stichproben inetwa normalverteilt sind. Hier kannst du mithilfe des Standardfehlers des Mittelwertes Konfidenzintervalle berechnen. Diese kannst Du auch in einem Diagramm darstellen.

Beispiel:

Du hast für die Kosten aus Problemgruppe A aus einer Stichprobe vom Umfang n = 300 eine Mittelwert von m = 125 und eine Standardabweichung von s = 34.

Der Standardfehler des Mittelwertes beträgt sm = s/Wurzel(n) = 1,96.

Das Quantil der Standard-Normalverteilung für das (zweiseitige) 99%-Konfidenzintervall beträgt q = 2,58.

Die Konfidenzintervall-Halbreite ist KI1/2 = q*sm = 5,06.

Das 99%-KI ist dann m ± KI1/2 = 125 ± 5,06

Also der Bereich zwischen 119.94 und 130.06 enthält den wahren Mittelwert der Kosten mit 99%iger Sicherheit.

Wenn Du wissen willst, welche Problemgruppen sich hinsichtlich der mittleren Kosten unterscheiden, kann man das mit T-Tests herausfinden, wobei die p-Werte für multiples Testen adjustiert werden müssen. Was und wie da am besten ist, kann Dir keiner sagen. Ein wenig hängt es aber von der genauen Anforderungen ab (zB.: willst Du möglichst sicher falsch-positive Ergebnisse vermeiden oder reicht es, den Anteil Falsch-positiver unter einer gegebenen Grenze zu halten? usw.).

LG
Jochen