Formel ermitteln, wie?

Guten Tag,
habe leider kaum Ahnung von Mathe und folgendes Problem:

Gegeben ist:

  • Anzahl der Variablen (15) mit einem Ausgabewert

  • Anzahl der Datensätze (ca 13.000.000)

  • geschlossene Skalierung der Variablen!

  • JEDER Kombinationsmöglichkeit der Variablenwerte ist ein Ausgabewert zugeteilt

Welche Möglichkeit habe ich die „einfachste“ zugrundeliegende Formel zu ermitteln.

Vielen Dank

Guten Tag,

also ich würde Least Squares, bzw. Maximum Likelihood Methode in Betracht ziehen…soweit ich die Anforderungen richtig verstanden habe

Gruß EasyJoel

Hi Benjamin,

irgendwie ist nicht ganz klar, wie das alles zusammenhängen soll.

  • JEDER Kombinationsmöglichkeit der Variablenwerte ist ein
    Ausgabewert zugeteilt

15 Variablen mit je einem Wert(?) ergeben knapp 2^15 Kombinationen (kann ein Wert auch mit sich selbst kombiniert werden?). Was hat es da mit den
datensätzen zu tun oder eine geschlossenen Skalierung?

Welche Möglichkeit habe ich die „einfachste“ zugrundeliegende
Formel zu ermitteln.

Das geht ggf. in Richtung Modellselektion, also AIC-Kriterium und so.
aber erst mal müsste man das Problem näher erläutert bekommen.
Grüße,
JPL

Danke für die schnellen Anworten!

noch mal anders: jede Variable kann nur einen Wert innerhalb einer abgesteckten (geschlossen) Skala von natürlichen Zahlen annehmen.

Beispiel: Variable_A: Wert = 1 ODER 2 ODER 3

Neben den 15 Eingabewerten (Variablenwerten) ist ebenfalls ein „Ergebnis“ (Ausgabe) in einem Datensatz enthalten.
Die Anzahl der Kombinationsmöglichkeiten aller Variablen entspricht genau der Anzahl der Datensätze.

;; leider haperts mit der fachspezifischen Sprache, hoffe man versteht.

Hi Benjamin,

also sieht das dann z.B. so aus?
(15 Variablen a-o und die Ausgabe)

ABCDEFGHIJKLMNO_Ausgabe
1--------------_5
21-------------_19
352------------_2
4780-----------_34
24651----------_12
582920---------_3

-2-4-5-7-8-6-7-_8

--------------1_1

Grüße,
JPL

ja, fast:

ABCDEFGHIJKLMNO____ERGEBNIS
000000000000000____12
100000000000000____34
200000000000000____4
010000000000000____11
110000000000000____12
210000000000000____1
020000000000000____17
120… ____4
220… ____8
030… …
130…
230…
001…
100…

Vielen Dank!

Hi,

dann wäre ordinale regression (mit 15 unabhängigen Variablen) das richtige für dich.
Hier gibts einen kleinen einstieg:
http://www.nesug.org/Proceedings/nesug05/an/an2.pdf
http://www.norusis.com/pdf/ASPC_v13.pdf
oder auch ind en meisten stat-büchern.
dann hast du erstmal 1 Modell. DAS einfachste - wie du es angefragt hattest - ist dann ein weiterer Schuh und kommt drauf, was du unter einfach verstehst: möglichst wenig unabh. Variablen, alle variablen nur erster Ordnung, bester fit, …?

Grüße,
JPL