Hi Leute!
Weiss jemand von Euch, wie ich aus einem Satz Schlüsselwörter filtern bzw. generieren kann? Zum Beispiel möchte ich, das aus dem Satz: „Welche Befehle gibt es in LaTeX?“ die Keywörter Latex und Befehl rauskommen? Gibt es eine Möglichkeit z.B. dmoz als Basis dazu zu nutzen? Ich brauche keinen „Unified“-Schlüssel, sondern richtige Wörter, die letzendlich wirklich Entitäten ergeben, da sie für eine XML-Datenbank herhalten müssen! Hat jemand eine Idee?
Ich überlege gerade ob man mit Hilfe der dmoz-Klassifizierung eine Basis für die Schlüsselwörter über „Matching“ erzeugen kann und diese dann evtl. noch über Verben eindeutig macht. Was meint ihr?
Gruß,
Matthias
PS: Ich brauche also einen Algorithmus, oder ein Paket, dass dieses kann. Vielleicht fällt mir ja selbst noch was Nettes ein, aber würde auch gerne moch mit jemand „rumspinnen“, der evtl. auch noch eine Idee hat.