MySQL ähnliche Datensätze ausfiltern

Dibi · 18. Februar 2006 um 11:49

Ich habe eine Problem mit MySQL, dass ich mit meinem Laien-Wissen
leider nicht lösen kann und hoffe daher auf Ihre Hilfe.
Ich habe eine Fragensammlung als MySQL-Datenbank die folgende
Struktur hat: ID, Frage, Antwort, Bemerkung

Mittlererweile ist die Datenbank - auch durch kräftige Mitarbeit von
Benutztern - auf ein beträchtliche Anzahl an Datensätzen angewachsen.
Nun möchte ich die Strings der Felder „Frage“ der einzelnen
Datensätze miteinander vergleichen und ähnliche Datensätze (gleiche
kommen so gut wie gar nicht vor) „markieren“ und diese aus der
Anzeige herausfiltern.
Sie sollen nicht gelöscht werden.

Vielmehr, sollen in einem weiteren Schritt alle doppelten und
„markierten“ Einträge gezählt werden, so dass man dann die
Information gewinnt, wie oft welche (ähnliche) Fragen schon in der
Datenbank vorhanden sind.

Das ganze ist eine Fragensammlung von Studenten für Studenten, dient
also noch einem guten Zweck und ist nicht kommerziell…
Jeder Student der eine Prüfung geschrieben hat, trägt dabei seine
Fragen in die Datenbank ein. Deshalb kommt es öfter vor, dass eine
Frage in ähnlicher Weise doppelt vorkommt.
Wäre um jeden Tip sehr dankbar!

M_L_ · 18. Februar 2006 um 12:41

Hallo erstmal.

Ich habe eine Problem mit MySQL, dass ich mit meinem
Laien-Wissen
leider nicht lösen kann und hoffe daher auf Ihre Hilfe.

Version der MySQL Datenbank ? Damit lässt sich abschätzen, welche SQL-Statements zur Verfügung stehen Welches weitere Werkzeug zur Datenbearbeitung steht ausserdem zur Verfügung (PHPmyAdmin,…) ?

Ich habe eine Fragensammlung als MySQL-Datenbank die :folgende
Struktur hat: ID, Frage, Antwort, Bemerkung

…auch online verfügbar ? Zur Not in ein anderes Datenformat konvertieren und online stellen.

Mittlererweile ist die Datenbank - auch durch kräftige
Mitarbeit von
Benutztern - auf ein beträchtliche Anzahl an atensätzen angewachsen.
Nun möchte ich die Strings der Felder „Frage“ der :einzelnen
Datensätze miteinander vergleichen und ähnliche atensätze
(gleiche
kommen so gut wie gar nicht vor) „markieren“ und diese :aus der Anzeige herausfiltern.
Sie sollen nicht gelöscht werden.

SELECT * FROM WHERE =
Besser (?): SELECT * FROM WHERE Frage = ‚Mathematik‘ & ‚bestanden‘

Vielmehr, sollen in einem weiteren Schritt alle :doppelten und
„markierten“ Einträge gezählt werden, so dass man dann :die
Information gewinnt, wie oft welche (ähnliche) Fragen :schon in
der
Datenbank vorhanden sind.

Das ganze ist eine Fragensammlung von Studenten für :Studenten,
dient
also noch einem guten Zweck und ist nicht :kommerziell…
Jeder Student der eine Prüfung geschrieben hat, trägt :dabei seine
Fragen in die Datenbank ein. Deshalb kommt es öfter :vor, dass
eine
Frage in ähnlicher Weise doppelt vorkommt.

Also so ähnlich wie die Wikipedia. Dann sucht man eher visuell oder verwendet eine SQL-Abfrage wie oben angedeutet. Der Zusatz mit DISTINCT unterdrückt übrigens die Anzeige mehrerer gleicher Datensätze.

HTH
mfg M.L.