Webseite Datenbank Volltextsuche > Provider ?

stefan_k_1b533a · 20. Februar 2005 um 18:00

hallo www-ler

ich habe eine vielzahl (über 100.000 !!) sprüche gesammelt,
die ich gerne im internet veröffentlichen möchte.
und das gleichzeitig mit einer möglichkeit der
„volltextsuche“ über die gesamte liste.

wie kann man so etwas realisieren ?
von datenbanken … mysql / perl … habe ich keine ahnung

gibt es so etwas schon „fertig gestrickt“ ?

welchen anbieter kann ich nehmen (will wenig geld ausgeben) ?

hat jemand einen tip ?
würde für die realisierung auch ein klein wenig ausgeben (wollen/müssen) ;=)

vorab vielen dank
stefan

pumpkin_1768a9 · 20. Februar 2005 um 18:57

Moin

von datenbanken … mysql / perl … habe ich keine ahnung

ohne wird es nicht gehen. Man braucht zwinged eine serverseitige Suche. Alles andere ist bei der Grösse Humbug.

gibt es so etwas schon „fertig gestrickt“ ?

Evtl, kommt darauf an was du erwartest. Wenn z.B. nur von einem Wort exakte Treffer ausgegeben werden sollen reicht ein 10-Zeilen Perl-Skript. Wenn aber unscharfe Suchen, boolsche Suchen oder bewertung der Sprüche nach Trefferwahscheinlichkeit dazukommen wirds schon enger…

welchen anbieter kann ich nehmen (will wenig geld ausgeben) ?

Du meinst Hoster ? Realtiv egal, solange der Server die Skripte zuende ausführt ist alles OK.

cu

stefan_k_1b533a · 20. Februar 2005 um 20:39

hallo pumpkin

nein, allzu kompliziert sollte es nicht werden.
die „datenbank“ ist relativ einfach aufgebaut
> id-nr
> text
> autor
nicht mehr und nicht weniger. als csv-datei hat es
ein groesse von ca 12 mb

bei der volltextsuche soll der user ein oder mehrere wörter
eingeben können - z.b. albert einstein
und es werden alle sprüche ausgegeben, die „albert einstein“
enthalten.
es sollten aber auch teil-string erfasst werden können
also: eingabe „pump“ sollte auch pumpkin finden
und den jeweiligen spruch ausgeben.
es wäre schön, wenn die ergebnisse in einer „tabelle“
ausgegeben werden - der übersicht halber jede zweite
zelle z.b. hellgelb -
ausgegeben werden sollte id-nr - spruch - autor

na ja, dann fällt mir noch ein
> der einzugebende suchtext sollte mind
4 oder 5 buchstaben/zahlen enthalten
> ausgabe der anzahl der treffer
> es sollten immer nur 10 treffer auf einmal angezeigt werden
mit „weiter“ sollten die nächsten 10 … usw

der hoster ist mir egal.
gibts da eine empfehlung ? müsste dann ja mit sql und perl sein.

wichtig ist mir nur, dass es
> so guenstig wie möglich ;=)
> und dass die suchergebnisse nicht erst nach 5 minuten erscheinen

freu mich auf eine antwort
gruss
stefan

pumpkin_1768a9 · 20. Februar 2005 um 21:56

Moin

als csv-datei hat es
ein groesse von ca 12 mb

Die Grösse schliesst SQL + freehoster schonmal aus. Perl + flat-file oder Perl + berkeleyDB ginge aber immernoch.

bei der volltextsuche soll der user ein oder mehrere wörter
eingeben können - z.b. albert einstein
und es werden alle sprüche ausgegeben, die „albert einstein“
enthalten.

Kein Problem. Das kann man sogar auf freehostern in anständiger Zeit zum laufen bringen.

es sollten aber auch teil-string erfasst werden können
also: eingabe „pump“ sollte auch pumpkin finden
und den jeweiligen spruch ausgeben.

Das ist ein riesengrosses Problem und setzt viel mehr Power vorraus. Es hat schon seine Gründe weshalb selbst google das nicht mehr macht. Wenn es wenigstens nur nach Anfangsstrings wäre… da könnte man was machen.

es wäre schön, wenn die ergebnisse in einer „tabelle“
ausgegeben werden - der übersicht halber jede zweite
zelle z.b. hellgelb -
ausgegeben werden sollte id-nr - spruch - autor

Das ist Komsmetik, sowas kann man in die meisten Skripts nachträglich einbauen.

> der einzugebende suchtext sollte mind
4 oder 5 buchstaben/zahlen enthalten
> ausgabe der anzahl der treffer
> es sollten immer nur 10 treffer auf einmal angezeigt
werden
mit „weiter“ sollten die nächsten 10 … usw

Geht alles ohne grössere Probleme. Sowas haut erst rein wenn die Seite sehr gut besucht wird.

gibts da eine empfehlung ? müsste dann ja mit sql und perl
sein.

Oder perl + flat-file oder perl + berkeleyDB.

> so guenstig wie möglich ;=)

Lass das substring-suchen weg und ein freehoster reicht.

> und dass die suchergebnisse nicht erst nach 5 minuten
erscheinen

Naja,… 12MB Texte sind zwar nicht ohne, aber wenn sich die Texte nicht zu häufig ändern und man das ganze über vorgefertigete Indexe laufen lässt ist das alles nicht so wild.

cu