Hallo zusammen,
Ich bin daran eine Suchmaschine in Java zu programmieren. Nun stehe ich vor dem Problem, dass ich zwar den Inhalt einer HTML-Datei bekomme aber darin noch alle HTML-Tags drin sind.
Wie kann ich diese entfernen? Gibt es einen HTML-Parser?
Vielen Dank.
Gruss, Simon