HTML-Parser

Hallo zusammen,
Ich bin daran eine Suchmaschine in Java zu programmieren. Nun stehe ich vor dem Problem, dass ich zwar den Inhalt einer HTML-Datei bekomme aber darin noch alle HTML-Tags drin sind.
Wie kann ich diese entfernen? Gibt es einen HTML-Parser?

Vielen Dank.

Gruss, Simon

Moin,

Wie kann ich diese entfernen?

Klingt nach Perl, Äh Regexen.
http://www.alphaworks.ibm.com/tech/regex4j

Gibt es einen HTML-Parser?

Sollte man annehmen:
http://java.sun.com/j2se/1.3/docs/api/javax/swing/te…

Thorsten