kennt jemand eine Möglichkeit um zusammenhängende Information einer Webseite zu extrahieren?
Ein Programmierer, hat mich für Wochen vertröstet und dann anschließend gesagt, er kann diesen Job nicht beenden.
Jetzt bin ich drauf gekommen, dass er den Webspace nicht nur zum programmieren sondern auch für alle mögliche verwendet hat (Fussball bilder, Kochrezepte,…)
Daher würde ich die nützliche Information von der unnötigen trennen.
Die Aufgabenstellung ist sehr komplex und daher so nebenbei kaum zu bewältigen, es sei denn, der Umfang der Aufgabe wird erheblich eingeschränkt. Insbesondere. Welchen Inhalt sollen die Informationen haben.Viele Grüße
Hajo!
Sorry, da kann ich dir nicht unbedingt helfen.
Ich hab auch noch nicht ganz verstanden, was genau dein Problem ist - du kannst Bilder von Texteingabe nicht unterscheiden oder welche Informationen sind zum Aussortieren gemeint?
Also, ist das eher ein programmiertechnisches Problem oder mehr ein ihnhaltliches…?
Für einen Computer gibt es nur normale, weder nützliche noch unnützliche Informationen solange die Unnützlichen nicht ein Kriterium haben, nachdem man suchen kann und diese löschen kann.
Hallo Chris,
bin mir nicht sicher ob ich deine Frage korrekt verstanden habe, aber soweit es sich um CMS-Webcontent handelt, kannst du den Content der einzelnen Seiten zusammenhängend herunterladen. Bei Datenbanksätzen kann es sein, dass sie über das CSV-Format extrahiert werden müssen.
Gruss
lisamay