Verbundene Webseiten im Webspace

Hallo Experten,

kennt jemand eine Möglichkeit um zusammenhängende Information einer Webseite zu extrahieren?
Ein Programmierer, hat mich für Wochen vertröstet und dann anschließend gesagt, er kann diesen Job nicht beenden.
Jetzt bin ich drauf gekommen, dass er den Webspace nicht nur zum programmieren sondern auch für alle mögliche verwendet hat (Fussball bilder, Kochrezepte,…)
Daher würde ich die nützliche Information von der unnötigen trennen.

Für schnelle Lsgmöglichkeiten bin ich dankbar.

Lg,
Chris

Um eine passende Antwort zu liefern fehlen leider Informationen.

Was sind zusammenhängende Informationen? Artikel in einem Blog? Komplette HTML Seiten?

Was für ein System habt ihr auf dem Webspace laufen? Ein CMS, wie Typo3? Eine Eigenentwicklung auf Basis von PHP, Ruby oder Java?

Wo sind die Informationen gespeichert? In einzelnen Dateien oder in einer Datenbank? Wenn ja was für eine?

Gruß

Sorry, Chris. Kann da leider gar nicht helfen!

Für eine Einschätzung des Aufwandes müsste ich einen Blick auf die Website werfen.

Wenn Du mir die URL zuschickst, dann schaue ich es mir mal an.

Du kannst zwecks Kontakt auch anrufen unter 0163/9037229.

Gruß Bernd Schütze

Hallo,
kann Dir da leider nicht weiterhelfen.
Gruß
Rolf

das läuft auf eine Inidividualprogrammierung hinaus. Ich würde, wenn ich es nicht selber machen kann einen Freelancer beauftragen.

LG,
Dirk

Die Aufgabenstellung ist sehr komplex und daher so nebenbei kaum zu bewältigen, es sei denn, der Umfang der Aufgabe wird erheblich eingeschränkt. Insbesondere. Welchen Inhalt sollen die Informationen haben.Viele Grüße
Hajo!

Sorry, da kann ich dir nicht unbedingt helfen.
Ich hab auch noch nicht ganz verstanden, was genau dein Problem ist - du kannst Bilder von Texteingabe nicht unterscheiden oder welche Informationen sind zum Aussortieren gemeint?
Also, ist das eher ein programmiertechnisches Problem oder mehr ein ihnhaltliches…?

LG,
Dagmar

Sorry, ich würde es „zu Fuss“ machen…

Für einen Computer gibt es nur normale, weder nützliche noch unnützliche Informationen solange die Unnützlichen nicht ein Kriterium haben, nachdem man suchen kann und diese löschen kann.

Hallo Chris,
bin mir nicht sicher ob ich deine Frage korrekt verstanden habe, aber soweit es sich um CMS-Webcontent handelt, kannst du den Content der einzelnen Seiten zusammenhängend herunterladen. Bei Datenbanksätzen kann es sein, dass sie über das CSV-Format extrahiert werden müssen.
Gruss
lisamay

Hallo,
war längere Zeit nicht zu Hause.
So melde ich mich für dich viel zu Spät.
Muss dir auch sagen…
-ich hab keine Ahnung- sorry
Sasabi