Hallo,
beschäftige mich nun schon seit einiger Zeit mit Java und seit Kurzem mit einem Programm, welches den HTML-Inhalt mehrerer URLs auslesen und verarbeiten soll. Nun habe ich hierfür auch eine Methode und mit einer Seite funktioniert das Ganze bereits, bei einer anderen allerdings erhalte ich eine „Java.io.FileNotFoundException“ - die URL existiert allerdings und lässt sich auch in einem Browser öffnen. Nun habe ich festgestellt, dass Java manchmal die Seite doch erreicht, aber warum nur manchmal?
Ich habe jetzt schon viel ausprobiert, komme aber nicht dahinter wo da der Fehler sein könnte…
//Diese Funktion orientiert sich an folgender: http://entwickler-forum.de/showthread.php?t=48528, aufgerufen am 22.11.2010 um 17:10
public String getWebseite(String url, boolean encodeEntities, Proxy proxy) throws Exception {
String quellcode = "";
try {
InputStream dataStream = null;
URL adresse = new URL(url);
//Wenn Proxy angegeben dann die Verbindung über den Proxy herstellen
URLConnection verbindung = null;
if (proxy != null) {
verbindung = adresse.openConnection(proxy);
}
else {
verbindung = adresse.openConnection();
}
dataStream = verbindung.getInputStream();
//quellcode = new Scanner(dataStream).useDelimiter("\\Z").next();
}
catch (Exception ex) {
System.out.println("Der Download der Webseite '" + url + "' ist fehlgeschlagen: " + ex.toString());
}
Und hier wird die Methode verwendet:
seite = inet.getWebseite(this.alphabetSeiten.get(i), true, proxy);
Die ArrayList wird hier initialisiert:
this.alphabetSeiten = new ArrayList();
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=0-9/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=A/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=B/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=C/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=D/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=E/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=F/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=G/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=H/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=I/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=J/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=K/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=L/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=M/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=N/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=O/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=P/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=Q/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=R/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=S/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=T/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=U/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=V/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=W/index.html");
this.alphabetSeiten.add("http://www.ardmediathek.de/ard/servlet/ajax-cache/3474820/view=list/initial=Z/index.html");
Ich hoffe, mir kann jemand helfen!
Vielen Dank schon mal!
Grüße,
Florian L.