HttpURLConnection Fehler beim Quelltext holen

FaxXer

Mitglied
Hey,
ich habe eine Klasse um den Source Code von Websites zu holen.

Java:
public class BasicCookie {
	static LinkedList<String> getSource(String uri) throws MalformedURLException, IOException
	{
	String line = null;
	String userAgent = "User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0";
	LinkedList<String> Source = new LinkedList<String>();
	LinkedList<String> cookie = null;
	String cock = null;
	String cookieName = null;
	String cookieValue = null;
	
	cookie = getCookie(uri);
	
	URL url = new URL(uri);
	HttpURLConnection connection = (HttpURLConnection)url.openConnection();
	
	connection.setRequestMethod("GET");
	connection.addRequestProperty("User-Agent", userAgent);
	HttpURLConnection.setFollowRedirects(false);
	
	for(int i = 0; i < cookie.size(); i++)
	{
	cock = cookie.get(i);
	cock = cock.substring(0, cock.indexOf(";"));
	cookieName = cock.substring(0, cock.indexOf("="));
    cookieValue = cock.substring(cock.indexOf("=") + 1, cock.length());
	connection.setRequestProperty(cookieName, cookieValue);
	}
	
	connection.connect();
	
	BufferedReader rd = new BufferedReader(new InputStreamReader(connection.getInputStream(), "UTF-8"));
	
	while(((line = rd.readLine()) != null))
	{
       Source.add(line);
    }
	connection.disconnect();
    
	return Source;
	}

	static LinkedList<String> getCookie(String uri) throws IOException
	{
		String userAgent = "User-Agent: Mozilla/5.0 (Windows NT 6.1; rv:8.0) Gecko/20100101 Firefox/8.0";
		URL url = new URL(uri);
		HttpURLConnection connection = (HttpURLConnection)url.openConnection();
		connection.setRequestMethod("GET");
		connection.addRequestProperty("User-Agent", userAgent);
		HttpURLConnection.setFollowRedirects(false);
		connection.connect();
		LinkedList<String> cookie = new LinkedList<String>();
			String headerName = null;
			for (int i = 1; (headerName = connection.getHeaderFieldKey(i))!=null; i++) {
			 	if (headerName.equals("Set-Cookie")) {    
				cookie.add(connection.getHeaderField(i));
			 	}
			 	}
			connection.disconnect();
	return cookie;
	}

Das funktioniert normalerweise auch Super, jedoch habe ich jetzt beim Zugriff auf die Klasse mit dieser Methode ein Problem.
Diese Methode soll mir die Seitenzahlen zurückgeben. Dazu hab ich mir überlegt, dass man einfach in bestimmten Abschnitten hochzählt bis die fehler Seite angezeigt wird und dann wieder zurück zählt. Sodass man nicht in einzer Schritten abzählen muss. Sind nämlich mehr als 1000 Seiten und um den Source zu holen dauert das ja seine Zeit.

Allerdings bekomme ich jetzt, wenn die fehler Seite angezeigt wird und es mit der ersten if Anweisung (Zeile 10)überprüft wird folgende Fehlermeldung in Zeile 32 der getSource Methode: HttpURLConnection fehler [local variables unavailable]
Wäre gut wenn da jemand mal drüber schauen könnte.

Und wenn ich jetzt schonmal frage, weis jemand ob es schon vorgefertigte kostenlose Klassen gibt die genau so eine Überprüfung wie ich vorhabe machen?

Java:
int number;
		String Link;
		LinkedList<String> Source = new LinkedList<String>();
		
		
				for(number = 1; number <= 5000; number += 500)
				{
					Link = "http://www.******.de/"+ number;
					Source = getSource(Link);
					if ((Source.get(102).contains("404")))
					{
						for(;; number -= 100)
						{
							Link = "http://www.******.de/"+ number;
							Source = getSource(Link);
							if(!(Source.get(102).contains("404")))
							{
								do
								{
									Link = "http://www.******.de/"+ number;
									Source = getSource(Link);
									number++;
								}while(Source.get(102).contains("404"));
							}
						}
					}
				}

Vielen Dank
 

FaxXer

Mitglied
So ich habe jetzt selber noch ein wenig weiter probiert, hat aber alles nichts geholfen.

Meine Seitenzahlen Methode sieht nun so aus:

Java:
static int NumberofPages() throws MalformedURLException, IOException
	{
		int number;
		String Link;
		LinkedList<String> Source = new LinkedList<String>();
		String Temp;
		
				for(number = 1; number <= 5000; number += 500)
				{
					Link = "****"+ number;
					Source.addAll(getSource(Link));
					Temp = Source.get(102);
					
					if (Temp.contains("404"))
					{
						while(true)
						{
							number -= 100;
							Link = "****"+ number;
							Source.addAll(getSource(Link));
							Temp = Source.get(102);
							if(!Temp.contains("404"))
							{
								do
								{
									number++;
									Link = "****"+     number;
									Source.addAll(getSource(Link));
									Temp = Source.get(102);
								}while(Temp.contains("404"));
							}
						}
					}
				}
		
		number--;
		return number;
	}
	
}

Der Fehler tritt immer beim dritten Durchlauf in der ersten Schleife auf.
Hier die Fehlermeldung von Eclipse:

Code:
HttpURLConnection.getInputStream() line: 1469 [local variables unavailable]
BasicCookie.getSource(String) line:11
OrlyDB.NumberofPages() line: 31

Wäre wirklich toll wenn jemand mal drüber schauen könnte, ich komm einfach nicht auf den Fehler :(
Vielen Dank
 
S

SlaterB

Gast
die Fehlermeldung sagt ja absolut gar nichts aus, gibts da wirklich nicht mehr, Screenshot?
was ist wenn du try/catch (Throwable) drumherum baust, was du hoffentlich kennst, ist damit ein normaler StackTrace,
Name der Throwable-Klasse zu ermitteln usw.?

der Ablauf ist bisher noch nicht deutlich beschrieben, funktioniert alles für Seite 1?
auch für Seite 1, 2, 3 hintereinander?

> wenn die fehler Seite angezeigt wird und es mit der ersten if Anweisung (Zeile 10)überprüft wird folgende Fehlermeldung in Zeile 32 der getSource Methode

Zeile 10 aus NumberofPages() findet ja direkt nach getSource() statt, das aktuelle getSource() war also erfolgreich,
nur das nächste geht dann schief oder was genau passiert?

gib nebenbei aus welche Seiten besucht werden,
wenn du dann das ganze separat nachstellst, einfach nur beispielsweise
Java:
getSource(Seite 500)
getSource(Seite 1000)
getSource(Seite 1500) // da würde das if aktiv werden
getSource(Seite 1400) // das folgende source
ausführst, kommt es dann genauso zum Fehler?

----

deine Schleife mit dem mehrfachen Code könntest du umstellen,
besser nur einmal den Code mit getSource() drinhaben, außen rum z.B. eine while(true)-Schleife,
und anhand von Variablen kontrollieren, ob aktuell um x erhöht oder um y gesenkt werden soll,

ok, bisschen kompliziert, vielleicht lohnt es sich zusammen mit kompletter Optimierung auf Zweierpotenzen:
du gehts von einem Bereich bis 5000 aus?
starte bei 4096 = 2^12,
je nachdem ob Seite ok ist oder nicht, wird der nächste Wert, 2^11 = 2048 addiert oder subtrahiert,
danach gehts mit 2^10 = 1024 weiter, 512, 256 usw.,
in maximal 12 Schritten ist die Zielseite gefunden

Beispiel:
ist 429 die letzte Seite?
Start 4096, zu hoch
-> 4096 - 2048 = 2048, zu hoch
-> 2048 - 1024 = 1024, zu hoch
-> 1024 - 512 = 512, zu hoch
-> 512 - 256 = 256, zu niedrig
-> 256 + 128 = 384, zu niedrig
-> 384 + 64 = 448, zu hoch
-32
+16
-8
+4
+2
-1
alle Schritte komplett benötigt, bei ungeraden Zahlen dürfte das immer so sein, nur die 1 am Ende schafft den Wechsel von gerade auf ungerade,
dennoch der schnellste Weg
 

FaxXer

Mitglied
Gut hab jetzt mal den try/catch Block drum herum gemacht. Dann bekomme ich einen
Code:
java.io.FileNotFoundException: http://www.****/1001
Fehler.

Vom Ablauf her funktioniert es für alle Seiten bis 1000. Hab ich aber auch erst gerade bemerkt. Die 1001ste Seite wäre dann die Fehler Seite. Also woran ich erkennen wollte wieviele Seiten es gibt. Hmm vielleicht findet er in der Zeile 102 den String "404" nicht. Aber selbst wenn es so wäre würde es ja keinen Fehler geben sondern einfach weiter laufen?!

Zeile 10 aus NumberofPages() findet ja direkt nach getSource() statt, das aktuelle getSource() war also erfolgreich,
nur das nächste geht dann schief oder was genau passiert?

Nein, dass aktuelle getSource() also beim Durchlauf wo die Seitenzahl 1001 ist gibt es den Fehler.


Habs so mal getestet:
Java:
Source.addAll(getSource("http://www.orlydb.com/s/0day/1000"));
		Source.clear();
		Source.addAll(getSource("http://www.orlydb.com/s/0day/1500"));
		Source.clear();
		Source.addAll(getSource("http://www.orlydb.com/s/0day/2000"));
Das Source.clear() hab ich mal hingemacht, da ich überlegt habe ob die LinkedList Source zu groß werden könnte.. Hat aber keine Änderung vollbracht.

Der Fehler kommt immer wenn die Seitenzahl über 1000 ist. Das ist genau die Seitenanzahl, die es gibt. Bei 1001 kommt die Fehlermeldung.

Danke für den Hinweis mit den Potenzen, ich hab mir auch schon gedacht, dass ich das irgendwie klüger lösen sollte. Wusste aber noch nicht genau wie.

Im Anhang ist noch der Screen.
 
H

hasteMalNeMark?

Gast
Hallo.

Also
Java:
 java.io.FileNotFoundException: [url]http://www.****/1001[/url]
wird womöglich nichts anderes heißen wie 404 Not Found. Soll dein Code speziell nur für eine Seite funtionieren?
Zudem bietet doch die Klasse HttpURLConnection Methoden an, um den HTTP responsecode zu erhalten.
HttpURLConnection (Java Platform SE 6)

Dann fragst du in einer Schleife bei jeder Seite nach dem Code ab und reagierst dann darauf.

Gruß
 

FaxXer

Mitglied
Danke für eure Hilfe, klar auf die Responses hätte ich selber kommen sollen !..
So ists natürlich viel einfacherer.

Hier mal meine Lösung, per Response Code und 2^pow Abfrage:

Java:
static int getResponse(String uri) throws IOException
		{
			URL url = new URL ( uri );
			URLConnection connection = url.openConnection();

			connection.connect();

			if ( connection instanceof HttpURLConnection)
			{
			   HttpURLConnection httpConnection = (HttpURLConnection) connection;
			   int code = httpConnection.getResponseCode();
			   return code;
			}
			else
			{
			   System.err.println ("error - not a http request!");
			   return -9;
			}
			
		}

	    public static void main(String[] args) throws IOException {
	    	int pow = 12;
	    	int counter = 4096;
			String Link = "*********"+ counter;
			
	    	while(true)
			{
	    		pow--;
	    		int response = getResponse(Link);
	    		
	    		if(pow != -1)
	    		{
	    			if((pow == 0) && ((counter % 2) == 0))
	    			{
	    				System.out.println("Es gibt "+ counter+ " Seiten");
		    			break;
	    			} else {	    			
	    				if(response == 404)
	    				{
	    					counter = counter - ((int) Math.pow(2, pow));
	    					Link = "*********"+ counter;
	    				}
	    				else if(response == 200)
	    				{
	    					counter = counter + ((int) Math.pow(2, pow));
	    					Link = "*********"+ counter;
	    				}
	    				else
	    				{
	    					System.out.println("Fehler beim ResponseCode");
	    				}
	    			}
	    		}
	    		else
	    		{
	    			System.out.println("Es gibt "+ counter+ " Seiten");
	    			break;
	    		}
			}
	}

Wahrscheinlich nicht die beste Lösung.. Bin aber noch Anfänger und habe nichts gegen Verbesserungen!
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
F HttpURLConnection mit vielen Parametern Java Basics - Anfänger-Themen 3
L Muss eine HttpURLConnection geschlossen werden? Java Basics - Anfänger-Themen 2
B Input/Output HttpURLConnection ( java.net ) Post request Java Basics - Anfänger-Themen 8
G run hdinsight spark job with HttpUrlConnection Java Basics - Anfänger-Themen 0
lars-sh HttpURLConnection und OutputStream Java Basics - Anfänger-Themen 4
F Kann mir jemand bei dem Fehler helfen? Java Basics - Anfänger-Themen 6
Juelin jedit Fehler beim starten Java Basics - Anfänger-Themen 2
I Frage Thymeleaf -> Fehler ignorieren und mit "" ersetzen? Java Basics - Anfänger-Themen 15
E Matrizenmultiplikation Fehler Java Basics - Anfänger-Themen 0
Z Fehler Zeiterfassungsprogramm Anzeige Java Basics - Anfänger-Themen 3
C SwingWorker mit Fehler Java Basics - Anfänger-Themen 2
monsterherz Fehler Semikolon fehlt - ich weiss aber nicht wo da noch eines hin sollte... Java Basics - Anfänger-Themen 21
G Compiler-Fehler Fehler in Zeile 1 beheben, wie? Java Basics - Anfänger-Themen 9
W Fehler in der Datei pom.xml Java Basics - Anfänger-Themen 19
marcelnedza Finde meinen Fehler in einer Methode nicht, Java Karol Java Basics - Anfänger-Themen 15
monsterherz einfache Methode mit Fehler den ich nicht finde Java Basics - Anfänger-Themen 21
monsterherz if / else if mit Fehler den ich leider nicht finde Java Basics - Anfänger-Themen 11
N Interpreter-Fehler Compiler zeigt keine Fehler an, aber das Programm läuft nicht (BlueJ) Java Basics - Anfänger-Themen 2
ohneInformatik; Dynamische Zinsen. Wo liegt der Fehler? Java Basics - Anfänger-Themen 4
Fiedelbambu deriveFont Fehler wer kann Helfen? Java Basics - Anfänger-Themen 4
I Ical4j / Kalender einlesen von URL - Fehler: "Unparseable date" Java Basics - Anfänger-Themen 16
Lion.King Fehler in double und int Java Basics - Anfänger-Themen 7
H BlueJ: was genau ist hier der Fehler? Java Basics - Anfänger-Themen 14
berserkerdq2 Habe ein Spiel entwickelt, dass immer in der 4 Runde einen cast-Fehler erhält Java Basics - Anfänger-Themen 3
D Datentypen LocalDate.parse() ergibt Fehler Java Basics - Anfänger-Themen 5
stormyark Fehler beim überschreiben einer Variable Java Basics - Anfänger-Themen 1
T String Array Fehler beim Index Java Basics - Anfänger-Themen 3
N Fehler "Cannot instantiate the type" Java Basics - Anfänger-Themen 3
L Ich weis nicht was der Fehler ist! Java Basics - Anfänger-Themen 14
L30nS JNI Fehler, JRE und JDK Java Basics - Anfänger-Themen 8
E Executable jar file fehler Java Basics - Anfänger-Themen 9
S Fehler beim Programm Java Basics - Anfänger-Themen 2
U Warum kriege ich hier eine nullpointer exception, sehe den Fehler nicht (swing) Java Basics - Anfänger-Themen 1
J Syntax-Fehler? Java Basics - Anfänger-Themen 2
Jose05 Fehler im Programm feststellen Java Basics - Anfänger-Themen 2
S Methoden 2 non-static Methoden, trotzdem Fehler "non static method can not be referenced from a static context" Java Basics - Anfänger-Themen 9
G Taschenrechner ergibt Fehler in if-Abfrage Java Basics - Anfänger-Themen 6
I Fehler bei for-Schleife Java Basics - Anfänger-Themen 6
lol5443 Tic Tac Toe Fehler Java Basics - Anfänger-Themen 5
K Fehler bei der Implementierung Java Basics - Anfänger-Themen 6
N Fehler im Code (Aufgabe für Anfänger) Java Basics - Anfänger-Themen 11
W Verschachtelte If-else --> finde meinen Fehler nicht Java Basics - Anfänger-Themen 30
J Fehler bei array aus anderer Klasse Java Basics - Anfänger-Themen 3
H Fehler bei integer Division Java Basics - Anfänger-Themen 28
C Fehler beim erstellen eines Objektes Java Basics - Anfänger-Themen 3
N Was bedeutet dieser Fehler Java Basics - Anfänger-Themen 2
fuerteb Compiler-Fehler Methode wird nicht bzw. als Fehler erkannt Java Basics - Anfänger-Themen 4
Lion.King Fehler Java Basics - Anfänger-Themen 5
AlexG. Nullpointer exeption Fehler Java Basics - Anfänger-Themen 0
C Fehler im Code Java Basics - Anfänger-Themen 10
J Anfänger, Fehler; "Der Hund liegt begraben" Java Basics - Anfänger-Themen 3
Aqtox Hallo ich muss für die Schule ein Wuerfell Duell erstellen jedoch habe ich ein fehler Java Basics - Anfänger-Themen 4
V Wer findet den Fehler :) Java Basics - Anfänger-Themen 12
B ArrayIndexOutOfBoundsException, ich finde den Fehler nicht? Java Basics - Anfänger-Themen 10
A Compiler Fehler - not a statement Java Basics - Anfänger-Themen 2
Arita welche Fehler gibt es noch? wie kann ich es noch vervollständigen Java Basics - Anfänger-Themen 15
S Fehler bei Code mit SubStrings für mich nicht auffindbar. Java Basics - Anfänger-Themen 4
S Kriege Fehler "Exception in thread" beim Benutzen von SubStrings. Java Basics - Anfänger-Themen 2
H Logik Fehler erkennen Java Basics - Anfänger-Themen 21
T Fehler in Caesar-Chiffre Java Basics - Anfänger-Themen 7
R Fehlermeldung aber WO liegt der Fehler? Java Basics - Anfänger-Themen 7
B Nicht reproduzierbarer Fehler bei Kompilierung - Shortcut "Bereinigung" Compiler ? Java Basics - Anfänger-Themen 4
Nerdinfekt BMI Rechner, fehler beim Zurückgeben des Strings? Java Basics - Anfänger-Themen 2
pumpgun99 Fehler Meldung "else without if" Java Basics - Anfänger-Themen 3
P Was bedeutet dieser Fehler? Java Basics - Anfänger-Themen 31
KogoroMori21 Java Datum Differenz (kleiner Fehler) Java Basics - Anfänger-Themen 10
N java.util.InputMismatchException Fehler Java Scanner Java Basics - Anfänger-Themen 5
H Fehler: NullPointerException und ich weiß net warum Java Basics - Anfänger-Themen 4
R Ich sehe meinen fehler nicht Java Basics - Anfänger-Themen 8
Johannes_ece Fehler: Application Terminated (TypeError): var$0.$moveToolTo is not a function Java Basics - Anfänger-Themen 4
GermanPie Fehler in Putty (kein Hauptmanifestattribut, in jar) Java Basics - Anfänger-Themen 4
M Scannen von *.txt - Dateien; wo sind der oder die Fehler? Java Basics - Anfänger-Themen 4
P Methoden aufrufen - Fehler Java Basics - Anfänger-Themen 20
JavaClap "Bruchrechner" liefert Fehler/keine Ausgabe bei Addition und Subtraktion Java Basics - Anfänger-Themen 0
B if Clause Fehler Java Basics - Anfänger-Themen 2
G Fibonacci Zahlenreihe Fehler Java Basics - Anfänger-Themen 4
A Fehler beim Ausführen einer class Datei Java Basics - Anfänger-Themen 6
B Fehler, aber ich weiß nicht warum Java Basics - Anfänger-Themen 3
C system cannot be resolved Fehler in Eclipse Java Basics - Anfänger-Themen 18
J Fehler im Code, aber ich weiß nicht wieso! Java Basics - Anfänger-Themen 6
M Compiler-Fehler Fehler beim Ausführen des Codes Java Basics - Anfänger-Themen 25
M While-Schleifen-Fehler Java Basics - Anfänger-Themen 4
N Fehler bei JUnit Test Java Basics - Anfänger-Themen 5
C Projekte in 2 versch. Arbeitsbereichen: auf ein Projekt verweisen (ohne Fehler zu bekommen) Java Basics - Anfänger-Themen 8
R Java SQL Fehler! Java Basics - Anfänger-Themen 4
L non-static Fehler Java Basics - Anfänger-Themen 16
C Fehler beim Speichern (Build projekt) Java Basics - Anfänger-Themen 42
L Methoden Wie Löse ich ext Methoden Aufruf Fehler? Java Basics - Anfänger-Themen 3
F Methoden Bitte Helft mir meinen Fehler zu finden. Möchte in diesem Bankenprogramm durch die Konsoleneingabe auswählen welches Konto reduziert und welches erhö Java Basics - Anfänger-Themen 17
C Fehler bei der Compilierung Java Basics - Anfänger-Themen 1
T Mein Programm hat Fehler Java Basics - Anfänger-Themen 4
S Warum dieser Fehler? Java Basics - Anfänger-Themen 1
B Fehler bei Ausführung Java Basics - Anfänger-Themen 5
Kirby.exe Fehler beim Ausgeben Java Basics - Anfänger-Themen 2
X java.lang.NullPointerException fehler ? Java Basics - Anfänger-Themen 1
L Wo ist der Fehler? Java Basics - Anfänger-Themen 87
J Fehler in Programm: Index -1 out of bounds for length 0 Java Basics - Anfänger-Themen 5
M JOptionPane Fehler bei "Abbrechen" des Fensters Java Basics - Anfänger-Themen 10
N Fehler bei string Attribut! Java Basics - Anfänger-Themen 18
W Wo liegt der Fehler? Java Basics - Anfänger-Themen 8

Ähnliche Java Themen

Neue Themen


Oben