Liefert new URL(String) gecachte Webseiten?

Jaskur

Mitglied
Guten Tag!
Im Rahmen eines Uni Projektes entwickle ich eine Java Software welche es ermöglicht Webseiten abzuspeichern. Es ist hierbei erforderlich immer die aktuelle Version der Webseite anzufordern und keine gecachte Version da die Software zu forensischen Zwecken verwendet werden soll.
Hierfür habe ich mir auf die Schnelle folgende Funktion geschrieben:

Java:
private String makeRequest(String requestUrl){
		
		try {
			URL url = new URL(requestUrl.toString());
	        
			StringBuffer sbSource = new StringBuffer();
			BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));

			String inputLine;
	        while ((inputLine = in.readLine()) != null) {
	        	sbSource.append(inputLine);
	        }
	        in.close();      
	        source=sbSource.toString();
	        
	    } catch (IOException e) {
	    	System.out.println("Error occured: url.openStream()");
	        //e.printStackTrace();
	    }
	    		
		return source;
	}
Nun bin ich aber unsicher ob ich hierbei Gefahr laufe eine gecachte Version zu erhalten.
Falls ja, gibt es Möglichkeit sicher zu gehen dass dies nicht passiert?
Falls nein, müsste ich in Erfahrung bringen warum dies so ist.
 
G

Gast2

Gast
Nun bin ich aber unsicher ob ich hierbei Gefahr laufe eine gecachte Version zu erhalten.
die Chancen stehen gut Webseiten aus dem Cache zu erhalten, wenn das Netzwerk irgendwo (beginnend am lokalem Rechnen - Ende beim Webserver) entsprechend Webseiten zwischen speichert ... die Implementierung von URL dürfe sich mit Cachen von Seiten nicht befassen
Falls ja, gibt es Möglichkeit sicher zu gehen dass dies nicht passiert?
entweder [c]?rnd=XXXXXXXX[/c] oder [c]&rnd=XXXXXXXXX[/c] an die URL hängen ... dabei [c]X[/c] jeweils durch gülte Zufallswerte ersetzen

hand, mogel
 

tagedieb

Top Contributor
Du kannst im Prinzip immer Gefahr laufen eine gecachte Seite zu erhalten.

Aus Performancegruenden wird serverseitig vorgelagerte Caches verwendet um den eigentlichen Server nicht zu ueberlasten.
Normalerweise werden eher statische Resourcen wie Bilder, Sound, .css, .js,... gecached und nicht dynamische Inhalte.

Ich fuerchte du hast nicht viel Einfluss ob du das Original oder eine gecachte Version erhaelst. Wie gesagt sollten eigentlich nur statische Inhalte gecached werden, bei dennen es keine Rolle spielt. Ausserdem sind die Webseiten Administratoren die Seiten so aktuell wie moeglich zu halten und Caching nur dort zu verwenden wo es Sinn macht. Niemand hat interesse eine alte Seite zu cachen sondern sind bemueht immer die aktuellste Version zu verwenden.
 

Michael...

Top Contributor
Das ist via URLConnection einstellbar:
Java:
URL url = new URL("http://java-forum.org");        	
URLConnection urlconnection = url.openConnection();
urlconnection.setUseCaches(false);
			
BufferedReader reader = new BufferedReader(new InputStreamReader(urlconnection.getInputStream()));
...
 

homer65

Top Contributor
Das ist via URLConnection einstellbar:
Java:
URL url = new URL("http://java-forum.org");        	
URLConnection urlconnection = url.openConnection();
urlconnection.setUseCaches(false);
			
BufferedReader reader = new BufferedReader(new InputStreamReader(urlconnection.getInputStream()));
...

Dadurch wird der Wunsch geäußert keinen CACHE zu benutzen, ob es aber funktioniert ist durchaus nicht sicher.
 

Jaskur

Mitglied
Vielen Dank für die Antworten, ich werde nun erst einmal ein paar Dinge im Detail durchspielen, dann melde ich mich wieder zu Wort!
 

Jaskur

Mitglied
[QUOTE=""MQue]
Also mit dieser Klasse kann man einiges in diese Richtung feststellen:

CacheUtil (Netx v0.5 JavaDoc)
[/QUOTE]
Ich habe die Klasse jetzt grob überflogen und mein erster Eindruck ist, dass ich damit einen eigenen Cache anlegen und meine Version dann mit der der Ursprungs-URL überprüfen kann. Falls ja ist das leider nicht dass was ich suche, sollte ich dies falsch verstanden habe bitte ich um Korrektur :)

[QUOTE=""mogel]
entweder ?rnd=XXXXXXXX oder &rnd=XXXXXXXXX an die URL hängen ... dabei X jeweils durch gülte Zufallswerte ersetzen[/QUOTE]

Wenn ich an eine URL nun immer den aktuellen timestamp anhänge in Form eines GET Parameters garantiert mir dies, dass ich keine gecachte Version der Webseite erhalte?
Wie sieht es mit Ressourcen wie Bildern aus, müsste ich nicht bei jedem Bild ebenfalls einen Parameter anhängen um sicher zu gehen kein gecachtes Bild zu erhalten?

@Michael und homer65

Ich frage mich nun welches Szenario eintreten muss/kann damit ich eine unerwünschte gecachte Version erhalte und wie wahrscheinlich dies ist

Fragen über Fragen, aber mit der Thematik werde ich mich noch mindestens ein Jahr beschäftigen. Zur Zeit hoffe ich noch dass ich es irgendwie in Java realisiert bekomme :)
 

homer65

Top Contributor
Es kann ja verschiedene Instanzen geben die Cachen.
Der Browser kann cachen.
Es könnte (wie bei uns) ein Proxy mit Cache dazwischensitzen.
Und man weiss nicht welche Netzwerkcomponenten auch cachen.
Wie soll das alles von Java aus beeinflußt werden?
Edit:
Es funktioniert solange ALLE Komponenten mitmachen.
Aber weißt du sicher, ob sich alle daran halten?
Vermutlich, weißt du noch nicht mal wer ALLE eigentlich sind.
 
Zuletzt bearbeitet:

Michael...

Top Contributor
setUseCaches(false) bewirkt, dass im Http Header Cache-control auf no-caches gesetzt wird.
Wenn ich die Http Spezifikation richtig verstanden habe, müssen diese Cache Anweisungen durch sämtliche Proxies und Gateways durchgeroutet werden. Wie sich das in der Praxis auswirkt - keine Ahnung.
 

Jaskur

Mitglied
Um genau diese Fragen geht es mir, darum starte ich zur Zeit einige Schüsse ins Blaue und sammle Informationen.
Negative Informationen sind in meinem Fall auch gute Informationen, für mich!

Sprich ich schau jetzt einfach wie weit ich mit Java komme und zeige dann die Grenzen auf. Vor allem gehts mir ja darum das es möglichst wahrscheinlich ist keine gecachte Version zu erhalten. Eine gewisse Unsicherheit spielt natürlich immer mit.

Edit:
Michael... hat gesagt.:
setUseCaches(false) bewirkt, dass im Http Header Cache-control auf no-caches gesetzt wird.
Wenn ich die Http Spezifikation richtig verstanden habe, müssen diese Cache Anweisungen durch sämtliche Proxies und Gateways durchgeroutet werden. Wie sich das in der Praxis auswirkt - keine Ahnung.
Vielen Dank, mal sehen ob ich ein Praxis taugliches Beispiel auf die Beine stellen kann.
 
M

maki

Gast
Das Problem ist kein Javaproblem und unanhängig von der genutzten Sprache ;)

Mogels Vorschlag ist der vielversprechendste imho.
 
M

maki

Gast
Ja, Michael hatte den "offiziellen" Weg beschrieben, und auch die Einschränkung/Vorraussetzung genannt:
Alle beteiligten (OS, Router, Proxies, etc.) spielen nach den Regeln
 
G

Gast2

Gast
Wenn ich an eine URL nun immer den aktuellen timestamp anhänge in Form eines GET Parameters garantiert mir dies, dass ich keine gecachte Version der Webseite erhalte?
eine Garantie hast Du bei dem Thema nie ... es kommt darauf an wie der Proxy, über den Dein Request stolpert, reagiert

Wie sieht es mit Ressourcen wie Bildern aus, müsste ich nicht bei jedem Bild ebenfalls einen Parameter anhängen um sicher zu gehen kein gecachtes Bild zu erhalten?
ja - daher ein [c]?rnd=...[/c] ... im einfachsten Fall schaut ein Proxy nur ob er die URL schon "besitzt" und liefert dann entsprechend den bei sich gelagerten Content nochmal aus (sofern die Zeit noch nicht abgelaufen ist) ... in dem Moment wo Du einen zufälligen Parameter an die URL hängst, erhälst Du eine völlig neue URL - die der Proxy noch nicht kennt ... damit holt er immer wieder fleißig alles neu vom Server - außer der Proxy "kennt" Deinen Trick ... dann kann das auch schief laufen

ich kenne das HTTP-Protokoll nicht auswendig - reichen müsste auch [c]
setUseCaches(false)[/c] ... allerdings darf der Proxy solche Einstellungen auch einfach ignorieren ... wenn Du beides nutzt sollte es sicherer sein

machen musst Du es, da ein Proxy - auch ohne entsprechende Einstellungen im Browser bzw. Deinem Wissen - im Netzwerk arbeiten kann ... und zwar in dem Moment wo alles über einen Rechner geleitet wird ... war bei der FH wo ich studiert habe am Anfang so ... keine Proxy-Einstellungen vorhanden - aber HTTP-Traffic wurde über einen Proxy geroutet ... hatte den Vorteil Susi-Sorglos in Bruchteilen von ein paar Minuten zu erhalten - sofern man nicht die aktuellste Version brauchte :)
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
8u3631984 Argument Captor liefert NULL zurück Allgemeine Java-Themen 2
DiekleineRatte77 Schlüsselworte ANSI Konverter liefert UTF-8 Allgemeine Java-Themen 7
Arif Math.cos liefert komische Werte Allgemeine Java-Themen 8
I HTML einer Website auslesen liefert nur head Allgemeine Java-Themen 6
A Datentypen Long.valueOf liefert kein "L" am Ende Allgemeine Java-Themen 3
T Variablenübergabe liefert immer null Allgemeine Java-Themen 13
C Object.equals() liefert falschen Wert? Allgemeine Java-Themen 14
Q GregorianCalendar Methode add liefert komische Werte Allgemeine Java-Themen 3
T Datentypen ArrayUtils.indexOf( ... ) liefert -1 obwohl Wert scheinbar enthalten ist Allgemeine Java-Themen 15
T SimpleDateFormat.parse() liefert falschen Tag Allgemeine Java-Themen 2
T java.uil.Random liefert negative Werte Allgemeine Java-Themen 2
I newInstance() liefert null zurück Allgemeine Java-Themen 4
Z new Date() liefert falsche Uhrzeit Allgemeine Java-Themen 12
S Newton-Verfahren liefert nur 1 Wert Allgemeine Java-Themen 3
S HashMap containsKey liefert immer false zurück Allgemeine Java-Themen 15
M Kugelschnittberechnung liefert falsche Werte Allgemeine Java-Themen 4
A md5 liefert unterschiedliche Testsummen? Allgemeine Java-Themen 4
S FOP liefert fehlerhafte PDF Allgemeine Java-Themen 13
S instanceof liefert true, aber cast funktioniert nicht! Allgemeine Java-Themen 6
MasterEvil File.createTempFile liefert nur kurzen Pfad mit Tilde Allgemeine Java-Themen 3
M BufferedReader.read(char[] cbuf) liefert falsche Werte? Allgemeine Java-Themen 4
N contains(.) liefert nicht erwartetes Ergebnis Allgemeine Java-Themen 3
H JNI: loadLibrary liefert UnsatisfiedLinkError Allgemeine Java-Themen 2
J Base64 Kodierung liefert korrupte Dateien Allgemeine Java-Themen 3
S ´Locale.getDefault() liefert en Allgemeine Java-Themen 10
C ImageIO die read-Methode liefert mir ein null- Wert zurück Allgemeine Java-Themen 10
S aFile.delete() liefert false - Gründe ? Allgemeine Java-Themen 2
C EML Email Text in String wandeln Allgemeine Java-Themen 11
OnDemand Java String in Hashmap als Key NULL Allgemeine Java-Themen 27
JAnruVA Datentypen Berechneten String-Wert in Double umwandeln um weiter zu rechnen Allgemeine Java-Themen 7
M String Allgemeine Java-Themen 10
M Suche nach String mit unbekannten characters Allgemeine Java-Themen 53
kodela String kann nicht zu Pfad konvertiert werden Allgemeine Java-Themen 16
melaniemueller Einzelne Zeile aus einer txt Datei in einem String speichern Allgemeine Java-Themen 12
E Objekte in einen String packen und wieder laden Allgemeine Java-Themen 5
M Map<String,String>funktioniert nicht richtig Allgemeine Java-Themen 4
O String in Long Hexerdezimal umwandel Allgemeine Java-Themen 14
N String vergleichen. Allgemeine Java-Themen 27
P String.replace() funktioniert nicht? Allgemeine Java-Themen 3
SaschaMeyer Arbeitet String.split falsch? Allgemeine Java-Themen 4
M Switches ohne String Allgemeine Java-Themen 18
AmsananKING String Iteration Allgemeine Java-Themen 5
S Shuffle String aus if-clause Allgemeine Java-Themen 11
Besset Variablen Ist String = "" + int inordnung? Allgemeine Java-Themen 6
M Map <Long, String> zu Map<String, Long> Allgemeine Java-Themen 9
S String Encoding Verständnisproblem Allgemeine Java-Themen 22
N Prüfen, ob ein String 2x das selbe Zeichen hat Allgemeine Java-Themen 10
SaftigMelo Bug Fixen von String-spliten Allgemeine Java-Themen 8
Monokuma String List nach Zahlen und Worten sortieren Allgemeine Java-Themen 9
Kingamadeus2000 Alle mehrfach vorkommenden Buchstaben rekursiv aus einem String entfernen. Allgemeine Java-Themen 6
YohnsonM String - Aufteilung und Nutzung einzelner Chars Allgemeine Java-Themen 7
O Formatierte String ausgabe bei vier Variablen in einer Zeile Allgemeine Java-Themen 1
S String umbenennen: wie? Allgemeine Java-Themen 4
x46 String Format Fehler Allgemeine Java-Themen 2
S ISO 8601 -> getter / setter String Allgemeine Java-Themen 3
L String zu repräsentativen Wert Allgemeine Java-Themen 0
H Array mit dem Datentype String[] initializieren Allgemeine Java-Themen 7
L ArrayList mit String Arrays in ein Array umwandeln Allgemeine Java-Themen 1
L regex ganzer string? Allgemeine Java-Themen 2
L Ist ein string ein erlaubter variabel name? Allgemeine Java-Themen 2
Z JNA Cpp-DLL String Verwendung Allgemeine Java-Themen 2
A String auf Zahlen überprüfen Allgemeine Java-Themen 5
N String Array Eingabe Allgemeine Java-Themen 6
MiMa Datum von String zu LocalDateTime Allgemeine Java-Themen 8
W String -> byte[] -> String - Sieht jemand was ich nicht sehe? Allgemeine Java-Themen 10
R char aus String entfernen Allgemeine Java-Themen 10
LimDul Mittels Streams aus Strings A B C den String A, B und C machen Allgemeine Java-Themen 12
M Programm erkennt String aus .txt Datei nicht Allgemeine Java-Themen 3
P einen public <Optinal String> in einer anderen Klasse mit einem Int vergleichen Allgemeine Java-Themen 2
S Ini Text aus String parsen Allgemeine Java-Themen 1
T String-Manipulation beim Ablauf in Eclipse und als JAR-File Allgemeine Java-Themen 8
M String lässt sich nicht Zusammenfügen Allgemeine Java-Themen 10
Drachenbauer Wie kann ich das Wort "concrete" in einem String durch ein anderes Wort ersetzen lassen? Allgemeine Java-Themen 5
R Schlüsselworte "Throw new exception" gibt nicht den String als Fehlermeldung aus Allgemeine Java-Themen 2
R Variablen String mit split-Funktion aufteilen Allgemeine Java-Themen 7
F Datei in String-Array einlesen Allgemeine Java-Themen 8
S Marker aus String ermitteln Allgemeine Java-Themen 5
T Objekt mit String und Int aus TxT Datei erstellen Allgemeine Java-Themen 23
M Bei String.format ein Komma statt einem Punkt ausgeben lassen Allgemeine Java-Themen 1
S MSSQL Exception & Connection String Allgemeine Java-Themen 19
B Bei Email: FW / AW... - Hilfe bei String suche Allgemeine Java-Themen 21
J String - Vergleiche Allgemeine Java-Themen 7
K Aus String zwei Jahreszahlen auslesen Allgemeine Java-Themen 18
Drachenbauer Wie kann eine vorgegebene Farbe über einen String erkannt werden? Allgemeine Java-Themen 11
G CSV in String Allgemeine Java-Themen 7
P String-Verschlüsselung - Frage zur Sicherheit Allgemeine Java-Themen 21
K Methodenaufruf mit String / String zu Objekt konvertieren Allgemeine Java-Themen 8
D Erste Schritte Fehler mit negativen und 0 Zahlen im String Allgemeine Java-Themen 6
Xge Replace x Zeichen aus String Allgemeine Java-Themen 2
coolian warum bekomme ich ein string index out of bounds exception Allgemeine Java-Themen 17
F In String 2 Buchstaben vertauschen Allgemeine Java-Themen 2
J Class Decompile als String (Procyon) Allgemeine Java-Themen 2
I Datentypen String in class sicher verwahren Allgemeine Java-Themen 17
J Falls der String ein "X" beinhaltet Allgemeine Java-Themen 2
T String mehrere Worte Allgemeine Java-Themen 2
D String Groß-/Kleinschreibung Allgemeine Java-Themen 2
D String und Klassenvariable Allgemeine Java-Themen 6
Aruetiise Funktion(y = mx+n) in String speichern und berechnen Allgemeine Java-Themen 9
C String in Objektnamen umwandeln Allgemeine Java-Themen 3
E Variablen Aus .txt ausgelesener string mit if() überprüfen? Allgemeine Java-Themen 2

Ähnliche Java Themen

Neue Themen


Oben