Einlesen von HTML-Source

eLogic

Aktives Mitglied
Hey Java-Forum =)

Ich möchte ein Programm schreiben das aus einer Internetseite HTML-Source teile kopiert.

Hier der Code der Site: (wegen der größe habe ich nur das wichtigste gelassen)

Code:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">



[U][I][B]blablablablabla....[/B][/I][/U]



	<table width="90%" border="0" align="center" cellpadding="0" cellspacing="0">
                        <tr align="left">
              <td width="15" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;">01</td>
              <td width="70" height="40" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;"><a href="[B][COLOR="Red"]Cocktopus_-_Rise+FULL-beat-95018.[/COLOR][/B]html"><strong>Cocktopus</strong><br />
                Rise FULL</a></td>
            </tr>
                        <tr align="left">
              <td width="15" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;">02</td>
              <td width="70" height="40" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;"><a href="[COLOR="red"][B]Roxtabeats_-_Latika-beat-94049.[/B][/COLOR]html"><strong>Roxtabeats</strong><br />
                Latika</a></td>
            </tr>
                        <tr align="left">
              <td width="15" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;">03</td>
              <td width="70" height="40" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;"><a href="[COLOR="red"][B]Kinex_-_Vision-beat-94495.html[/B][/COLOR]"><strong>Kinex</strong><br />
                Vision</a></td>
            </tr>
                        <tr align="left">
              <td width="15" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;">04</td>
              <td width="70" height="40" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;"><a href="[COLOR="red"]CosaBeats_-_Free-beat-95471.html[/COLOR]"><strong>CosaBeats</strong><br />
                Free</a></td>
            </tr>
                        <tr align="left">
              <td width="15" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;">05</td>
              <td width="70" height="40" valign="middle" class="xsmallfont" style="border-bottom: 1px solid #AAAAAA;"><a href="[COLOR="red"][B]CreepaBeats_-_Gravity+EP+Snippet-beat-94899.html[/B][/COLOR]"><strong>CreepaBeats</strong><br />
                Gravity EP Snippet</a></td>
            </tr>

[U][I][B]...blablablablabla[/B][/I][/U]

Die Rot markierten Stellen des Codes brauche in in einem String[].
Ist es möglich das in Java umzusetzen?

Der Source ist von "http://www.rappers.in/beats.php", wenn man auf der Seite rechtscklick "Quellcode anzeigen" anklickt.

Vielen Dank für eure wie immer schnelle Antwort.

Schöne Grüße
eLogic
 
T

Tomate_Salat

Gast
nicht ganz einfach. Normal würde ich hier mit Regex nach dem a-Tag filtern. Aber ich wette davon gibt es noch mehr auf der Seite. Allerdings beinhalten alle rot markierten Strings den Part [c]-beat-[/c] u.U. wäre es möglich darüber die gewünschten Strings zu erkennen. Du kennst die Seite besser als wir (wir wahrscheinlich garnicht), wäre das ein zuverlässiger indikator?
 

eLogic

Aktives Mitglied
Könnte man versuchen... =)

Aber wie komme ich überhaupt mit Java an den Quellcode ran?

Man könnte ja nach
Code:
-beat-
suchen und dann jeweils nach rechts und links selektieren bis das
Code:
"
kommt?

Wo soll der Quelltext der Seite denn eingentlich rein? Komplett in einen String?
 
Zuletzt bearbeitet:

AmunRa

Gesperrter Benutzer
Dazu kannst du die Klasse HTMLConnection verwenden.

Dann mit dem Stream den du bekommst die Seite komplett lesen und in einen String speichern.

und diesen String kannst du dann mit Regex parsen
 

eLogic

Aktives Mitglied
Soweit hätte ich das jetz schon mal hinbekommen:

Code:
public String getHtml(String site){
		
		InputStream is = null; 
		String quellcode = null;
		try{ 
			URL url = new URL( site ); 
			is = url.openStream(); 
			quellcode = new Scanner(is).useDelimiter("//html//").next(); 
		} 
		catch ( Exception e ) { 
			e.printStackTrace(); 
		} 
		finally { 
			if ( is != null ) 
				try { is.close(); } catch ( IOException e ) { } 
		} 
		return quellcode;
	}
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
B HTML File einlesen inkl. Bilder? Java Basics - Anfänger-Themen 2
B HTML Datei einlesen und HTML Code in String wandeln Java Basics - Anfänger-Themen 19
Z Input/Output HTML-Seite einlesen Java Basics - Anfänger-Themen 4
H Einlesen von Strings aus html-datei Java Basics - Anfänger-Themen 3
D HTML-Datei einlesen/parsen Java Basics - Anfänger-Themen 9
J Text aus HTML einlesen Java Basics - Anfänger-Themen 3
D HTML Code einlesen und nach Links parsen Java Basics - Anfänger-Themen 10
farbenlos Csv Datei in Java einlesen Java Basics - Anfänger-Themen 18
G JTree speichern und wieder einlesen Java Basics - Anfänger-Themen 5
T Text einlesen code was kommt dahin? Java Basics - Anfänger-Themen 1
S SeriellenPort einlesen Java Basics - Anfänger-Themen 3
I XML einlesen und Objekte bekommen Java Basics - Anfänger-Themen 2
M Daten aus .txt Datei einlesen und weiterverarbeiten Java Basics - Anfänger-Themen 80
julian0507 Wörter einlesen lassen und rückwärts ausgeben Java Basics - Anfänger-Themen 7
S JSON einlesen und benutzen Java Basics - Anfänger-Themen 5
A CSv.Datei einlesen und die werte in zweidemosional Int Array speichern Java Basics - Anfänger-Themen 9
I Ical4j / Kalender einlesen von URL - Fehler: "Unparseable date" Java Basics - Anfänger-Themen 16
Saiko Zeilen einer Datei einlesen Java Basics - Anfänger-Themen 3
sserio Txt Datei einlesen Java Basics - Anfänger-Themen 9
D Strings aus Excel-Datei einlesen Java Basics - Anfänger-Themen 2
julian112 Input/Output .gz bzw. .txt Datei Einlesen und Umgang mit Exceptions Java Basics - Anfänger-Themen 1
M String beim einlesen formatieren Java Basics - Anfänger-Themen 12
P Datei einlesen, nach Begriff filtern und in Datei ausgeben. Problem Standardausgabe über Konsole Java Basics - Anfänger-Themen 19
G JSP Textfeld einlesen Java Basics - Anfänger-Themen 2
M Einlesen > new Leser Java Basics - Anfänger-Themen 5
W Werte durch Konsole einlesen Java Basics - Anfänger-Themen 10
A Array einlesen und ausgeben Java Basics - Anfänger-Themen 13
K Datum einlesen und Tag, Monat und Jahr einzeln ausgeben Java Basics - Anfänger-Themen 1
K Datum einlesen und Tag, Monat und Jahr einzeln ausgeben Java Basics - Anfänger-Themen 1
KogoroMori21 Textdatei einlesen im Array (Selection Sort Algorithmus) Java Basics - Anfänger-Themen 3
S Wort einlesen Array ausgeben Java Basics - Anfänger-Themen 4
I Java String einlesen und auslesen Java Basics - Anfänger-Themen 11
A Input/Output Mehrere Csv-Dateien einlesen Java Basics - Anfänger-Themen 2
S CSV einlesen und mit Komma trennen Java Basics - Anfänger-Themen 12
CptK Richtigen Pfad beim einlesen von Datei finden Java Basics - Anfänger-Themen 2
I Java-Wort einlesen und ausgeben Java Basics - Anfänger-Themen 7
J Csv-Datei einlesen Java Basics - Anfänger-Themen 52
JD_1998 Arrays einlesen, zwischenspeichern und wieder ausgeben Java Basics - Anfänger-Themen 8
L Konstruktor für eine Map-Datei/Map-Datei einlesen Java Basics - Anfänger-Themen 5
L Datein einlesen Java Basics - Anfänger-Themen 1
O zufälliges Wort aus einer Datei einlesen Java Basics - Anfänger-Themen 32
E Input/Output Datei anhand von Dateinamen einlesen Java Basics - Anfänger-Themen 5
C Datei über relative Pfade einlesen Java Basics - Anfänger-Themen 6
A Input/Output Dateien einlesen und ausgeben Java Basics - Anfänger-Themen 7
A Klasse um daten zu einlesen Java Basics - Anfänger-Themen 26
A 2d Arrays aus txt.file einlesen Java Basics - Anfänger-Themen 16
A Textdatei mit stream einlesen Java Basics - Anfänger-Themen 2
P Datei einlesen und zurückgeben Java Basics - Anfänger-Themen 5
G String wird nach Einlesen aus Datei nicht erkannt Java Basics - Anfänger-Themen 3
M String in Scanner einlesen Java Basics - Anfänger-Themen 6
E TXT FILE EINLESEN Java Basics - Anfänger-Themen 4
M Einzelzeichen einlesen Java Basics - Anfänger-Themen 2
C (char) Array einlesen Java Basics - Anfänger-Themen 8
E Mehrere Eingabezeilen gleichzeitig einlesen Java Basics - Anfänger-Themen 7
V Schleife für das Einlesen von Werten für int Variablen, die Bestandteil von Arrays sein sollen Java Basics - Anfänger-Themen 16
I Nur auf Abfrage von einer Text Datei einlesen Java Basics - Anfänger-Themen 11
P Text Datei einlesen und übertragen Java Basics - Anfänger-Themen 15
E Einteilung der Räume mit einlesen einer .txt datei Java Basics - Anfänger-Themen 16
P Array einlesen von Konsole Java Basics - Anfänger-Themen 8
D Eingaben in String Array einlesen Java Basics - Anfänger-Themen 12
B CSV einlesen - Parameter a) encoding b) delimiter Java Basics - Anfänger-Themen 7
R Compiler-Fehler Einlesen von Konsolenparameter funtioniert nichtmehr Java Basics - Anfänger-Themen 4
I OOP Objektnamen über die Konsole richtig einlesen Java Basics - Anfänger-Themen 9
J Einlesen von Datei funktioniert nicht Java Basics - Anfänger-Themen 8
H Einlesen Java Basics - Anfänger-Themen 8
H Einlesen von Zahlen Java Basics - Anfänger-Themen 20
B mehrere Werte mit scanner und while schleife einlesen, max berechnen bzw addieren Java Basics - Anfänger-Themen 2
CptK Datentypen Text Dateien einlesen Java Basics - Anfänger-Themen 3
A Datentypen Unterschiedliche Datentypen in einer Eingabe einlesen Java Basics - Anfänger-Themen 2
R txt Einlesen und Verarbeiten Java Basics - Anfänger-Themen 15
M Erste Schritte CSV-File einlesen und Daten verarbeiten Java Basics - Anfänger-Themen 5
M Datei einlesen mit Scanner funktioniert nicht (FileNotFoundException) Java Basics - Anfänger-Themen 6
K Sonderzeichen einlesen Java Basics - Anfänger-Themen 3
L Input/Output XML Datei einlesen (JAXB?) Java Basics - Anfänger-Themen 10
F Zahlen aus Datei einlesen und in Array speichern Java Basics - Anfänger-Themen 2
I Datei einlesen Java Basics - Anfänger-Themen 11
J Best Practice [Code Verbesserung] TXT einlesen und in Arrayliste speichern Java Basics - Anfänger-Themen 5
A Ungeordnetes Array ordnen, Zahl einlesen und einordnen Java Basics - Anfänger-Themen 23
R Erste Schritte Sicheres einlesen eines Strings Java Basics - Anfänger-Themen 2
MaximilianTM Input/Output Einlesen und bearbeiten einer text Datei / Zeile Java Basics - Anfänger-Themen 5
C Erste Schritte Regex - Datei einlesen und splitten Java Basics - Anfänger-Themen 4
T Input/Output Einlesen eines .txt Files nur bei gesetztem Breakpoint möglich Java Basics - Anfänger-Themen 1
L RSA Public Key einlesen Java Basics - Anfänger-Themen 0
K Datei aus unbekannten Speicherorten einlesen Java Basics - Anfänger-Themen 1
T Datei in Array einlesen "null" Java Basics - Anfänger-Themen 8
U Daten aus Datei einlesen Java Basics - Anfänger-Themen 4
J Auslesen/speichern und wieder einlesen Java Basics - Anfänger-Themen 7
N Datei Zeilenweise einlesen, Ausgabe mehrere Arrays Java Basics - Anfänger-Themen 7
B Excel File einlesen und Überschrift prüfen Java Basics - Anfänger-Themen 8
M Einlesen von Integerwertern aus einer CSV Java Basics - Anfänger-Themen 8
? Methoden Boolean Wert vergleichen und einlesen Java Basics - Anfänger-Themen 1
K String einlesen und als Variable speichern Java Basics - Anfänger-Themen 8
K .txt einlesen und in ein Array packen Java Basics - Anfänger-Themen 2
M Erste Schritte Zahlen einlesen und auswerten Java Basics - Anfänger-Themen 6
N Best Practice CSV einlesen - Variables Array?! Java Basics - Anfänger-Themen 8
O Klassen Objektnamen für Methodenaufrauf einlesen lassen Java Basics - Anfänger-Themen 2
D Array Werte einlesen und ausgeben? Java Basics - Anfänger-Themen 8
C Java Scanner einlesen von txt Dokument InputMismatch Java Basics - Anfänger-Themen 9
V Hilfe zum Thema einlesen eines Datums Java Basics - Anfänger-Themen 5
E Erste Schritte txt.Datei mit BufferedReader einlesen und in 2D-Array abspeichern Java Basics - Anfänger-Themen 15

Ähnliche Java Themen

Neue Themen


Oben