Exception bei "vorselektiertem" HTML

Status
Nicht offen für weitere Antworten.

juro

Mitglied
Hi,
Ich parse eine HTML Datei für ein bestimmtes Teilstück und speicher dann diese Daten in Objekte ab. Das Abspeichern funktioniert gut, nur leider kann der Parser mit meinem Teilstück nichts anfangen. Und zwar wirft mir der Parser folgende Exception:

MalformedURLException: no protocol: <table cellspacing="0" cellpadding="2" border="0"......</tab..>
Wenn ich genau das Teilstück in eine Datei speicher und diese dann einlese, gibt es kein Problem. Was übersehe ich denn?

lg
juro

Code:
public static void parseTournaments() {
		//	I shall parse the html fragment as a xml file
		String _calender = "";
		XMLParser _parser = new XMLParser();
		try {
			URL _url = new URL("http://www.volleynet.at/volleynet/index.php?screen=Beach/Turnier/Liste&show_prev=1&show_next=1");
		
			BufferedReader _in = new BufferedReader(new InputStreamReader(_url.openStream()));
			
			String _line;
			
			while ((_line = _in.readLine()) != null) {
				if (_line.contains("tablehead")) {
					_calender += _line;
					break;
				}
			}
			_in.close();
		} catch (MalformedURLException _ex) {
			System.out.println("MalformedURLException! " + _ex);
		} catch (Exception _ex) {
			System.out.println("Some other Exception");
		}
		
//		System.out.println("<?xml version='1.0' encoding='utf-8'?>\n" + _calender);
		_calender = _calender.replaceAll("&", "");
		_calender = _calender.replaceAll("
", "");
		//_calender = _calender.replaceAll("index.php\\?screen=Beach/Turnier/Detail&detail_bew_id=", "");
		//_calender = _calender.replaceAll("&PHPSESSID", "");
		_calender = _calender.replaceAll("<img src[^>]*>", "");
		_calender = _calender.replaceAll("&", "+");
		_calender = _calender.replaceAll("", "");
		
		// System.out.println(_calender);
		
		_parser.setXMLString(_calender);
		_parser.parseXML(0);
		setTournaments(_parser.getTournaments());
	}
 

juro

Mitglied
Code:
package data;

import java.net.MalformedURLException;
import java.util.HashMap;
import org.xml.sax.*;
import org.xml.sax.helpers.*;

public class XMLParser {
	private String  xmlString = "";
	private HashMap tournaments;
	
	public void setXMLString(String _string) {
		this.xmlString = _string;
	}
	public void setTournaments (HashMap _tournaments) {
		this.tournaments = _tournaments;
	}
	
	public String getXMLString () {
		return this.xmlString;
	}
	public HashMap getTournaments () {
		return this.tournaments;
	}
	
	public XMLParser() {
		
	}
	
	public XMLParser(String _string) {
		this.setXMLString(_string);
	}
	
	public void parseXML(int _type) {
		SAXCalender _saxCalender = new SAXCalender();
		try {
			XMLReader _reader = XMLReaderFactory.createXMLReader();
			
			_reader.setContentHandler(_saxCalender);
			_reader.parse(new InputSource(this.getXMLString()));
			//_reader.parse(new org.xml.sax.InputSource("MyXmlFile.xml"));
			setTournaments(_saxCalender.getTournaments());
		} catch (MalformedURLException _ex) {
			System.out.println("MalformedURLException: " + _ex.getMessage());
		} catch (Exception _ex) {
			System.out.println("Exception: " + _ex.getMessage());
		}
	}
	
}
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
M XML Stream Exception abfangen XML & JSON 10
K Exception bei getElementText XML & JSON 4
M JDOM parse Exception XML & JSON 3
B JAXB und HTML XML & JSON 1
T HTML mit Hilfe Jsoup einlesen XML & JSON 11
C javascript in .html Funktioniert, in .xhtml nicht mehr XML & JSON 0
M parsen von realen HTML-WEB-Seiten XML & JSON 1
P HTML XPath XML & JSON 1
K Einlesen eines Parameters aus HTML-Datei XML & JSON 4
1 Html tabelle auslesen??? XML & JSON 6
Airwolf89 HTML Datei mit SAXBuilder laden hängt sich auf XML & JSON 4
K docBook XSLT: HTML Code Snippet in Erzeugte HTML Dokument einfügen XML & JSON 9
D Wie XML Datei einlesen und HTML entities übernehmen? XML & JSON 3
R Problem bei: XML und XSL zu HTML XML & JSON 2
T Möchte JSP Code in Attribut eines HTML Tags hinein generieren XML & JSON 3
slawaweis XML Prettyprinter zu HTML XML & JSON 3
S Typsicherer HTML-Parser XML & JSON 5
S HTML Parser XML & JSON 2
F Probleme beim html parsen mit tagsoup XML & JSON 4
M HTML Quellcode verarbeiten XML & JSON 4
J DOM zu HTML XML & JSON 3
S DOM Parsen Problem mit HTML Sonderzeichen XML & JSON 4
A aus xml --> html Problem XML & JSON 3
M HTML-Entities XML & JSON 4
M Suche HTML-API XML & JSON 3
G Servlet mittels XSL in HTML konvertieren XML & JSON 5
K html -> cyberneko -> xml -> jdom . XML & JSON 3
S HTML mit dom4j parsen? XML & JSON 2
M TextContent eines XML-Elements enthält HTML-Tags . was nun XML & JSON 2
L mit Java eine HTML-Datei erstellen XML & JSON 3
B html->xslfo->pdf XML & JSON 5
G HTML in PDF umwandeln XML & JSON 9
P HTML Seite Parsen, und bestimmten Text extrahieren XML & JSON 3
C HTML-Befehle per Java entfernen XML & JSON 7
P HTML-Sting in JDOM XML & JSON 7
G HTML -> XML XML & JSON 2
A html-File nach txt-File konvertieren XML & JSON 15
F XML Datei als HTML? XML & JSON 4
flashfactor HTML in XML XML & JSON 3
FsMarine HTML to PDF Konventieren XML & JSON 6
P HTML mit JDOM erstellen und in JEditorPane zeigen XML & JSON 4
B JDom + HTML XML & JSON 2
B DOM oder HTML File drucken "wie ein Browser es zeigen w XML & JSON 3

Ähnliche Java Themen

Neue Themen


Oben