HTML-Datei einlesen/parsen

Status
Nicht offen für weitere Antworten.
D

davidek

Gast
Hi, Leute!

Ich habe eine kurze Frage.

Ich habe vor ein HTML-Dokument einzulesen. Parsen heißt das, glaub' ich.
Ich glaube das spielt keine Rolle, aber ich habe die Datei nicht lokal verfügbar, sondern sie ist "im Internet" (Ihr wisst schon was ich meine...).

Ich habe schon viel darüber recherchiert und habe herausgefunden, das es dafür sehr sehr viele Klassen und Möglichkeiten gibt, wie man das anstellen kann.

Ich habe gute Kenntnisse über HTML und CSS. (Glaube ich jedenfalls.)
Ich bin Anfänger in Java-Programmierung, also sollte das System einfach zu handhaben sein.
Ich will auch erstmal noch nicht großartig die ganzen verschiedenen Elemente unterscheiden.

Für den Anfang würde es mir eigentlich reichen, dass ich einfach den ganzen Text vom HTML-Body, also alles was zwischen <body> und </body> steht, außer die wiederum untergeordneten Tags, in einen String bekomme.
Später will ich dann noch ein bischen zwischen den anderen Tags unterscheiden...

Welche Klasse/welches System könnt ihr mir unter Beachtung der oben genannten Sachen empfehlen?


Ich bin für jede Antwort dankbar :D

MfG
davidek
 

EOB

Top Contributor
hi, also sooo einfach wird das sicher nicht. ich poste hier mal den code zum einlesen einer datei in einen string.

Code:
public class Test {
    public static void main(String[] args) {
	try {
	    // Create a URL for the desired page
	    URL url = new URL("http://...../index.htm");

	    
	    BufferedReader in = new BufferedReader(new InputStreamReader(url.openStream()));
	    String str;
	    String s = "";

	    while ((str = in.readLine()) != null) {
		s += (str + "\n");

	    }
	    in.close();

	    System.out.println(s);
	} catch (MalformedURLException e) {
	} catch (IOException e) {
	}
    }
}

am ende steht der gesamte in halt in s. eben ein string, dann musst du darauf die regexe anwenden.

viele gruesse
 
D

davidek

Gast
Danke für die Antwort.

Deine Methode ist jetzt die Variante, wenn mal alles selber machen würde.

Aber es gibt doch sicherlich auch schon Klassen die extra für das Einlesen von HTML-Dateien sind.
Es gibt doch sogar in der Standard-Bibliothek schon den Swing HTML Parser.

Ich will nicht alles von Grund auf selber schreiben. (Ich kenne schon den Begriff Kapselung :### :D .)
 
G

Guest

Gast
Hallo, genau der thread den ich suche...
ich bin allerdings nicht ganz so bewandert im java programmieren.
ich möchte eine als Text-Datei generierte durch Semikolon getrennte Datenreihe (Temperatur aussen, innen, Luftdruck etc.) einlesen und die Einzelwerte auf meiner Wetterseite darstellen.
Die Text(Datendatei) soll alle 10 min auf den Server geladen werden und sobald man die Seite aufruft die aktuellen Werte eingelesen werden...
klingt kompliziert, ich weiß
Daten sehen so aus:
20.8;12.5;1028,5 etc.
Für jede Hilfe dankbar (leider habe ich kein PHP seitens meines providers...,daher in Java)
Matthias
 

FatFire

Bekanntes Mitglied
Gast hat gesagt.:
Hallo, genau der thread den ich suche...
Hm...wenn ich mir das Problem anschaue...nein, eigentlich geht es um was völlig anderes...
ich bin allerdings nicht ganz so bewandert im java programmieren.
Macht nix, dafür sind wir ja da.
ich möchte eine als Text-Datei generierte durch Semikolon getrennte Datenreihe (Temperatur aussen, innen, Luftdruck etc.) einlesen und die Einzelwerte auf meiner Wetterseite darstellen.
Die Text(Datendatei) soll alle 10 min auf den Server geladen werden und sobald man die Seite aufruft die aktuellen Werte eingelesen werden...
klingt kompliziert, ich weiß
Daten sehen so aus:
20.8;12.5;1028,5 etc.
Für jede Hilfe dankbar (leider habe ich kein PHP seitens meines providers...,daher in Java)
Matthias
Also, wie willst Du das jetzt mit Java machen? Als Applet? Anders wohl nicht, denn wenn Dein Provider kein PHP unterstützt, wird er wohl kaum JSP oder sowas unterstützen...wenn Du sowieso alle 10 min eine Textdatei rauflädst...warum dann nicht gleich ein aktualisiertes HTML-Dokument? Oder wie wär es mit JavaScript und XMLHttpRequest? Dann kann auch die Textdatei und HTML-Datei fix bleiben...das zusammenbasteln der Seite übernimmt dann JavaScript...ein bißchen mehr Randinformationen, wie Du es überhaupt realisieren willst, wäre schön.
 
D

davidek

Gast
Was ist denn das Ziel dieses Parsens?
Also was genau hast du denn vor?

Ich Programmiere gerade Internetzugang für einen Graphik-fähigen Taschenrechner (so ein ding was auch kurven zeichnen kann, kennt vllt mancher auser schule...).
Ich will den text der internet seite einlesen, dann werden die einzelnen buchstaben in zahlen umgewandelt und in ein array gepackt, das dann an den taschenrechner gesendet wird.

um den ganzen rest habe ich mir schon meine sorgen gemacht. ich brauch nur den den zugriff auf die html-files.
 
G

Guest

Gast
Hallo, FatFire, danke für die Antwort. Ja anders als mit einem applet gehts wohl nicht.
Das Heraufladen soll natürlich automatisch laufen...(direkt von der Wetterstation) und die kann kein html...sondern nur textfiles erzeugen. aussehen soll das Ganze mal so, allerdings nicht über einen "Umweg"-Server erzeugt, sondern selbst
www.greiner-petter.de/html/wetter2.html

Matthias
 

FatFire

Bekanntes Mitglied
@Gast: Wäre natürlich schon besser, wenn Du jetzt ein konkretes Problem hättest. Also wenn Du schon etwas Code zum Zeigen hättest, wo dann zu sagen wäre "da und da hab ich das und das Problem". Ansonsten würde das Ganze schon eher einer Auftragsarbeit nahekommen, die man sich ja normal nicht umsonst gut bezahlen lässt :wink: Hast Du also schon damit angefangen oder bisher nur die Projektidee aber noch nichts konkretes fertig?
 

JAVAn00b

Bekanntes Mitglied
hi,

versuch mal JEditorPane...

dem kannst du sagen was das für ein text ist. dann brauchst du keine semikolon oder so. denn er zeigt das wie word an.

MFG
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
B HTML Datei einlesen und HTML Code in String wandeln Java Basics - Anfänger-Themen 19
H Einlesen von Strings aus html-datei Java Basics - Anfänger-Themen 3
S Text aus einer HTML Datei auslesen Java Basics - Anfänger-Themen 1
krgewb Input/Output Umlaute in generierter HTML-Datei Java Basics - Anfänger-Themen 7
F HTML Datei in .jar speichern und abändern Java Basics - Anfänger-Themen 2
I jar-Datei in HTML einbinden Java Basics - Anfänger-Themen 6
J Methode um eine HTML-Datei zu öffnen Java Basics - Anfänger-Themen 10
A HTML-Code auslesen und mit einem Wert in der property-Datei vergleichen Java Basics - Anfänger-Themen 2
P Java Object das eine HTML Datei repräsentiert Java Basics - Anfänger-Themen 19
C einfacher Link zu *.html Datei möglich? Java Basics - Anfänger-Themen 4
3 Eine HTML Datei in eine Java Datei umschreiben Java Basics - Anfänger-Themen 23
M Frage zum Aufruf eines Applets aus einer HTML - Datei Java Basics - Anfänger-Themen 3
I CSV Datei auf HTML Seite hochladen und in DB laden Java Basics - Anfänger-Themen 9
S Text aus HTML Datei in TXT Datei Java Basics - Anfänger-Themen 19
Ollek Bestimmte Zeilen aus einer HTML Datei lesen Java Basics - Anfänger-Themen 8
Developer_X HTML Datei nicht von Java Lesbar Java Basics - Anfänger-Themen 8
M html datei drucken Java Basics - Anfänger-Themen 18
M HTML Datei bearbeiten Java Basics - Anfänger-Themen 14
M HTML Datei als Text rausspeichern Java Basics - Anfänger-Themen 3
C Erstellen und Beschreiben einer HTML-Datei Java Basics - Anfänger-Themen 4
G JEditorPane - HTML Datei übergeben? Java Basics - Anfänger-Themen 3
Semox Umwandlung von Sonderzeichen in HTML-Datei mit Ausgabe Java Basics - Anfänger-Themen 7
T Ausgeben von einer php/html Datei in Java Java Basics - Anfänger-Themen 5
G Hilfer zur einer Anwendung soll HTML Datei öffnen Java Basics - Anfänger-Themen 4
E HTML-Datei im Javaprojekt anzeigen lassen Java Basics - Anfänger-Themen 7
D Komfortabel HTML - Datei schreiben Java Basics - Anfänger-Themen 2
T HTML-Datei ausgeben Java Basics - Anfänger-Themen 2
N html-datei auslesen Java Basics - Anfänger-Themen 12
G html datei + Klassen in eine jar datei stecken? Java Basics - Anfänger-Themen 3
T HTML Datei im Browser laden Java Basics - Anfänger-Themen 8
T Eine HTML Datei mit Java bear. Wie soll kann man anfangen? Java Basics - Anfänger-Themen 11
E HTML Datei drucken Java Basics - Anfänger-Themen 4
B Ausgabe in bestimmte Zeile einer html Datei Java Basics - Anfänger-Themen 12
D Html-Datei auf Festplatte öffnen Java Basics - Anfänger-Themen 4
4 HTML-Datei öffnen Java Basics - Anfänger-Themen 7
G .doc-Datei in HTML umwandeln und als Popup einbinden Java Basics - Anfänger-Themen 5
W HTML Datei aus Applet in neuem Browserfenster öffnen Java Basics - Anfänger-Themen 5
W Javadoc HTML erzeugen mit allen dependency Java Basics - Anfänger-Themen 11
M html-seite drucken (gerendert) Java Basics - Anfänger-Themen 3
I HTML Code säubern Java Basics - Anfänger-Themen 4
B HTML File einlesen inkl. Bilder? Java Basics - Anfänger-Themen 2
B HTML Code in XML speichern Java Basics - Anfänger-Themen 3
B HTML Code / Seite auslesen und JAVA Objekte erstellen Java Basics - Anfänger-Themen 12
K Erstes kleines Spieleprojekt - Java GUI in HTML einbinden Java Basics - Anfänger-Themen 3
B String nach HTML formatieren Java Basics - Anfänger-Themen 9
S HTML-Quelltext hinter HTTPS Java Basics - Anfänger-Themen 1
J Input/Output Input Buttons Html mit JSP Java Basics - Anfänger-Themen 3
E HTML in Java einbinden oder JavaScript? Java Basics - Anfänger-Themen 5
D Mit Java HTML bzw Javascript auslesen Java Basics - Anfänger-Themen 1
G Servlet - externe HTML (URL) auslesen Java Basics - Anfänger-Themen 1
N Status-Log - HTML Java Basics - Anfänger-Themen 12
C Methoden Welche JSoup Methoden Und Parameter für diese HTML Tags Java Basics - Anfänger-Themen 4
I Meta Tags vergleichen mit Html Vorgabe Java Basics - Anfänger-Themen 8
B HTML Code drucken Java Basics - Anfänger-Themen 4
D HTML Manipulation Navigation Java Basics - Anfänger-Themen 1
Z Html Element aus der Webseite auslesen Java Basics - Anfänger-Themen 1
D Erste Schritte HTML aus JEditorPane drucken Java Basics - Anfänger-Themen 5
M Fragen zum Auslesen von HTML Seiten Java Basics - Anfänger-Themen 5
M Java und Html Java Basics - Anfänger-Themen 4
I HTML Code in Bild (transparent) konvertieren Java Basics - Anfänger-Themen 0
I Watermark erstellen mit HTML in Bild? Java Basics - Anfänger-Themen 7
T Ausgabe in HTML :( Java Basics - Anfänger-Themen 19
S mit Java HTML Button drücken "lassen" Java Basics - Anfänger-Themen 8
M Erste Schritte Java Applet - HTML Seiten auslesen und in Access Datenbank schreiben? Java Basics - Anfänger-Themen 15
T HTML-Inputbox ansteuern Java Basics - Anfänger-Themen 4
I HTML Tabelle nur so lange erzeugen bis Höhe erreicht Java Basics - Anfänger-Themen 9
I HTML in String wandeln? Java Basics - Anfänger-Themen 1
D javacode durch Html ausfuehren Java Basics - Anfänger-Themen 13
W HTML Code, Umlaute werden nicht richtig dargestellt Java Basics - Anfänger-Themen 7
C Html in einem JEditorPane anzeigen Java Basics - Anfänger-Themen 2
O HTML -> BBCode Parser? Java Basics - Anfänger-Themen 3
O Methode in andere Klasse verlegt, "auslesen" einer HTML Seite verschnellert - Problem. Java Basics - Anfänger-Themen 4
V Umlaute beim Parsen einer HTML Seite Java Basics - Anfänger-Themen 4
C Java Applet in html. Pong - old school Spiel Java Basics - Anfänger-Themen 10
H Schnell HTML-Tags finden Java Basics - Anfänger-Themen 5
H Welcher Html-Parser? Java Basics - Anfänger-Themen 8
G Probleme beim HTML auslesen Java Basics - Anfänger-Themen 6
J Html zugriff - POST Request/Response Java Basics - Anfänger-Themen 4
Z Input/Output HTML-Seite einlesen Java Basics - Anfänger-Themen 4
H Interface JTextPane html formatiert kopieren Java Basics - Anfänger-Themen 2
L Applet soll Html-File öffnen Java Basics - Anfänger-Themen 2
L NetBeans Applet in html Java Basics - Anfänger-Themen 4
H Java Server/Client, HTML Seite anzeigen Java Basics - Anfänger-Themen 2
D Wie den HTML-Teil des Chat Tutorials aus dem FAQ-Bereich starten? Java Basics - Anfänger-Themen 5
C Link wie bei HTML Java Basics - Anfänger-Themen 7
F Methoden replaceAll (regex) HTML Java Basics - Anfänger-Themen 3
M Mit Java eine HTML-Seite speichern Java Basics - Anfänger-Themen 11
C Java in HTML einbinden Java Basics - Anfänger-Themen 2
N Website HTML mit JavaScript abrufen Java Basics - Anfänger-Themen 9
R JSON - Ausgabe als HTML mit gson Java Basics - Anfänger-Themen 6
R Suche Regex Ausdruck für HTML Java Basics - Anfänger-Themen 11
A JEditorPane + html -> java.io.IOException: invalid url Java Basics - Anfänger-Themen 4
S Lightbox Script vs. Taco HTML Script Java Basics - Anfänger-Themen 4
R Pattern bzw. Regex HTML-Code Java Basics - Anfänger-Themen 10
S String mit ASCII/HTML Zeichen darstellen Java Basics - Anfänger-Themen 10
S HTML Regularer Expression Java Basics - Anfänger-Themen 20
S regulärer Ausdruck HTML Java Basics - Anfänger-Themen 5
D Html Formular auswerten Java Basics - Anfänger-Themen 8
eLogic Einlesen von HTML-Source Java Basics - Anfänger-Themen 6
turmaline Ein regulärer Ausdruck für HTML-Sonderzeichen Java Basics - Anfänger-Themen 3

Ähnliche Java Themen

Neue Themen


Oben