HTML mit num. Unicode Notation (was:Probleme bei Encoding)

Status
Nicht offen für weitere Antworten.

sisko78

Bekanntes Mitglied
Hallo,

habe hier einen String und würde den gerne so umwandeln, dass die darin enthaltene Unicode Dezimal Nr. &-#8211 (ohne das -) in das entsprechende Zeichen (-) umgewandelt wird, habs aber leider nicht hinbekommen.
Habe mit dem String Konstruktor
String(byte[] bytes, String charsetName) (+ Methode getBytes)
rumprobiert, aber ohne erfolg.

Vielleicht hat mir von euch jemand einen Tip.
Danke schonmal.

Christian
 

Bleiglanz

Gesperrter Benutzer
Hä?

"Du hast den String" - dann hast du ihn ja, es gibt da nichts umzuwandeln!

"Du hast eine Datei mit ASCII / irgendwas in irgendeinem Encoding" => dann nimm einen Reader mit entsprechendem Charset
 

sisko78

Bekanntes Mitglied
Konkret lese ich ein Feld in einer Mysql Datenbank aus. Dieses wird in einem String gespeichert. Leider werden aber bestimmte Zeichen nicht richtig dargestellt. Z.b.:
'''Google''' is a [[United States|U.S.]]&(*)#8211;based........
Und ich weiss nicht, wie ich den Text umwandeln soll. Das Forum wandelts übrigens automatische um wenn ich (*) weglasse ('''Google''' is a [[United States|U.S.]]–based)

Gruß
Christian
 

Bleiglanz

Gesperrter Benutzer
wie ist der denn in die DB reingekommen?

beachte das Encoding deiner Datenbank, wenn du auf einer Resultsetzeile die Methode getString() aufrufst

Warum soll – da drin stehen? kommt das aus HTML??

in Java ist die richtige Maskierung \uXXXX! Java versteht keine HTML/XML entities!!!
 

sisko78

Bekanntes Mitglied
Schonmal ein Dankeschön für deine Mühe, mir zu helfen.

Ja, ich glaube das hat was mit HTML zu tun, ich war wohl völlig auf dem falschen Dampfer. Habe die Überschrift mal ein wenig abgewandelt, hoffe, dass es jetzt besser passt.
Das abgefragte Feld in der Datenbank enthält teilweise HTML Code.
Wenn ich in einer JEditorPane den entsprechenden Code anzeigen lasse, wird der richtig angezeigt.
Jetzt stellt sich mir nur die frage, wie ich das sozusagen in reinen Text umwandle, hab irgendwie noch nirgends Hinweise gefunden, die über das Entfernen/Umwandeln von Html-Tags hinausgehen.

Es handelt sich übrigens um ein englisches Wikipedia "raw dump sql file", das so zum download angeboten wurde.

Wenn mir sonst keine Lösung einfällt, werde ich mir wohl eine Tabelle zur Hand nehmen und die betreffenden Teile wohl einfach durch die entsprechenden Zeichen ersetzen, wobei mir das allerdings nicht besonders zusagt.

Gruß
Christian
 

Wildcard

Top Contributor
sisko78 hat gesagt.:
Wenn ich in einer JEditorPane den entsprechenden Code anzeigen lasse, wird der richtig angezeigt.
Jetzt mal eine ganz dumme Idee:
Wenn du denn Text in eine unsichtbare JEditorPane setzt. Den ganzen Text markierst und rauskopierst, hättest du dir eine Menge Arbeit gespart.
Ziemlich dirty, aber... :D
 

sisko78

Bekanntes Mitglied
Ja, das reicht aber leider nicht. Ich will einzelne schnippsel aus der Datenbank weiter verarbeiten und da sollten solche Sachen schon bereinigt sein. Hab jetzt mal folgendes gemacht:

Code:
class TextFromHtml extends HTMLEditorKit.ParserCallback{

  public void handleText(char[] data, int pos){
      System.out.println(new String(data));  //you can redirect to a file
  }}

Code:
try{
    Reader r = new StringReader("wikipediaText");
    ParserDelegator parser = new ParserDelegator();
    HTMLEditorKit.ParserCallback callback = new TextFromHtml();
    parser.parse(r, callback, false);
    parser.toString();  
     }
    catch (IOException e){
    e.printStackTrace();}

Damit bekomme ich die Tags raus und ich hoffe, dass auch richtig umgewandelt wird, JBuilder zeigt mir bei bestimmten Codes Fragezeichen an, ich hoffe mal, dass es daran liegt, dass mein Zeichensatz für die Anzeige nicht mehr anzeigen kann und das ganze intern richtig verarbeitet wird. (kann auch keine umlaute oder z.b. ^ verwenden )
 

sisko78

Bekanntes Mitglied
Achso, hab dich erst falsch verstanden, @wildcard. Werde das vielleicht mal versuchen. Hab vorhin zwar mal schon einmal mit ein paar Methoden aus JEditorPane rumgespielt, da hats aber irgendwie nicht geklappt.

Gruß
Christian
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
D Unicode in Html Java Basics - Anfänger-Themen 4
S HTML Sonderzeichen in Unicode wandeln Java Basics - Anfänger-Themen 5
W Javadoc HTML erzeugen mit allen dependency Java Basics - Anfänger-Themen 11
M html-seite drucken (gerendert) Java Basics - Anfänger-Themen 3
I HTML Code säubern Java Basics - Anfänger-Themen 4
B HTML File einlesen inkl. Bilder? Java Basics - Anfänger-Themen 2
B HTML Datei einlesen und HTML Code in String wandeln Java Basics - Anfänger-Themen 19
B HTML Code in XML speichern Java Basics - Anfänger-Themen 3
B HTML Code / Seite auslesen und JAVA Objekte erstellen Java Basics - Anfänger-Themen 12
K Erstes kleines Spieleprojekt - Java GUI in HTML einbinden Java Basics - Anfänger-Themen 3
B String nach HTML formatieren Java Basics - Anfänger-Themen 9
S HTML-Quelltext hinter HTTPS Java Basics - Anfänger-Themen 1
J Input/Output Input Buttons Html mit JSP Java Basics - Anfänger-Themen 3
E HTML in Java einbinden oder JavaScript? Java Basics - Anfänger-Themen 5
D Mit Java HTML bzw Javascript auslesen Java Basics - Anfänger-Themen 1
G Servlet - externe HTML (URL) auslesen Java Basics - Anfänger-Themen 1
S Text aus einer HTML Datei auslesen Java Basics - Anfänger-Themen 1
krgewb Input/Output Umlaute in generierter HTML-Datei Java Basics - Anfänger-Themen 7
N Status-Log - HTML Java Basics - Anfänger-Themen 12
C Methoden Welche JSoup Methoden Und Parameter für diese HTML Tags Java Basics - Anfänger-Themen 4
I Meta Tags vergleichen mit Html Vorgabe Java Basics - Anfänger-Themen 8
B HTML Code drucken Java Basics - Anfänger-Themen 4
D HTML Manipulation Navigation Java Basics - Anfänger-Themen 1
Z Html Element aus der Webseite auslesen Java Basics - Anfänger-Themen 1
D Erste Schritte HTML aus JEditorPane drucken Java Basics - Anfänger-Themen 5
M Fragen zum Auslesen von HTML Seiten Java Basics - Anfänger-Themen 5
M Java und Html Java Basics - Anfänger-Themen 4
I HTML Code in Bild (transparent) konvertieren Java Basics - Anfänger-Themen 0
I Watermark erstellen mit HTML in Bild? Java Basics - Anfänger-Themen 7
T Ausgabe in HTML :( Java Basics - Anfänger-Themen 19
F HTML Datei in .jar speichern und abändern Java Basics - Anfänger-Themen 2
S mit Java HTML Button drücken "lassen" Java Basics - Anfänger-Themen 8
M Erste Schritte Java Applet - HTML Seiten auslesen und in Access Datenbank schreiben? Java Basics - Anfänger-Themen 15
T HTML-Inputbox ansteuern Java Basics - Anfänger-Themen 4
I HTML Tabelle nur so lange erzeugen bis Höhe erreicht Java Basics - Anfänger-Themen 9
I HTML in String wandeln? Java Basics - Anfänger-Themen 1
D javacode durch Html ausfuehren Java Basics - Anfänger-Themen 13
W HTML Code, Umlaute werden nicht richtig dargestellt Java Basics - Anfänger-Themen 7
C Html in einem JEditorPane anzeigen Java Basics - Anfänger-Themen 2
I jar-Datei in HTML einbinden Java Basics - Anfänger-Themen 6
O HTML -> BBCode Parser? Java Basics - Anfänger-Themen 3
O Methode in andere Klasse verlegt, "auslesen" einer HTML Seite verschnellert - Problem. Java Basics - Anfänger-Themen 4
V Umlaute beim Parsen einer HTML Seite Java Basics - Anfänger-Themen 4
C Java Applet in html. Pong - old school Spiel Java Basics - Anfänger-Themen 10
J Methode um eine HTML-Datei zu öffnen Java Basics - Anfänger-Themen 10
H Schnell HTML-Tags finden Java Basics - Anfänger-Themen 5
H Welcher Html-Parser? Java Basics - Anfänger-Themen 8
G Probleme beim HTML auslesen Java Basics - Anfänger-Themen 6
J Html zugriff - POST Request/Response Java Basics - Anfänger-Themen 4
A HTML-Code auslesen und mit einem Wert in der property-Datei vergleichen Java Basics - Anfänger-Themen 2
Z Input/Output HTML-Seite einlesen Java Basics - Anfänger-Themen 4
H Interface JTextPane html formatiert kopieren Java Basics - Anfänger-Themen 2
L Applet soll Html-File öffnen Java Basics - Anfänger-Themen 2
L NetBeans Applet in html Java Basics - Anfänger-Themen 4
H Java Server/Client, HTML Seite anzeigen Java Basics - Anfänger-Themen 2
D Wie den HTML-Teil des Chat Tutorials aus dem FAQ-Bereich starten? Java Basics - Anfänger-Themen 5
C Link wie bei HTML Java Basics - Anfänger-Themen 7
F Methoden replaceAll (regex) HTML Java Basics - Anfänger-Themen 3
M Mit Java eine HTML-Seite speichern Java Basics - Anfänger-Themen 11
C Java in HTML einbinden Java Basics - Anfänger-Themen 2
N Website HTML mit JavaScript abrufen Java Basics - Anfänger-Themen 9
R JSON - Ausgabe als HTML mit gson Java Basics - Anfänger-Themen 6
R Suche Regex Ausdruck für HTML Java Basics - Anfänger-Themen 11
A JEditorPane + html -> java.io.IOException: invalid url Java Basics - Anfänger-Themen 4
S Lightbox Script vs. Taco HTML Script Java Basics - Anfänger-Themen 4
R Pattern bzw. Regex HTML-Code Java Basics - Anfänger-Themen 10
S String mit ASCII/HTML Zeichen darstellen Java Basics - Anfänger-Themen 10
S HTML Regularer Expression Java Basics - Anfänger-Themen 20
S regulärer Ausdruck HTML Java Basics - Anfänger-Themen 5
D Html Formular auswerten Java Basics - Anfänger-Themen 8
P Java Object das eine HTML Datei repräsentiert Java Basics - Anfänger-Themen 19
eLogic Einlesen von HTML-Source Java Basics - Anfänger-Themen 6
turmaline Ein regulärer Ausdruck für HTML-Sonderzeichen Java Basics - Anfänger-Themen 3
H html-Text mit Formatierung in String speichern Java Basics - Anfänger-Themen 4
S Java und HTML- Drop Down- Mehrfachauswahl Java Basics - Anfänger-Themen 3
A execute jar from html Java Basics - Anfänger-Themen 6
D Interpreter-Fehler JavaApplet läuft in der IDE aber nicht im HTML Dokument Java Basics - Anfänger-Themen 9
StupidAttack Html Code durchsuchen Java Basics - Anfänger-Themen 2
T Servlet HTML-Formular Java Basics - Anfänger-Themen 9
TheKing HTML Formular mit Java ausfüllen und absenden Java Basics - Anfänger-Themen 9
P HTML <input> Feld in einem JLabel auslesen Java Basics - Anfänger-Themen 4
C einfacher Link zu *.html Datei möglich? Java Basics - Anfänger-Themen 4
V javascript und HTML: hoch 2 Java Basics - Anfänger-Themen 2
M index.html fehlt Java Basics - Anfänger-Themen 12
3 Eine HTML Datei in eine Java Datei umschreiben Java Basics - Anfänger-Themen 23
Weltall 7 Applet in HTML einbinden Java Basics - Anfänger-Themen 3
A Java in Html einbinden Java Basics - Anfänger-Themen 2
M Frage zum Aufruf eines Applets aus einer HTML - Datei Java Basics - Anfänger-Themen 3
sylo Auf HTML-Dateien in einer Jar zugreifen Java Basics - Anfänger-Themen 9
D HTML Text von jButton disablen Java Basics - Anfänger-Themen 2
I CSV Datei auf HTML Seite hochladen und in DB laden Java Basics - Anfänger-Themen 9
K html to pdf Java Basics - Anfänger-Themen 6
D String aus Html (sonderfall) Java Basics - Anfänger-Themen 9
F html editor Java Basics - Anfänger-Themen 5
A html parser Java Basics - Anfänger-Themen 5
G HTML Seite generieren Java Basics - Anfänger-Themen 2
S Text aus HTML Datei in TXT Datei Java Basics - Anfänger-Themen 19
U HTML-String zusammenbauen Java Basics - Anfänger-Themen 4
P Datentypen HTML Dokument speichern (Netbeans) Java Basics - Anfänger-Themen 10
S kreative Schlaue funktion für optionsfeld (html) gesucht... Java Basics - Anfänger-Themen 4

Ähnliche Java Themen

Neue Themen


Oben