Moin Leute für euch bestimmt ne einfache aufgabe! Ich will eine HTML datei die ich in einem String habe von allen HTML befehlen befreien! Wwelche möglichkeiten gibt es da? Habe unter Swing einen HTML parser gefunden steige bei diesem aber nicht durch! Vielen Dank
Chatrick
Klasse super funktioniert! Da ich gerne immer alles wisse und auch noch ein sehr jungfreulicher Informatik Student bin, kann ich den Ausdruck nicht deuten! Klar reguläre Ausdrücke aber könntest du mir den mal in Worten übersetzen?
Als erstes Zeichen muss eine öffnende, spitze Klammer kommen. Die ist ja auch der Anfang von allen HTML Tag
Code:
/?
Danach darf, muss aber kein / kommen. Das Fragezeichen bedeuted, darf einmal oder keinmal vorkommen.
Code:
[^>]
In Eckigen Klammern stehen Zeichenklassen. Das ^ steht dabei für eine Negation. [^>] trifft also auf alle Zeichen, außer der schließenden Klammer zu. Allerdings nur auf genau ein Zeichen
Code:
[^>]+
Das Plus dahinter bedeuted, dass, was vor dem Plus steht, darf beliebig oft wiederholt werden, muss aber mindestens einmal vorkommen. Damit trifft dieser Teilausdruck einen beliebig langen Teilstring, wo keine schließende spitze Klammer vorkommt.
Code:
>
Am Ende muss eine schließende spitze Klammer kommen.
Dieser ganze String soll dann durch den Leeren String, "", ersetzt werden.
entschuldige wenn ich hier eine frage in einem fremden eitrag stelle aber nur mal rein interessehalber...
was wäre bei einem xml dokument oder einem php oder js in das ein xml dokument mittels string eingebettet ist welcher eine CDATA sektion besitzt die dann ja auch oben genannte zeichen als nicht html entity sondern als genau dieses zeichen enthalten können welche dann auch ersetzt würden?