Hi,
ich bearbeite immer noch einen HTML-Quelltext. Ich habe es mit einem komplizierten aber ausgetüfteltem Algorithmus geschafft jeden HTML-Tag bzw. den Code dazwischen in eine einzelne Zeile zu bringen.
z.B.
<ich bin ein tag>
ich bin inhalt
</ich mache den Tag zu>
Beim Einlesen der Datei mache ich mit
eine Abfrage ob die Line leer ist. Ist dem so, wird sie gar nicht erst verarbeitet, ein Counter wird erhöht. Jedoch bleiben im Ausgabetext leere Zeichen stehen.
Mit der Hexa-Ansicht habe ich festgestellt, dass es sich um ASCII "09" also um Tabulatoren und im ASCII "20", Leerzeichen handelt.
Wie kann ich nun diese Tabulatoren und Leerzeichen entfernen ?
mfg
bloodyStarter[/quote]
ich bearbeite immer noch einen HTML-Quelltext. Ich habe es mit einem komplizierten aber ausgetüfteltem Algorithmus geschafft jeden HTML-Tag bzw. den Code dazwischen in eine einzelne Zeile zu bringen.
z.B.
<ich bin ein tag>
ich bin inhalt
</ich mache den Tag zu>
Beim Einlesen der Datei mache ich mit
Code:
if(line.trim().isEmpty()){
linesremoved++;
}else{
format(line);
}
eine Abfrage ob die Line leer ist. Ist dem so, wird sie gar nicht erst verarbeitet, ein Counter wird erhöht. Jedoch bleiben im Ausgabetext leere Zeichen stehen.
Mit der Hexa-Ansicht habe ich festgestellt, dass es sich um ASCII "09" also um Tabulatoren und im ASCII "20", Leerzeichen handelt.
Wie kann ich nun diese Tabulatoren und Leerzeichen entfernen ?
mfg
bloodyStarter[/quote]