welchen line brak benutzt ein geg. textfile

dermoritz · 6. Sep 2010

gibt es eine Möglichkeit herauszubekommen welchen line break ein gegebenes Textfile benutzt? ich bastele grad an einem Programm welches in einem Textfile bestimmte Dinge ändert und ein neues Textfile erzeugt.
Das Programm soll sowohl die Kodierung so belassen wie sie ist (dazu muss man sie angeben). Aber 2. soll auch das verwendete line break das selbe bleiben - das ist ja von der Kodierung unabhängig?!

Das ganze ist in Java etwas komisch geregelt: Beim lesen z.B. über Scanner-Klasse wird mit der Kodierung anscheinend auch ein Linebreakzeichen angenommen - bei UTF-8 "\n" bei "iso..."-das "\n\r". (in manchen windowstextfiles findet der scanner nur eine "nextLine()" wenn man die Iso-Kodierung angibt.)
Beim schreiben mit BufferedWriter.newLine() wird anscheinend immer der "System-lineSeperator" benutzt also \n\r wenn man in windows programmiert.

musiKk · 6. Sep 2010

Zunächst: Du meinst sicher [c]\r\n[/c], nicht umgekehrt.

Herausfinden, welcher Zeilentrenner in einer Datei verwendet wird, kannst Du durch Raten. Wenn es sich um reine Textdateien handelt, gibt es keinen Grund für ein falsches Vorkommen der verschiedenen Trennzeichen; da dürfte es eigentlich reichen, wenn bis zum ersten Trenner gelesen wird (bringt natürlich nur etwas bei Dateien mit mehr als einer Zeile).

Ansonsten ist der Trenner unabhängig vom Encoding. Dass [c]BufferedWriter#newLine()[/c] den Trenner des Systems benutzt, ist ja recht sinnvoll; irgendwas muss genommen werden. Stimmt der nicht, muss man [c]newLine()[/c] ja nicht verwenden (oder man ändert das Property [c]line.separator[/c]; laut Javadoc wird der Wert als Trenner verwendet, der zum Zeitpunkt der Erstellung des Writers aktuell ist).
Was [c]Scanner[/c] da macht, weiß ich nicht. Laut Quelltext verwendet [c]nextLine()[/c] sowohl [c]\r\n[/c] als auch [c]\r[/c] und [c]\n[/c], sowie ein paar Unicode-Zeichen. Im Zweifel einfach nochmal ein Beispielprogramm zeigen, welches das Problem verdeutlicht.

dermoritz · 7. Sep 2010

ok das heißt man muss in der geg. Textdatei nach \n und\r\n suchen. und dann nimmt man das was man gefunden hat und setzt es explizit an das ende jeder geschriebenen Zeile. (Ich will ja eine Textdatei im selben Format wie die gelesene schreiben.)
(die richtige Kodierung muss man sowieso raten oder?)

musiKk · 7. Sep 2010

dermoritz hat gesagt.:
(die richtige Kodierung muss man sowieso raten oder?)

Richtig. Ich nehme an, es gibt Bibliotheken, die das machen, aber habe mich da noch nicht umgesehen. Prinzipiell ist es schöner, wenn der Nutzer diese Information angibt oder sie irgendwie in der Datei steht (wie z. B. bei XML-Dateien). Ersteres setzt natürlich voraus, dass die Zielgruppe des Programms mit den nötigen Begriffen etwas anfangen kann.
Ansonsten ist es oft nicht verkehrt, erstmal UTF-8 vorauszusetzen. Das hat mittlerweile eine relativ hohe Verbreitung und den Vorteil, dass es häufig fehlschlägt, wenn es nicht richtig ist (immer dann, wenn Zeichen außerhalb von ASCII verwendet werden).

	Titel	Forum	Antworten	Datum
J	Welchen Packager soll ich verwenden.	Allgemeine Java-Themen	7	16. Okt 2022
B	Mit welchen Datentypen und Strukturierung am Besten dutzende Baccaratspiele Shcritt für Schritt durchsimulieren?	Allgemeine Java-Themen	26	18. Mrz 2022
S	Interface Welchen Interface Stil favorisiert ihr? (usability)	Allgemeine Java-Themen	17	10. Jan 2012
J	Welchen Obfuscator nehmen?	Allgemeine Java-Themen	11	7. Jun 2011
H	String - Hat welchen Zeichensatz?	Allgemeine Java-Themen	6	31. Aug 2009
B	Log4j --- Welchen Appender, wie konfigurieren	Allgemeine Java-Themen	3	8. Feb 2009
B	welchen port muss ich angeben?	Allgemeine Java-Themen	11	2. Jan 2009
F	Welcher Datentyp in welchen casten?	Allgemeine Java-Themen	11	24. Aug 2007
M	Welchen Reader?	Allgemeine Java-Themen	8	14. Jun 2007
K	Welchen Editor?	Allgemeine Java-Themen	31	11. Aug 2006
N	Ermitteln welchen Typ ein "Object"-Objekt enthält	Allgemeine Java-Themen	11	15. Mai 2006
S	welchen editor	Allgemeine Java-Themen	5	14. Mai 2005
S	Welchen Editor soll man für Graphische lösungen benutzen	Allgemeine Java-Themen	2	26. Jul 2004
B	Java mit command line und jars benutzen?	Allgemeine Java-Themen	18	22. Okt 2022
	2D-Grafik Bresenham's line algorithm	Allgemeine Java-Themen	37	31. Aug 2019
M	Line-Fehler	Allgemeine Java-Themen	8	1. Dez 2016
G	GUI-basiertes Java-Program in Command-line Version umwandeln	Allgemeine Java-Themen	1	7. Nov 2016
B	Input/Output BufferedWriter/Reader replace line	Allgemeine Java-Themen	6	29. Jan 2016
F	TrueType-Font in Single-Line-Font wandeln	Allgemeine Java-Themen	0	5. Nov 2014
G	UUencoding bring Fehlermeldung: No beginn line / Missing 'end' line	Allgemeine Java-Themen	0	13. Jan 2014
B	go to Line	Allgemeine Java-Themen	8	13. Jan 2013
M	Swing java command line abfangen	Allgemeine Java-Themen	8	17. Nov 2012
M	Java line separator (evtl nur in TextComponents...)	Allgemeine Java-Themen	5	17. Jul 2012
K	Command Line Argument Interpreter für komplexe Strukturen	Allgemeine Java-Themen	9	31. Mai 2011
M	MessageFormat : multi line	Allgemeine Java-Themen	10	7. Dez 2009
U	Serach in Line	Allgemeine Java-Themen	2	3. Nov 2009
X	Audio-Eingabegerät auswählen (MIC oder LINE-IN)	Allgemeine Java-Themen	11	1. Sep 2008
C	Line-In Signalstärke Visualisieren	Allgemeine Java-Themen	2	21. Apr 2008
S	Wie Carriage Return Line Feed abfragen.	Allgemeine Java-Themen	6	10. Aug 2007
P	command line parameter auswerten	Allgemeine Java-Themen	3	27. Jun 2007
C	Sound: Keine Line gefunden. Zu großer internal buffer?	Allgemeine Java-Themen	3	17. Okt 2004

welchen line brak benutzt ein geg. textfile

dermoritz

Bekanntes Mitglied

musiKk

Top Contributor

dermoritz

Bekanntes Mitglied

musiKk

Top Contributor

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen