Zeilenweises auslesen aus einer Unicode CSV-Datei

Status
Nicht offen für weitere Antworten.

daily

Aktives Mitglied
Heho,

folgendes Problem:
Mit Hilfe fon csvde sollen Active Directory Benutzer exportiert werden --> Das geht
Diese werden in einer CSV-Datei gespeichert --> Geht. Aber die Datei ist Unicode woran ich nix ändern kann.

Nun will ich aus der CSV-Datei die Benutzer auslesen um damit eine Batch-Datei erstellen zu lassen die alle Benutzer aktiviert (Nach Import der Benutzer mit csvde sind alle Benutzer deaktiviert).

Wenn ich aber jetzt zeilenweise aus der Datei auslesen weill bekomm ich nur Zeichensalat.

Sieht so aus:



Ich hab mittlerweile schon BufferdReader, RandomAccessFile, BufferdInputStream und noch irgendwas wo ich schon wieder vergessen hab ausprobiert und es hat nirgends funktioniert. Hab auch schonmal mit dem URLDecoder rumgespielt. Aber auch das bringt mich nicht wirklich weiter.

Ich bin für jede Hilfe dankbar :cry:
 

EOB

Top Contributor
eventuell ummodeln?

Code:
try {
       
        String string = "abc\u5639\u563b";
        byte[] utf8 = string.getBytes("UTF-8");
    
    } catch (UnsupportedEncodingException e) {
}

am besten noch den bufferedreader dekorieren und nen eigenen davor hängen :meld: ....


grüße
 

kleiner_held

Top Contributor
1. FileInputStream fuer die Datei oeffnen.
2. InputStreamReader erstellen der den FileInputStream mit dem richtigen Charset (wahrscheinlich "UTF-16") kapselt.
 

daily

Aktives Mitglied
Erstmal an euch beide ein Dankeschön.

EOB hat gesagt.:
eventuell ummodeln?

Code:
try {
       
        String string = "abc\u5639\u563b";
        byte[] utf8 = string.getBytes("UTF-8");
    
    } catch (UnsupportedEncodingException e) {
}

am besten noch den bufferedreader dekorieren und nen eigenen davor hängen :meld: ....


grüße

Habe das mal ausprobiert. In dem Bytearray stehen diese Vierecke immernoch drin. Sprich wenn ich sie ausgebe sind sie das auch.

Allerdings hab ich keine Ahnung was du mit "BufferReader dekorieren" meinst.

kleiner_held hat gesagt.:
1. FileInputStream fuer die Datei oeffnen.
2. InputStreamReader erstellen der den FileInputStream mit dem richtigen Charset (wahrscheinlich "UTF-16") kapselt.

Hat auch nichts geändert.

Hier mal mein Code mit dem ichs aktuell probiert hab:

Code:
File users = new File("d:\\ad.csv");
		try {
			RandomAccessFile usersAccess = new RandomAccessFile(users, "r");
			String tmp = "";

			tmp = usersAccess.readLine();
			byte[] bla = tmp.getBytes("UTF-16");

			for (int i = 0; i < bla.length; i++) {
				System.out.println((char) bla[i]);

			}

			usersAccess.close();

		} catch (FileNotFoundException e) {
			String message = "Die CSV-Datei ist fehlerhaft oder nicht vorhanden";
			new ExceptionDialog(message, e);
		} catch (IOException e) {
			String message = "Die CSV-Datei ist fehlerhaft oder nicht vorhanden";
			new ExceptionDialog(message, e);
		}
 

kleiner_held

Top Contributor
Code:
File users = new File("d:\\ad.csv"); 
FileInputStream stream = new FileInputStream (users );
InputStreamReader reader = new InputStreamReader (stream, "UTF-16");
BufferedReader bufferedReader = new BufferedReader (reader );
String line = null;
while ((line = bufferedReader.readLine()) != null)
{
    System.out.println(line);
}

Wobei ich nicht weiss ob "UTF-16" richtig ist, wenn kein byte-order mark da ist, mal "UTF-16BE" oder "UTF-16LE" probieren.
 

daily

Aktives Mitglied
kleiner_held hat gesagt.:
Code:
File users = new File("d:\\ad.csv"); 
FileInputStream stream = new FileInputStream (users );
InputStreamReader reader = new InputStreamReader (stream, "UTF-16");
BufferedReader bufferedReader = new BufferedReader (reader );
String line = null;
while ((line = bufferedReader.readLine()) != null)
{
    System.out.println(line);
}

Wobei ich nicht weiss ob "UTF-16" richtig ist, wenn kein byte-order mark da ist, mal "UTF-16BE" oder "UTF-16LE" probieren.

Also du bist eindeutig kein kleiner sondern ein großer Held. Wär ich reich, ich würd dir was spenden :p

Aber da ich nicht dumm sterben will:
Kannst du mir das mal grob erklären? Also wieso man da ganze 3 (!) Reader ineinander verschachteln muss und welcher da von welchem Effekt profitiert?
 

kleiner_held

Top Contributor
Man muss immer beachten: InputStream != Reader

1. Der FileInputStream ist ein InputStream und liest nur byte-weise.
Ein byte ist aber nicht gleich ein char sondern die Konvertierung von byte zu char hangt vom Encoding ab.
Deswegen kapseln wir
2. den FileInputStream mit einem InputStreamReader und sagen diesem, welches Encoding er verwenden soll.
der InputStreamReader ist ein einfacher Reader, liest also chars
Da wir aber die Strings gleich zeilenweise einlesen wollen, packen wir
3. den InputStreamReader in einen BufferedReader, denn der bietet uns praktischerweise die Methode readLine()

edit:
Um nochmal darauf einzugehen was du in deinem code gemacht hattest:
Mit
Code:
tmp = usersAccess.readLine();
hast du schon die bytes der datei in einen String decodiert (byte->char) und zwar implizit mit dem default Encoding des Betriebssystems, bei dir wahrscheinlich kein UTF-16 sodern ein ISO-XYZ bei Windows oder ein UTF-8 bei den meisten Linuxen.
Dann hast du mit
Code:
byte[] bla = tmp.getBytes("UTF-16");
den (falsch) decodierten String wieder encodiert (char->byte), diesmal mit UTF-16.
Und dann hast du mit
Code:
System.out.println((char) bla[i]);
einfach die bytes zum char gecastet, was so ziemlich einer Decodierung mit ASCII entspricht.

Du hast also deinen urspruenglichen Text gruendlich geschreddert :-D
 

daily

Aktives Mitglied
Alles klar, vielen Dank! So klingt das doch ziemlich logisch. Ich setz dann mal das Häkchen :p
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
L Input/Output Email mit großer Pdf Anhang auslesen? Allgemeine Java-Themen 3
Ernesto95 HTTP Mit JavaScript erzeugte dynamische Webseite auslesen und nach einem Schlüsselwort durchsuchen Allgemeine Java-Themen 6
K Bildschirm auslesen/ Text erkennen Allgemeine Java-Themen 5
torresbig Url nach Webseiten-Login auslesen & Daten an Webseite senden Allgemeine Java-Themen 9
S .exe Datei/Programm auslesen? Allgemeine Java-Themen 2
T INI - Einträge auslesen Allgemeine Java-Themen 6
H Auslesen eines (LDAP-)Attributs in Active Directory Allgemeine Java-Themen 2
O PDF auslesen und verändern, was ist besser iText oder PDFBox ? Allgemeine Java-Themen 9
Robertop Status von Caps- und NumLock auslesen Allgemeine Java-Themen 1
Master3000 Java Konsole über Buffered Reader Zeilenweise auslesen ? Allgemeine Java-Themen 26
G Mac Package auslesen Allgemeine Java-Themen 17
W Versionsnummer auslesen - Regex ist zickig Allgemeine Java-Themen 2
F Junit Test + Cucumber - JSON auslesen und in einem weiteren Schritt nutzen Allgemeine Java-Themen 0
M verschiedene Dokumente auslesen Allgemeine Java-Themen 1
Gaudimagspam CSV-Datei auslesen in Java Allgemeine Java-Themen 7
L Dateien richtig auslesen Allgemeine Java-Themen 6
F WireGuard Status auslesen Allgemeine Java-Themen 3
B .txt Datei erstellen und auslesen bzw. schreiben Allgemeine Java-Themen 6
I DOM-Parser - Element im Element an bestimmten Stellen auslesen Allgemeine Java-Themen 1
N Txt Datei auslesen. Allgemeine Java-Themen 5
O xlsx Datei auslesen mit POI Apache liest keine LEERZELLEN Allgemeine Java-Themen 6
O xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler. Allgemeine Java-Themen 11
J Information von getSource() Objekt auslesen Allgemeine Java-Themen 1
V EMail, Attachments auslesen von einer Email Allgemeine Java-Themen 0
K Aus String zwei Jahreszahlen auslesen Allgemeine Java-Themen 18
E CSV mit Text und Binärdaten auslesen Allgemeine Java-Themen 7
x46 Webseite in Java auslesen Allgemeine Java-Themen 2
M Html Seite auslesen Allgemeine Java-Themen 16
S Hilfe bei dem Auslesen einer YAML Datei Allgemeine Java-Themen 8
J Fenstergröße eines anderen Programmes auslesen Allgemeine Java-Themen 9
B Cookie auslesen Allgemeine Java-Themen 3
B Input/Output Programm zum Auslesen/Beschreiben von Textdateien, wie Geschwindigkeit erhöhen? Allgemeine Java-Themen 18
J Variablen Mehrere int-variablen in txt abspeichern und danach wieder auslesen Allgemeine Java-Themen 1
J Daten aus Website-Quelltext auslesen Allgemeine Java-Themen 62
J Teil einer URL auslesen Allgemeine Java-Themen 13
denny86 NetBeans Ordnernamen rekursiv auslesen und in Variable verarbeiten Allgemeine Java-Themen 38
C Atfx mit Hilfe von OpenAtfx auslesen Allgemeine Java-Themen 1
C Position von Pixeln in Bilder auslesen Allgemeine Java-Themen 2
M aktive WLAN Teilnehmer auslesen? Allgemeine Java-Themen 6
X JSONObject auslesen und in HashMap hinterlegen Allgemeine Java-Themen 16
S Kann man mit Java auf einem lokalen PC/Mac Benutzergruppen auslesen und Rechte ändern? Allgemeine Java-Themen 11
C Webseite auslesen Allgemeine Java-Themen 3
D Best Practice Gesamten Bildschirminhalt auslesen und Email schicken sobald kein Pixel sich ändert Allgemeine Java-Themen 11
A Erste Schritte Daten aus einer Website auslesen Allgemeine Java-Themen 7
J Bestimmte Zeile aus Textdatei auslesen Allgemeine Java-Themen 18
G Aus JTextField Zahlen auslesen und random generieren Allgemeine Java-Themen 10
M Tastatureingabe von Sondertasten auslesen Allgemeine Java-Themen 6
C Auslesen auslösen über Button-Click Allgemeine Java-Themen 8
M xlsx File auslesen Exception occured Allgemeine Java-Themen 13
U OOP Warum kann ich aus meiner Methode keinen String auslesen Allgemeine Java-Themen 4
J Auslesen Daten Java/HTML Allgemeine Java-Themen 15
4a61766120617274697374 PDF iText Wort Koordinaten auslesen Allgemeine Java-Themen 1
KeVoZ_ Bestimmte Zeile aus Console finden & auslesen Allgemeine Java-Themen 2
T Url aus txt Datei auslesen und öffnen? Allgemeine Java-Themen 4
N Werte aus Hashmap auslesen und übertragen Allgemeine Java-Themen 8
KeVoZ_ Properties mit String auslesen Allgemeine Java-Themen 11
I HTML einer Website auslesen liefert nur head Allgemeine Java-Themen 6
D Aktuell installierte Java Version auslesen unter Windows Allgemeine Java-Themen 5
M Parameter auslesen im Servlet Allgemeine Java-Themen 0
M Input/Output USB Geräteinstanzkennung auslesen Allgemeine Java-Themen 3
W 2D-Grafik Erstellungsdatum JPG direkt aus Header (EXIF) auslesen. Allgemeine Java-Themen 5
M Daten aus anderen Programmen auslesen Allgemeine Java-Themen 2
T Datei Byteweise auslesen Allgemeine Java-Themen 1
T Datentypen MNIST Datenbank auslesen (.gz) Allgemeine Java-Themen 0
T Ini Datei auslesen Allgemeine Java-Themen 3
J Temperatur aus bytes auslesen. Allgemeine Java-Themen 13
I JSoup Class auslesen Allgemeine Java-Themen 1
Bluedaishi Textdateien auslesen Allgemeine Java-Themen 12
T ELM327 OBD2 auslesen Allgemeine Java-Themen 0
D Double aus String auslesen Allgemeine Java-Themen 8
Z Zahlen aus Bild auslesen Allgemeine Java-Themen 1
A interaktives PDF auslesen/auswerten? Allgemeine Java-Themen 0
G Daten aus Website auslesen Allgemeine Java-Themen 7
S CSV Eintrag der nächsten Zeile auslesen funktioniert nicht Allgemeine Java-Themen 8
I Java FX JsonObjekt Children auslesen Allgemeine Java-Themen 23
M RXTX Details auslesen Allgemeine Java-Themen 6
N Input/Output Website Text auslesen und bestimmte Zeilen wiedergeben Allgemeine Java-Themen 4
X HTTP Auslesen der Ergebnisse von einer Webseite und in eine Liste packen Allgemeine Java-Themen 1
J Wav-Datei aus .jar auslesen Allgemeine Java-Themen 7
J Daten aus GUI auslesen und in Objekte umwandeln Allgemeine Java-Themen 6
D CSV Datei auslesen Allgemeine Java-Themen 23
N Werte aus Arrays auslesen funktioniert nicht Allgemeine Java-Themen 5
J Java JSON-Datei aus .Zip auslesen und Download mit Progress Bar Allgemeine Java-Themen 20
V Tooltips mit Java auslesen Allgemeine Java-Themen 1
I Inhalt einer Website auslesen Allgemeine Java-Themen 6
A JTable - CellRange auslesen Allgemeine Java-Themen 2
V 2d-Barcodes mit zxing auslesen Allgemeine Java-Themen 2
A Auslesen einer Datei sowie ausgeben als Liste in App Allgemeine Java-Themen 5
K Website in Programm einbinden und auslesen Allgemeine Java-Themen 2
M Image auslesen Allgemeine Java-Themen 2
S Zahlen aus (String mit zahlen) immer wieder neu auslesen Allgemeine Java-Themen 5
T datei auslesen ind der richtigen reihenfolge Allgemeine Java-Themen 2
A Probleme beim auslesen von Quelltext (HTML) Allgemeine Java-Themen 5
I Methoden Quellcode auslesen (Refelction o.ä.) Allgemeine Java-Themen 5
B Compiler-Fehler NullPointerException beim Auslesen von .lang-Datei Allgemeine Java-Themen 3
A Metadaten von Bildern auslesen und verändern Allgemeine Java-Themen 5
M InputStream auslesen Allgemeine Java-Themen 1
B Fehler beim Auslesen von Einstellungen. Zwei ähnliche Blöcke, nur eins geht. Allgemeine Java-Themen 5
I Best Practice Properties auslesen und splitten (RegExp?) Allgemeine Java-Themen 0
I Verschiedene Arrays auslesen Allgemeine Java-Themen 6

Ähnliche Java Themen

Neue Themen


Oben