Byte Array Zeichensuche

Rabber

Mitglied
Hallo,

ich bin es wieder.

Ich versuche momentan in einem Byte Array Leerzeichen zu suchen(Diese haben den Wert 32).
Wenn eines gefunden wird, soll testweise eine Nachricht ausgegeben werden. Das Problem ist, dass jedes Zeichen als Leerzeichen erkannt wird. Wenn ich allerdings nach einem anderen Wert suche, findet er diesen auch korrekt. Habt ihr eventuell eine Idee, woran das liegen könnte?

Java:
for (y = buf + 3; y < bufend; y++);
            {
                if (text[y] == leer) {
                   // System.out.println("BLA");
                } else {
                    afo[z] = text[y];
                }
                //System.out.println(afo[z]);
                z++;
            }

buf ist der Startwert, ab wo Kopiert werden soll. Die +3 sind das Offset für ein Sonderzeichen, dass nicht kopiert werden soll und bufend ist glaube ich selbsterklärend :)
leer hat den byte wert 32.


Danke

Rabber
 

Joose

Top Contributor
Wenn du uns noch sagst was du auf Text stehen hast, bzw. wie dieses Array befüllt wird dann kann man wahrscheinlich helfen.
Nur mit diesem Code sehe ich auf den ersten Blick keinen Fehler.
 

Thallius

Top Contributor
Wobei ich nicht weiß ob es wirklich geplant ist die Leerzeichen durch 0 zu ersetzen oder ob nicht eher die Leerzeichen entfernt werden sollen. Aber das weiß auch nur der TO

Gruß

Claus
 

Rabber

Mitglied
Hier kurz die Skizze:

Der User gibt einen Pfad zu einem Ordner an, in dem eine oder mehrere PDF's liegen.
Die PDF's werden dann durch die Apache PDFBox in Text umgewandelt:

Java:
for (String path : paths) 
            {
                pd = PDDocument.load(pfad + pfad1 + path);
                PDFTextStripper stripper = new PDFTextStripper();
                sb.append(stripper.getText(pd));
                pd.close();
            }
                lesen = sb.toString();
                text = lesen.getBytes()

Das funktioniert auch. Ich frage mich halt nur, warum er bei dem wert 32 jedes Zeichen als 32 erkennt und bei anderen(z.B. 101) nicht.


Mir geht es erstmal nur darum, dass die richtigen Leerzeichen erkannt werden. Später soll dann anhand dieser Leerzeichen der Text an einer bestimmten Position abgeschnitten werden(funktioniert so weit auch bei den anderen Werten es fehlt halt wirklich nur die Erkennung der Leerzeichen).
Grüße

Rabber
 
Zuletzt bearbeitet:

Thallius

Top Contributor
Ich würde mal davon ausgehen, dass getBytes dir die Unicodes zurück liefert und nicht die ASCII Werte. Versuch es doch mal mit
getBytes("US-ASCII");

Ausserdem würde ich die eventuell auftretenden Exceptions abfangen, gerade bei Char encoding passieren da die wildesten Sachen.

Gruß

Claus
 
Zuletzt bearbeitet:

Rabber

Mitglied
Danke für den Tipp. Versuche ich gleich mal.

Die Exceptions fange ich auf, habe ich hier der Einfachheit aber rausgelassen, da es an sich ja funktioniert.
 

Joose

Top Contributor
Java:
for (String path : paths) 
            {
                pd = PDDocument.load(pfad + pfad1 + path);
                PDFTextStripper stripper = new PDFTextStripper();
                sb.append(stripper.getText(pd));
                pd.close();
            }
                lesen = sb.toString();
                text = lesen.getBytes()

Code:
pfad
,
Code:
pfad1
und
Code:
path
.... Englisch, Deutsch und dann noch Zahlen, bleibe bei einer Sprache (vorzugweise Englisch) und vermeide Variablen durchzunummerieren! Auch wenn der Name der Variable länger wird, versuche eindeutig auszudrücken um was es sich handelt!

Und wie Thallius schon sagte ... Encoding!
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
LucasGlockner Effizienter byte-Zugriff auf ein long[]-Array Allgemeine Java-Themen 8
Noahscript Aus einem byte Array Steuerungszeichen und Code bekommen und ersetzen Allgemeine Java-Themen 3
N Byte Array in Java "dekomprimieren" Allgemeine Java-Themen 3
S Byte Array welches in Laufzeit aufgelöst wird // Objekt Array Allgemeine Java-Themen 3
O Byte-Array zu String Allgemeine Java-Themen 7
E Byte-Array to String: Zeichenkaputt Allgemeine Java-Themen 11
R In einem Byte-Array nach einer gewissen Zahlenfolge suchen Allgemeine Java-Themen 7
A Input/Output Buffered Image zu Byte Array und zurück konvertieren Allgemeine Java-Themen 4
M byte array splitten Allgemeine Java-Themen 3
W CRC32 aus byte array Allgemeine Java-Themen 5
P Einzelne Bits in einem Byte-Array setzen Allgemeine Java-Themen 2
R int to byte[] Array Allgemeine Java-Themen 4
MQue byte[] Array to Integer Allgemeine Java-Themen 4
G String in byte- Array Allgemeine Java-Themen 3
ARadauer Blob aus byte Array erstellen? Allgemeine Java-Themen 3
D datei in byte[]-array schreiben Allgemeine Java-Themen 6
MQue ArrayList in ein byte- Array Allgemeine Java-Themen 7
B ein spezielles Byte-Array sortieren Allgemeine Java-Themen 11
J byte-Array in Hashmap speichern? Allgemeine Java-Themen 3
J byte-Array als String übers http schicken Allgemeine Java-Themen 8
B boolean array = byte array (platzverbrauch) Allgemeine Java-Themen 6
C Byte Array aus Datei erzeugen Allgemeine Java-Themen 6
T BufferedImage aus einem byte-Array? Allgemeine Java-Themen 2
H int aus Byte-Array erzeugen Allgemeine Java-Themen 10
Encera Größe eines Objektes in Byte berechnen Allgemeine Java-Themen 2
M Optimierung einer Methode (byte-Geraffel) Allgemeine Java-Themen 2
Thallius unsigned byte Allgemeine Java-Themen 18
kodela Datentypen byte als unsigned interpretieren Allgemeine Java-Themen 23
W String -> byte[] -> String - Sieht jemand was ich nicht sehe? Allgemeine Java-Themen 10
TheWhiteShadow 2D-Grafik GIF Library mit byte output Allgemeine Java-Themen 10
K Data Konverter - Probleme mit Byte[] Kodierung Allgemeine Java-Themen 3
kodela Byte Order Mark (BOM) bei readLine() ignorieren Allgemeine Java-Themen 5
A Byte zu String Allgemeine Java-Themen 4
RalleYTN Datentypen Unsignierter Byte zum signierten Byte Allgemeine Java-Themen 2
X Datentypen Byte geht nicht höher als 126 auch nicht mit casten? Allgemeine Java-Themen 22
M Null byte in verschiedenen charsets Allgemeine Java-Themen 2
D Decodierung von Mp3-byte[] Allgemeine Java-Themen 4
A ByteBuffer.get(byte[] dst,int offset,int length) Allgemeine Java-Themen 2
A RandomAccessFile.read(byte[] b) Allgemeine Java-Themen 9
P Datentypen Warum überhaupt Byte ? Allgemeine Java-Themen 12
P Datentypen String-Daten zu Byte-Zahlen konvertieren - Komme nicht weiter nach vielem versuchen :-/ Allgemeine Java-Themen 7
E Byte zu String & umgekehrt Allgemeine Java-Themen 3
B BufferedWriter in InputStream oder Zeichen-Stream in Byte-Stream Allgemeine Java-Themen 5
M Chart per byte[] in JSP anzeigen Allgemeine Java-Themen 4
E int in byte Allgemeine Java-Themen 6
R ArrayList byte[] abspeichern Allgemeine Java-Themen 4
S byte [] in string und zurück konvertieren Allgemeine Java-Themen 2
G byte ? : Allgemeine Java-Themen 7
hdi Speicherbelegung byte, short, int Allgemeine Java-Themen 8
J byte - hex - byte.. casten Allgemeine Java-Themen 8
R byte[] to String Konvertieren Allgemeine Java-Themen 14
J Hex-String zu byte transformieren Allgemeine Java-Themen 7
T Zu doof für byte-Umrechnung ... Allgemeine Java-Themen 3
F byte[] aus einem BufferedImage Allgemeine Java-Themen 3
L byte -> byte[1] -> byte Allgemeine Java-Themen 2
Kr0e Synchronisieren: boolean,byte,char ? Allgemeine Java-Themen 2
S Überprüfung/Parsen eines Byte-Arrays Allgemeine Java-Themen 9
Semox Byte-Manipulation eines Bildes Allgemeine Java-Themen 7
Meldanor For-Schleifen - byte statt int? Allgemeine Java-Themen 11
C int zu byte cast - verständnis Allgemeine Java-Themen 3
MQue Byte to Int convertieren Allgemeine Java-Themen 2
R Double Werte aus byte[] auslesen Allgemeine Java-Themen 5
W Verwendung von byte Allgemeine Java-Themen 9
G zu lange Byte code dateien Allgemeine Java-Themen 6
E Byte [] nach hex, dann nach dec Allgemeine Java-Themen 2
A Performance: byte[] in byte[][][] konvertieren Allgemeine Java-Themen 2
G 2 x byte zusammenkopieren Allgemeine Java-Themen 7
G byte nach int Allgemeine Java-Themen 3
foobar Object to byte[] ohne Serializable Allgemeine Java-Themen 6
data89 Die Größe eines Strings in Byte berechnen? Allgemeine Java-Themen 12
G Byte- List mit einem Iterator durchlaufen Allgemeine Java-Themen 5
W Konflikt byte->int, in.read->arraycopy Allgemeine Java-Themen 7
T "unsigned" byte[] -> BigInteger Allgemeine Java-Themen 2
F byte in hex-String oder: Wer hat in Mathe aufgepasst Allgemeine Java-Themen 3
T Socket Server Anwendung - Empfang eines Byte-Arrays Allgemeine Java-Themen 7
J NumberFormatException bei String->byte[] Allgemeine Java-Themen 12
T Object -> byte[] Allgemeine Java-Themen 5
G Byte[] zeichenweise lesen Allgemeine Java-Themen 4
G byte[] mit Strings füllen Allgemeine Java-Themen 2
B int -> byte Allgemeine Java-Themen 2
G file --> byte[] Allgemeine Java-Themen 7
E Problem beim Dateien kodieren ("Byte = Byte +1") Allgemeine Java-Themen 3
I String -> byte[] -> String Allgemeine Java-Themen 2
D byte nach integer? Allgemeine Java-Themen 4
MQue int in byte Allgemeine Java-Themen 18
G Maximalgröße von byte[] buffer Allgemeine Java-Themen 7
E String -> byte[] Allgemeine Java-Themen 6
C Byte[] to String Allgemeine Java-Themen 7
D byte[] problem Allgemeine Java-Themen 3
T OutputStream - Event bei Byte-Fluss Allgemeine Java-Themen 5
S Problem beim Einlesen von byte-werten aus datei Allgemeine Java-Themen 2
F List<String> zu byte[] Allgemeine Java-Themen 7
L byte vs. int Allgemeine Java-Themen 6
G Umwandlung Byte in Integer Allgemeine Java-Themen 12
N Byte-Code entschlüsseln (Bitmasks?) Allgemeine Java-Themen 3
R byte - string? Allgemeine Java-Themen 10
R Stream Byte für Byte durchgehen Allgemeine Java-Themen 5
S java.io.InputStream.read(byte[] b) überschreiben Allgemeine Java-Themen 33
L byte[] to int Allgemeine Java-Themen 2
M Vector zu einem byte[] Allgemeine Java-Themen 5

Ähnliche Java Themen

Neue Themen


Oben