substring entfernt zuviele Zeichen

der neugirige · 27. Sep 2010

Hallo Leute,

bin neu hier
und stehe von einem Problem dar für das ich noch keine Lösung gefunden habe.
Und zwar Lese ich Zeilenweise eine TXT-Datei, diese wird dann zeilenweise in eine ArrayList<String> gespeichert. Die wie folgt aussieht

Java:

    Adresse Hex	Hex	ASCII
	$F03800 00 00 20 20 20 20 20 20 	..      
	$F03808	20 20 20 20 20 20 20 20 	        
	$F03810	20 20 20 20 20 20 20 20 	        
	$F03850	20 20 00 00 00 00 00 00 	  ......
	$F03858	00 00 00 00 00 00 00 00 	....AB..
	$F03860	00 00 00 00 00 00 00 00 	.....JK.
	$F03868	00 00 00 00 00 00 00 00 	...@.&.
	$F03870	00 00 00 00 00 00 31 32 	......12

Die ArrayList wird dann weiter verarbeitet und zwar wird jede einzelne Zeile in zwei einzelne Strings zerlegt und in eine Map<String, String> hinterlegt damit es zum Schluss so aussieht: keymap=0xF03800 (Adresse) und valuemap=0000202020202020 (Daten) usw.
Hier der Code dazu:

Java:

 ...// TXT-Datei einlesen und in eine ArrayList packen..
for (int i = 0; i < list.size(); i++) {
			//System.out.println(list.get(i));
			if (list.get(i).toString().startsWith("$"))
				// Nur die Zeilen die eine Adresse beinhalten
				str = list.get(i).toString();
			if (str.indexOf("$") == 0) {

				/*
				 * das ursprüngliche Dollarzeichen "$" wird durch "0x" ersetzt
				 */

				str2 = (str.substring(0, str.lastIndexOf(" "))).replace("$",
						"0x");
				
				keyMap = str2.substring(0, str2.indexOf("\t")).trim();
				
				valueMap = str2.substring(str2.indexOf("\t"));
				valueMap = valueMap.trim().replaceAll(" ", "");
				txtProtocol.put(keyMap, valueMap);
			}

		}// end for

Nun zum Problem, wenn die TXT-Datein so aussieht wie in Zeile 3&4 d.h. nach den Daten keine anderen Zeichen mehr kommen, löscht die substring()-Methode (Zeile 18) die letzten zwei Zeichen (20 20 20 20 20 20 20 20 wird zu 20 20 20 20 20 20 20). Da ich später aus den Daten noch die CRC Berechne wird das Ergebnis deswegen verfälscht.
Da ich bis jetzt noch keine Lösung für dieses Verhalten habe, hoffe ich, das eine von euch mir ein Paar Tipps geben kann wie ich das Problem umgehen kann.

Gruß
der neugirige

PS. war nicht so schnell

Mr.Isaaaac · 27. Sep 2010

Ja gut äh, und wat ist nun die Frage ?!?!

Irreparabel · 27. Sep 2010

Wenn das funktioniert ist doch prima.

hansmueller · 27. Sep 2010

Hallo,

wenn ich es richtig verstehe, was du vor hast, dann solltest du einfach die Zeichen abzählen und nicht nach einen bestimmten Zeichen suchen lassen.

Statt

Java:

str2 = (str.substring(0, str.lastIndexOf(" "))).replace("$",
                        "0x");

machst du einfach

Java:

str2 = (str.substring(0, 31)).replace("$","0x");

(Hoffe ich habe mich nicht verzählt.)
Ich gehe mal davon aus, daß die Adresse immer 7stellig ist, gefolgt von 8 2stelligen Werten getrennt durch ein Tab oder Leerzeichen.

MfG
hansmueller

der neugirige · 27. Sep 2010

@hausmueller

die Daten sind leider variabel.
Aber trotzdem Danke.

Gruß

der neugirige · 28. Sep 2010

Hallo,

hat sonst keine Ideen?
Freue mich über jeden Vorschlag.

Danke

und

Gruß

der neugirige

SlaterB · 28. Sep 2010

-->

Mr.Isaaaac hat gesagt.:
Ja gut äh, und wat ist nun die Frage ?!?!

<--

edit: ok, das erste Posting wurde editiert, dann schaue ich jetzt rein

Michael... · 28. Sep 2010

Irgendwelche Orientierungspunkte wird es ja geben. Ist denn alles variabel?
Können denn Adressen mit mehr oder weniger als 8 Byte belegt sein?
Kann man eventuell an der Kopfzeile erkennen wie die Datei aufgebaut ist?

SlaterB · 28. Sep 2010

> Nun zum Problem, wenn die TXT-Datein so aussieht wie in Zeile 3&4 d.h. nach den Daten keine anderen Zeichen mehr kommen, löscht die substring()-Methode (Zeile 18) die letzten zwei Zeichen

steht denn zwischen all den 20 auch jeweils ein Tab? ansonsten kommt es gar zur Exception, weil str2.indexOf("\t") dann -1 liefert

und in meinem lokalen Test wird in Zeile 12 schon die letzte 20 abgeschnitten, eben weil zwischen den 20 eher Leerzeichen stehen statt Tab,
wenn nirgendwo Leerzeichen sind, dann hast du mit Zeile 12, die nach Leerzeichen such, generell Probleme

du solltest erklären wo wann Leerzeichen oder Tabs oder sonstiges stehen,
am besten immer vollständige Test-Programme posten, unabhängig von Dateien, alles im Programm definiert:

Java:

public class Test
{
    public static void main(String[] args)
    {
        // String str = "$F03808 20 20 20 20 20 20 20 20\t   rr ";
        String str = "$F03808 20 20 20 20 20 20 20 20";
        
        String str2 = str.substring(0, str.lastIndexOf(" "));
        System.out.println("str2: " + str2);
        String keyMap = str2.substring(0, str2.indexOf("\t")).trim();
        String valueMap = str2.substring(str2.indexOf("\t"));
        valueMap = valueMap.trim().replaceAll(" ", "");
        System.out.println(keyMap + " - " + valueMap);
    }
}

hab das Programm schon vereinfacht, $ zu 0x scheint ja kein Problem zu sein,
statt 7-8x 20 wären auch unterschiedliche Werte, z.B. 21, 22, 23, 24 usw. übersichtlicher

-----

du sagst dass der String eine variable Länge hat, wo Leerzeichen oder Tab auftauchen scheint mir zumindest noch unbekannt,
die Zeile endet mal so, mal so..
gibt es denn überhaupt irgendwelche Regeln, nach denen man sich richten kann?
willst du auch Strings der Form "$hallo 3 4 5" parsen oder nicht, was genau sind die Eckdaten?
kann man immer davon ausgehen, dass in der Mitte nur zwei-ziffrige Zahlen mit Tab oder Leerzeichen dazwischen stehen?
wie viele, sind es immer 8 oder auch weniger, wenn weniger kann dann am Ende noch " ......" folgen, oder das nur wenn auch 8 Ziffernpaare vorhanden sind?
dann würde ich sagen, dass du doch wieder mit Länge arbeiten kannst, wenn < 31, dann ein Ende a la " ......" ignorieren, ansonsten ist 0-31 der Key und der Rest wird separat als Value angeschaut,
oder ist links von den 8 Ziffernpaaren auch was variabel?

usw., du musst entweder
a) alle relevanten Details exakt darlegen
oder
b) eine Menge bisher bekannter Beispiele geben (als String in Java kodiert, nicht aus unbekannter Datei mit Leerzeichen oder Tabs)
und wie diese interpretiert werden sollen,
dann kann man zumindest Regex/Suche/subString zusammenstellen, die mit genau allen diesen Beispielen klarkommen,

bisher wäre es str.substring(0, 31), du sagst dass das nicht geht weil variabel, gibst aber weder Alternativ-Beispiele noch genaue Regeln

fjord · 28. Sep 2010

Das sind immer 8 Byte pro Zeile?

Java:

import java.util.regex.*;
[...]
Pattern p = Pattern.compile("\\$(\\w{6})((:?\\W\\w{2}){8})");
Matcher m = p.matcher("");

for (String line : strings) {
	m.reset(line);
	if (m.find()) {
		txtProtocol.put("0x" + m.group(1), m.group(2).replace(" ", ""))
	}
}

der neugirige · 28. Sep 2010

Hallo,

erstmal Danke an alle.

@Michael
Die Adressen sind immer konstant, d.h.: 3 Byte lang
Die Daten sind variabel von min. 2 Byte bis max. 8 Byte.
Nach den Daten kommt die ASCII Interpretation der Daten und die können alle möglichen Zeichen enthalten.

@SlaterB

Sorry da war ich zu schnell Unterwegs,

Die TXT-Datei ist eine Art Log-Datei die mit Hilfe eines zusätzlichen Geräts auf ein Multimediagerät
zugreift und seinen Speicher samt den Inhalt abspeichert. -Auf die Log-Datei habe ich nur bedingt Einfluss.

hier der Aufbau der relevanten Zeilen nach Notepad++:

Java:

$F00300	00 06 07 32 33 D6 C2 	...23..
 "tab"$F00300"tab"00"lz"06"lz"07"lz"32"lz"33"lz"D6"lz"C2"lz""tab""ASCII Interpretation"
lz = leerzeichen, für die Ascii Interpretation kann alles Möglich drin stehen, eben die ASCII Zeichen

das mit den lauten 20 im ersten Post steht so in der Datei drin. Die txt selbst hat über 200 relevanten Zeilen.

@fjord
siehe oben

Gruß

SlaterB · 28. Sep 2010

dein Format widerspricht ein wenig einer Aussage
> löscht die substring()-Methode (Zeile 18) die letzten zwei Zeichen

wie sollte das vor sich gehen? wenn kein Tab dazwischen, dann kann ja auch nichts zerschnitten werden, oder vermutest du unbekannte Faktoren?
subString arbeitet aber deterministisch und nachvollziehbar,
schau dir den eingelesenen String an, gib ihn Zeichen für Zeichen aus, teste ob == '\t' usw,
dann schaue nach was str2.indexOf("\t") als Zahl ergibt und dann weist du wo genau abgeschnitten wird

------

wie auch immer, Vorschlag ist nach wie vor:
schaue nach ob der String länger oder kürzer als 31 Zeichen ist, wenn länger, dann gibt es einen Abschnitt hinter den 8 2er-Paaren,
wenn nicht dann nicht,
mit einer solchen Unterscheidung sollten wenigen Fehler auftreten

der neugirige · 28. Sep 2010

@SlaterB

es ist kein TAB zwischen den Daten nur Leerzeichen, erst wenn die Daten zu ende sind kommt ein Leerzeichen gefolgt von einem TAB plus die ASCII Interpretation. Bei den Problem Zeilen aus Post eins
kommt nach den Daten Leerzeichen + TAB + "mehrere Leerzeichen" da die ASCII Interpretation von 20 eben Leerzeichen sind.

werde deinen Vorschlag mit ==\t mal austesten.

Gruß

fjord · 28. Sep 2010

Bei meinem Vorschlag kann man die Anzahl der Bytes natürlich auch noch variabel machen. Dafür muss nur {8} mit {1,8} ersetzt werden und er erkennt 1-8 Bytes.

der neugirige · 28. Sep 2010

@fjord
werde es mal testen

LG

der neugirige · 30. Sep 2010

Hallo,

hab mal wieder Zeit euch zu berichten.

@SlaterB

habe es getestet, das Ergebnis war wie erwartet, keine TABS zwischen
den eigentlichen Daten, nur Leerzeichen. TABs sind nur vor und danach.

@fjord

dein Lösungsvorschlag, funktioniert super :applaus:.
Zwar steige ich noch nicht so richtig dahinter wie es funktioniert
aber Hauptsache es tut was es tun soll

@all
Aber warum jetzt die Substring()-Methode die letzten 2 Zeichen abschneidet ist mir immer noch
schleierhaft.

Gruß

SlaterB · 30. Sep 2010

schleierhaft ist mir allein, warum du nicht das vollkommen deterministische Verhalten untersuchst,
den String aus Datei ins Testprogramm zu posten ist sicherlich nicht so leicht, da können z.B. Tags verschwinden (auch wenn du das nicht mehr hören magst

)

was aber lockerleicht geht, ist ein Programm zu schreiben, welches die Datei einliest und eine Ausgabe produziert wie folgt:
bearbeite Zeile: ... + Zeile + Länge
Zeichen 1 ist: .. + Zeichen, + ASCII-Code des Zeichens
Zeichen 2 ist: .. + Zeichen, + ASCII-Code des Zeichens
........ bis letztes Zeichen
str.lastIndexOf(" ") ist = ..
str2 = ..., Länge ..,
str2.indexOf("\t") ist = ..
keyMap = ..., Länge ...

	Titel	Forum	Antworten	Datum
A	Zeichenkette teilen mit Substring oder Char Array	Java Basics - Anfänger-Themen	14	21. Okt 2024
S	Substring in java	Java Basics - Anfänger-Themen	3	7. Nov 2022
	S.substring	Java Basics - Anfänger-Themen	38	28. Okt 2022
モ	Substring in einem String finden	Java Basics - Anfänger-Themen	13	3. Aug 2022
	substring in array	Java Basics - Anfänger-Themen	1	8. Nov 2021
P	Methoden Namen trennen mit .substring(), char.At(), .lenght()	Java Basics - Anfänger-Themen	8	29. Okt 2020
A	startsWith method und substring	Java Basics - Anfänger-Themen	2	22. Jun 2020
W	Substring Array	Java Basics - Anfänger-Themen	1	17. Jul 2018
B	substring() maximale Zeichenlänge festlegen?	Java Basics - Anfänger-Themen	1	22. Jun 2018
D	Substring wiederholen	Java Basics - Anfänger-Themen	33	16. Aug 2017
M	"substring()" mit Dateien und Pfadangaben	Java Basics - Anfänger-Themen	5	23. Sep 2016
Z	Pattern und Matcher substring zu String möglich?	Java Basics - Anfänger-Themen	4	11. Mai 2016
Y	Substring	Java Basics - Anfänger-Themen	10	21. Jul 2015
F	SubString in String zählen	Java Basics - Anfänger-Themen	3	13. Mrz 2015
A	Länge Substring	Java Basics - Anfänger-Themen	1	13. Sep 2014
S	Substring - String index out of range	Java Basics - Anfänger-Themen	11	26. Okt 2013
A	Probleme mit Substring	Java Basics - Anfänger-Themen	2	5. Nov 2012
L	String.contains() - substring erstellen	Java Basics - Anfänger-Themen	3	22. Mrz 2012
H	Frage zu Substring(old, new)	Java Basics - Anfänger-Themen	3	3. Mrz 2012
S	String index out of range: 8 at java.lang.String.substring(Unknown Source)	Java Basics - Anfänger-Themen	13	12. Jan 2012
I	Substring für ne Liste	Java Basics - Anfänger-Themen	6	5. Jan 2012
P	Erste Schritte vergleich substring und string	Java Basics - Anfänger-Themen	4	16. Dez 2011
C	Substring aus String - \n nicht beachten	Java Basics - Anfänger-Themen	12	25. Sep 2011
B	String Methoden ! substring,indexOf,length... :(	Java Basics - Anfänger-Themen	5	20. Mai 2011
F	String substring	Java Basics - Anfänger-Themen	15	10. Mai 2011
F	Substring mittels RegEx ermitteln/ersetzen?	Java Basics - Anfänger-Themen	2	16. Jan 2011
G	Java substring vereinfachen	Java Basics - Anfänger-Themen	19	10. Mrz 2010
L	Substring?	Java Basics - Anfänger-Themen	5	2. Dez 2009
B	Problem mit substring	Java Basics - Anfänger-Themen	3	8. Mrz 2009
J	Substring zwischen Anführungszeichen finden	Java Basics - Anfänger-Themen	10	14. Jan 2009
G	substring	Java Basics - Anfänger-Themen	4	15. Jul 2008
G	Substring in String	Java Basics - Anfänger-Themen	3	27. Mrz 2008
K	Probleme mit substring?	Java Basics - Anfänger-Themen	5	7. Jan 2008
U	substring(0, maxLength)	Java Basics - Anfänger-Themen	2	25. Nov 2007
T	String beschneiden, Tokenizer und Substring bringen nix	Java Basics - Anfänger-Themen	5	15. Nov 2007
J	Java Aufgabe -> String einlesen, splitten,Substring &	Java Basics - Anfänger-Themen	3	19. Mai 2007
G	getName, substring Verwendung	Java Basics - Anfänger-Themen	3	24. Apr 2007
G	Substring und Leerstellen	Java Basics - Anfänger-Themen	2	8. Mrz 2007
I	Fehler bei Verwendung von substring	Java Basics - Anfänger-Themen	4	14. Jan 2007
N	Substring herausziehen funktioniert nicht!	Java Basics - Anfänger-Themen	9	18. Dez 2006
L	Syntax von subString	Java Basics - Anfänger-Themen	19	15. Nov 2006
	If Abfrage von substring funzt net :(	Java Basics - Anfänger-Themen	3	2. Jun 2006
F	String Methode subString()	Java Basics - Anfänger-Themen	7	30. Mrz 2006
D	Files Readen und Substring	Java Basics - Anfänger-Themen	5	3. Mrz 2006
C	Substring ersetzen	Java Basics - Anfänger-Themen	3	1. Sep 2005
D	substring Frage	Java Basics - Anfänger-Themen	2	27. Feb 2005
G	substring	Java Basics - Anfänger-Themen	5	18. Aug 2004
G	Problem mit .substring() und Stringvergleich	Java Basics - Anfänger-Themen	3	4. Apr 2004
	App crashed - Fehlerbereich auf die GUI beschränkt, sämtlicher Code wurde entfernt	Java Basics - Anfänger-Themen	6	4. Jun 2014
J	OOP Vergebene Objekt Nummer abgleichen falls einer entfernt wird ?	Java Basics - Anfänger-Themen	5	9. Aug 2012
H	Zuviele Java Versionen	Java Basics - Anfänger-Themen	6	10. Aug 2008
J	Zuviele Textfelder und Labels	Java Basics - Anfänger-Themen	2	27. Aug 2004

substring entfernt zuviele Zeichen

der neugirige

Mitglied

Mr.Isaaaac

Mitglied

Irreparabel

Aktives Mitglied

hansmueller

Bekanntes Mitglied

der neugirige

Mitglied

der neugirige

Mitglied

SlaterB

Gast

Michael...

Top Contributor

SlaterB

Gast

fjord

Bekanntes Mitglied

der neugirige

Mitglied

SlaterB

Gast

der neugirige

Mitglied

fjord

Bekanntes Mitglied

der neugirige

Mitglied

der neugirige

Mitglied

SlaterB

Gast

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen