RegEx /compilebekomme nicht die erwarteten Werte

NicoDeluxe

Top Contributor
Hallo zusammen,
gegeben ist folgender String. Ich brauche daraus alle KEy-Value Paare also den Wert vor dem Doppelpunkt und den Wert dahinter zb

<b>Prozessor</b><br>Prozessorhersteller: Intel<br>Prozessorsockel: LGA 2066 (Socket R4)<br>Anzahl der unterstützten Prozessorkerne: 18<br>Prozessor Verlustleistung (max): 140 W<br><br><b>Speicher</b><br>Unterstützte Arbeitsspeicher: DDR4-SDRAM<br>RAM-Speicher maximal: 256 GB<br>Speicherspannung: 1.2 V<br>Unterstützte Arbeitsspeichergeschwindigkeit: 2133,2400,2666 MHz<br><br><b>Speicher-Controller</b><br>Unterstützte Speicherlaufwerk-Schnittstellen: SATA III<br>RAID Level: 0,1,5,10<br><br><b>Grafik</b><br>On-Board Grafikadaptermodell: Aspeed AST2500<br><br><b>Interne E/A-Anschlüsse</b><br>SATA III Anschlüsse: 8<br><br><b>E/A-Anschlüsse auf der Rückseite</b><br>Anzahl USB 2.0 Anschlüsse: 6<br>Anzahl USB 3.2 Gen 1 (3.1 Gen 1) Typ-A Ports: 5<br>Anzahl Ethernet-LAN-Anschlüsse (RJ-45): 2<br>Anzahl VGA (D-Sub) Anschlüsse: 1<br>Anzahl COM-Anschlüsse: 2<br><br><b>Netzwerk</b><br>WLAN: Nein<br>Eingebauter Ethernet-Anschluss: Ja<br>Ethernet Schnittstellen Typ: Gigabit Ethernet<br><br><b>Merkmale</b><br>Motherboardformfaktor: micro ATX<br>Motherboard Chipsatz: Intel® C422<br><br><b>Erweiterungssteckplätze</b><br>PCI-Express x16 (Gen 3.x)-Anschlüsse: 1<br><br><b>BIOS</b><br>BIOS-Typ: UEFI AMI<br>ACPI-Version: 6.0<br><br><b>Prozessor Besonderheiten</b><br>Trusted Platform Module (TPM): Ja<br><br><b>Betriebsbedingungen</b><br>Temperaturbereich bei Lagerung: -20 - 60 °C<br>Temperaturbereich in Betrieb: 0 - 50 °C<br>Luftfeuchtigkeit in Betrieb: 10 - 85%<br>Luftfeuchtigkeit bei Lagerung: 10 - 95%<br><br><b>Gewicht und Abmessungen</b><br>Breite: 243,8 mm<br>Tiefe: 243,8 mm<br><br><b>Sonstige Funktionen</b><br>PCI-Express x4 (Gen 3.x)-Anschlüsse: 1<br>PCI-Express x8 (Gen 3.x)-Anschlüsse: 2<br>Unterstützte DIMM-Modulkapazitäten: 4GB, 8GB, 16GB, 32GB, 64GB<br>Unterstützte LRDIMM Uhr Geschwindigkeiten: 2133,2400,2666 MHz<br>Unterstützte RDIMM Taktraten: 2133,2400,2666 MHz<br>Zahl der DIMM Slots: 4<br>Anzahl unterstützter Prozessoren: 1<br><br>

Prozessorhersteller: Intel

nicht aber die Werte innerhalb <b></b>

habe folgendes Versucht, bringt aber komischerweise nur 3 Einträge, kennt sich jemand auf diesem Planeten damit aus und versteht, was da vor sich geht?

Java:
 String s = productDataItem.getSpecs();
            Pattern p = Pattern.compile("^(<.+>)([a-z A-Z ]+?)(</.+>)$");
            Matcher m = p.matcher(s);
            if (m.matches()) {
                String raw = m.group(3).replaceAll("<b>", "").replaceAll("</b>", "");
                String[] raw1 = raw.split("<br>");
                for (String attKeyValue : raw1) {
                    if (attKeyValue.contains(":") && attKeyValue.equals("") == false) {
                        String[] keyValue = attKeyValue.split(":");
                        map.put(keyValue[0].trim(), keyValue[1].trim());
                    }
                }
            }
 

Robert Zenz

Bekanntes Mitglied
Ehrlich gesagt sehe ich gerade nicht was da das Problem ist, aber ich finde das RegEx-Konstrukt auch relativ komplex fuer etwas was man simpler abbilden kann laut deiner Beschreibung:

Java:
for (String line : source.split("<br>")) {
    if (line.contains(":")) {
        String[] splittedLine = line.split(":");
        
        String key = splittedLine[0].trim();
        String value = splittedLine[1].trim();
        
        System.out.println(key + ": " + value);
    }
}
 

LimDul

Top Contributor
Dein erster Reg-Ex ist komisch. Du suchst nach allen HTML-Markups, wo nur Buchstaben & Leerzeichen drin vorkommen. Das heißt, die meisten Texte solltest du nicht matchen, weil da Umlaute, Zahlen und andere Sonderzeichen drin vorkommen.
 

NicoDeluxe

Top Contributor
versteh ich nicht. Das ist alles eine Zeile wenn ich das ausgeben lasse. Der Zeilenumbruch <br> wird von Java gelesen und erkannt?
 

mrBrown

Super-Moderator
Mitarbeiter
versteh ich nicht. Das ist alles eine Zeile wenn ich das ausgeben lasse. Der Zeilenumbruch <br> wird von Java gelesen und erkannt?
@Robert Zenz trennt explizit an "<br>", und nicht an Zeilenumbrüchen. Das, was dabei raus kommt, sind eben semantisch Zeilen, also macht es Sinn, die Variable line zu nennen, weil es eben ein mensch so sehen würde, wenn er es in formatiert anguckt, auch wenn da kein wirklicher Zeilenumbruch vorliegt.
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
N Gierigen Regex in nicht-gierigen umwandeln Allgemeine Java-Themen 4
N E-Mail Validator (ohne Regex!) Allgemeine Java-Themen 7
NicoDeluxe Regex von bis Allgemeine Java-Themen 6
W Versionsnummer auslesen - Regex ist zickig Allgemeine Java-Themen 2
L RegEx für Teile einer Berechnung Allgemeine Java-Themen 14
G Regex Allgemeine Java-Themen 2
L regex ganzer string? Allgemeine Java-Themen 2
M Geldbetrag mit regex ermitteln. Allgemeine Java-Themen 14
W RegEx Stringliteral finden - Jflex Allgemeine Java-Themen 5
D Regex Probleme Allgemeine Java-Themen 2
Kirby.exe Regex charakter ignorieren Allgemeine Java-Themen 12
S Java SAT (Haltbarkeitsproblem) mit Regex Allgemeine Java-Themen 6
S [Regex] Nur diese Zeichen beachten Allgemeine Java-Themen 1
M Bitte Hilfe mit REGEX (Negieren) Allgemeine Java-Themen 4
J Compilerfehler bis in java.util.regex.Pattern... Allgemeine Java-Themen 2
C PDFBox: Nach RegEx ganze Zeile Allgemeine Java-Themen 4
S Regex mit UND-Verknüpfung Allgemeine Java-Themen 1
P RegEx für Zeiten Allgemeine Java-Themen 7
D Regex: Komplettes Wort bekommen Allgemeine Java-Themen 3
N Operatoren regEx für das Erstellen eines Strings verwenden Allgemeine Java-Themen 3
P RegEx Allgemeine Java-Themen 3
W String Parsen und auf eigenes Muster anwenden (kein Regex) Allgemeine Java-Themen 11
Y regex | n-faches Vorkommen oder gar keins Allgemeine Java-Themen 6
turmaline Regex gegen Regex prüfen Allgemeine Java-Themen 4
HarleyDavidson Regex - Optimierung Allgemeine Java-Themen 4
M Regex für Zahleneingabe in JavaFX Textfield Allgemeine Java-Themen 18
T Best Practice Wortregeln RegEx Allgemeine Java-Themen 11
A ALTER TABLE mit Hilfe von RegEx zerlegen, splitten Allgemeine Java-Themen 5
H Interpreter-Fehler Regex kompiliert nicht Allgemeine Java-Themen 5
M RegEx alle Matches ausgeben Allgemeine Java-Themen 5
Iron Monkey Mit Regex nach Beträge suchen Allgemeine Java-Themen 4
T REGEX Erklaerung Allgemeine Java-Themen 14
T Nur innerhalb des regex-Match ersetzen Allgemeine Java-Themen 9
H Pic Download / Regex Problem Allgemeine Java-Themen 7
F Frage zu Regex möglich Allgemeine Java-Themen 4
M Regex... mal wieder Allgemeine Java-Themen 3
H RegEx - Ersetze alles bis Leerzeichen Allgemeine Java-Themen 5
S regex verbrät CPU Allgemeine Java-Themen 6
V Regex Bereichs Filter Allgemeine Java-Themen 4
127.0.0.1 RegEx _ und 0-9 Allgemeine Java-Themen 45
S Entfernen von allen Nicht-Buchstaben chars aus einem String ohne Regex..? Allgemeine Java-Themen 10
P Java String Regex Allgemeine Java-Themen 2
AyKay Regex XPath Allgemeine Java-Themen 4
C Regex (Case insensitive und Umlaute) Allgemeine Java-Themen 4
D Regex Raute erkennen Allgemeine Java-Themen 2
nrg Zweistelligen Zahlenbereich mit RegEx Allgemeine Java-Themen 8
GilbertGrape Regex-Problem Allgemeine Java-Themen 2
W Denkblockade RegEx Allgemeine Java-Themen 2
S eigene regEx schreiben Allgemeine Java-Themen 4
C Regex expandieren Allgemeine Java-Themen 6
C Regex Überschniedung von Ausdrücken Allgemeine Java-Themen 16
reibi RegEX - Teilstring Allgemeine Java-Themen 6
R Java-RegEx terminiert nicht Allgemeine Java-Themen 3
M Regex: Ich stehe auf dem Schlauch Allgemeine Java-Themen 2
V Kleines Regex-Problem Allgemeine Java-Themen 3
B Regex "Problem" Allgemeine Java-Themen 4
B RegEx: (Um-)formulieren eines Pattern zur Identifizierung komplexer URLs Allgemeine Java-Themen 7
P RegEx mit HTML Parser für Java möglich? Allgemeine Java-Themen 10
J Regex: Fertige URLS aus Javascript Allgemeine Java-Themen 3
N Java regex Allgemeine Java-Themen 5
K Regex JSON Allgemeine Java-Themen 3
J RegEx Ausdruck Allgemeine Java-Themen 2
J Regex: URLS aus CSS Allgemeine Java-Themen 2
G RegEx- Ausdruck Allgemeine Java-Themen 4
G RegEx kein Unterstrich Allgemeine Java-Themen 2
A Text via RegEx durchsuchen und teile ersetzten Allgemeine Java-Themen 5
C Regex: Zahl ohne führende Null Allgemeine Java-Themen 13
W RegEx Zeile parsen Medium Allgemeine Java-Themen 8
X Java String Regex - Sonderzeichen Filtern Allgemeine Java-Themen 5
S Dateiname mit Regex parsen Allgemeine Java-Themen 3
Loyd Noch ne Regex-Frage: Verschachtelte Ausdrücke Allgemeine Java-Themen 4
R Java Regex Frage Allgemeine Java-Themen 17
Daniel_L RegEx-Frage: Ersetzen in UBB ausschließen Allgemeine Java-Themen 2
M Große Datei mit Regex durchsuchen Allgemeine Java-Themen 4
S regex für einen Link Allgemeine Java-Themen 3
E Regex alles nach ? löschen Allgemeine Java-Themen 4
M RegEx-Frage Allgemeine Java-Themen 2
R Regex Tokenizer Allgemeine Java-Themen 11
E Regex HTML Tag und Inhalt löschen Allgemeine Java-Themen 4
H RegEX und eMail Allgemeine Java-Themen 4
L-ectron-X Regex zum Entfernen von mehrzeiligen Kommentaren Allgemeine Java-Themen 2
martin82 Regex - JTable - Filter Allgemeine Java-Themen 10
nrg Kleine Hilfe mit RegEx Allgemeine Java-Themen 2
B Regex-Fehler nach lib-Update Allgemeine Java-Themen 2
K Contrains oder Regex Allgemeine Java-Themen 3
J replaceAll , "[", "]" & regex Allgemeine Java-Themen 12
P RegEx und $-Zeichen als Literal Allgemeine Java-Themen 5
P RegEx - Worte ausschließen Allgemeine Java-Themen 8
S Regex - was isst denn {javaLetter} und {javaDigit}? Allgemeine Java-Themen 2
D Wie werden Regex-Gruppen kompiliert? Allgemeine Java-Themen 2
Stillmatic RegEx Matches ausgeben Allgemeine Java-Themen 10
A Regex gesucht Allgemeine Java-Themen 9
DStrohma [Erledigt] Regex CASE INSENSITIVE Allgemeine Java-Themen 7
T RegEx, wieder einmal ... :-( Allgemeine Java-Themen 19
MQue RegEx Allgemeine Java-Themen 2
F Regex für (+ 2 3) Allgemeine Java-Themen 19
MQue regex Allgemeine Java-Themen 4
M String in numerisch und alphanumerisch trennen mit regex? Allgemeine Java-Themen 2
M id aus HTML (Regex) Allgemeine Java-Themen 7
B benötige regex hilfe Allgemeine Java-Themen 4

Ähnliche Java Themen


Oben