Alle Möglichen Substrings der Länge k aus String extrahieren

Status
Nicht offen für weitere Antworten.

cgnpwr

Mitglied
Hallo Liebe Java-Forum User,

folgendes Problem:

Aus einem String von z.B. 1000 Zeichen will ich z.B. alle Substrings der Länge 5 erhalten. Da es sich teilweise um lange und viele Strings handelt ist die Performance ein entscheidendes Kriterium.

Zur Zeit nutze ich eine Regular Expression und laufe dann per find(i) über alle Positionen. Ich habe aber leider keine Ahnung ob es zum Beispiel günstiger ist Substring zu nutzen oder ob es noch ganz andere Möglichkeiten gäbe ;)

Gibt es geschwindigkeits vorteile der String Operationen wie Substring ? Gibt es onch effektivere andere Methoden ?

Für Vorschläge und Kommentare wäre ich sehr Dankbar !

Freundlichen Gruß,

cgnpwr
 
S

SlaterB

Gast
ich glaube subString ist da sehr effektiv, da der String das gleiche char-Array benutzt, nur mit bestimmten Grenzen,

aber kannst du ja alles testen,

ich schlage ansonsten noch vor, das char[] rauszuholen und dann in einer Schleife jeweils 5 Zeichen in einen StringBuilder zu schreiben,
 

Illuvatar

Top Contributor
Regex dürfte ziemlich langsam sein. Was schnelleres als String#substring kann ich mir nicht vorstellen.
 

eliot

Bekanntes Mitglied
Hmm,

ich weiss nicht, ob das performant ist,
aber ich würde das so lösen (Beispiel Code,
weiss nicht ob er kompilliert):

Code:
String input; //langer String
String dlim = " ";
StringTokenizer tokenizer = new StringTokenizer(inout, delim);
ArrayList<String> arr = new ArrayList<String>();
String tmp;
while(tokenizer.hasNext(){
   tmp = toenizer.next();
   if(tmp.lenght()==5{
      arr.add(tmp);
}
}

Eventuell ein Versuch wert?

regards
eliot
 

cgnpwr

Mitglied
Also erst mal vielen Dank für die schnellen Antworten, ich werde entweder noch heute oder morgen mal die hier angesprochenen Versionen durchtesten und dann nach Möglichkeit berichten !
 

cgnpwr

Mitglied
Hallo hier mal erste Test Ergebnisse,

ich habe zunächst mal nur eine Implementierung mittels SubString gegen die RegularExpression Implemtierung getestet. Die Ergebnisse sind jedoch eindeutig zugunsten von Substring zu sehen:

[Kopie aus der Konsolen Ausgabe:]

Zeichenketten Länge: 1000
Substring Länge: 50
Anzahl der Durchläufe bei denen jeweils alle Substrings gefunden werden: 1000

Ergebnisse:
Substring ist bei 1000 Durchläufen im Durchschnitt (also pro Run !) um:-0.003445938669 [sekunden] schneller

Bei 1000 Durchläufen bedeutet dies in der Summe eine Verbesserung um: -3.445938669 Sekunden
Zeit insgesammt von RegEx Implementierung: 3.510964982
Zeit insgesammt von SubString Implementierung: 0.065026313

Setzt man die Summe der Zeit die die Substring Methode für alle aufrufe Benötigt als 100%
so erhält man das die RegEx Methode um: 53.992988684442246 mal schlechter ist bzw. 5399.298868444224 % schlechter performed.

[Ende der Ausgabe]

Sobald ich etwas Zeit bekomme werde ich noch einen Ausführlicheren Bericht posten, in dem ich auch noch weitere Methoden wie die oben vorgeschlagene String Tokenizer Methode teste....

PS: bitte das die teilweise Auftretenden - Vorzeichen gepflegt ignorieren, ich war zu müde um die Betragsfunktion rauszukramen ;)
 

eliot

Bekanntes Mitglied
Marco13 hat gesagt.:
Das mit dem StringTokenizer wird vmtl. nicht funktionieren. Was auch immer das sollte.

Wieso nicht?
Problemstellung war doch, dass ein String mit 1000 Zeichen in einzelne Strings zu unterteilen
(ein Wort wird durch ein Lerrzeichen getrennt). Aus dieser Menge sollen nur Wörter
der Länge 5 gewählt werden?!
Oder habe da was falsch verstanden?

regards
eliot
 
S

SlaterB

Gast
nein, gefragt war aus "123abcXYZ" alle 5stelligen Teilstrings,
also "123ab", "23abc", "3abcX" usw
 

eliot

Bekanntes Mitglied
SlaterB hat gesagt.:
nein, gefragt war aus "123abcXYZ" alle 5stelligen Teilstrings,
also "123ab", "23abc", "3abcX" usw

Ups, ok,
für dieses Problem ist meine Lösung wohl dann doch keine Lösung ;)
Sorry!

regards
eliot
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
L Alle möglichen Additionen (Rekursiv) Allgemeine Java-Themen 3
B Alle möglichen Buchstabenkombinationen in einem String Allgemeine Java-Themen 7
M alle möglichen Zahlenkombinationen Allgemeine Java-Themen 5
G Alle möglichen Konfigurationen eines Baumes Allgemeine Java-Themen 4
G Alle möglichen Permutationen einer Folge n Allgemeine Java-Themen 3
G Alle Möglichen Kombinationen einer Liste Allgemeine Java-Themen 11
H Alle möglichen Hochkommata ausschließen Allgemeine Java-Themen 6
M Alle möglichen Kombinationen von mehreren Objekten berechnen Allgemeine Java-Themen 6
Zrebna Wie ermittelt man alle testbaren (zu testenden) Klassen in seinem Maven-Projekt? Allgemeine Java-Themen 23
_user_q Alle Kombinationen von "0000" bis "FFFF" kompakt schrieben Allgemeine Java-Themen 13
_user_q JavaFX Robot alle Unicode-Zeichen schreiben lassen können Allgemeine Java-Themen 12
S Bookmark HTML Datei einlesen, alle Links erhalten und manche editieren..? (aktuell JSoup) Allgemeine Java-Themen 4
Sachinbhatt Sind alle Methoden in Java implizit virtuell Allgemeine Java-Themen 2
Kingamadeus2000 Alle mehrfach vorkommenden Buchstaben rekursiv aus einem String entfernen. Allgemeine Java-Themen 6
Drachenbauer wie kann ich alle instanzen einer Klasse durchsehen, ohne, dass diese in einer Liste erzeugt wurden? Allgemeine Java-Themen 11
8u3631984 Generelle Log4j.xml für alle Module Allgemeine Java-Themen 5
L Farbverlauf RGB alle Farben Allgemeine Java-Themen 28
W Server-Thread schreibt nicht alle Dateien Allgemeine Java-Themen 6
S Alle Dateinamen ermitteln Allgemeine Java-Themen 22
F Wie bekommt man alle Filenamen eines Webserver Verzeichnisses Allgemeine Java-Themen 6
S Kann ich eine Methode schreiben die alle Arten von funktionalen Interfaces akzeptiert..? Allgemeine Java-Themen 21
L Operatoren Java Reflections: Alle Methoden einer Klasse aufrufen ohne Exceptions Allgemeine Java-Themen 5
MaxG. Best Practice Alle Kombinationen berechnen Allgemeine Java-Themen 3
J Best Practice Objekt an alle Klassen verteilen ( Discord Bot ) Allgemeine Java-Themen 7
C BufferedReader/BufferedWriter schreibt nicht alle Bytes Allgemeine Java-Themen 2
J Alle Unit Tests in Maven Modul Projekt ausführen Allgemeine Java-Themen 7
S Anwendung die alle Abhaengigkeiten einer Library listet..? Allgemeine Java-Themen 5
T Alle Kombinationen aus zwei Arrays Allgemeine Java-Themen 8
K Nicht alle class-Dateien im JRE? Allgemeine Java-Themen 2
I Alle logs von Logger bekommen Allgemeine Java-Themen 3
U javax.mail.Folder.list() zeigt nicht alle Ordner Allgemeine Java-Themen 5
K Classpath Alle Classen aus einem Package lesen Allgemeine Java-Themen 7
KaffeeFan Methoden replace alle Buchstaben Allgemeine Java-Themen 3
S Alle Methodenaufrufe eines Threads notieren..? Allgemeine Java-Themen 7
U Koordinaten alle Pixel eines Dreiecks zeichnen ausgeben Allgemeine Java-Themen 5
Z Eclipse hängt sich alle paar Sekunden auf (Keine Rückmeldung). Allgemeine Java-Themen 4
Seikuassi Alle Escape-Sequenzen in einem String ersetzen Allgemeine Java-Themen 4
F Java Spintax: Alle Kombinationen Erzeugen Allgemeine Java-Themen 2
Sogomn Klassen Alle in eine Klasse Allgemeine Java-Themen 11
P Methoden Alle Kombinationen aus 2 Karten berechnen Allgemeine Java-Themen 2
B Threads Barrier mit wait()/notify() aber nicht alle Prozesse terminieren Allgemeine Java-Themen 2
S .jar hat nicht alle Klassen ??? Allgemeine Java-Themen 10
T Wie kann ich alle existierenden Java-Klassen anzeigen lassen? Allgemeine Java-Themen 10
M Zufälligen String generieren und alle 5 Minuten ändern Allgemeine Java-Themen 2
M RegEx alle Matches ausgeben Allgemeine Java-Themen 5
A Applet Alle Threads beim schließen des Applets beenden Allgemeine Java-Themen 8
C SwingWorker.cancle(true) tötet alle Worker Allgemeine Java-Themen 3
B Methoden Alle Methoden und Variablen aus Java-Dateien auslesen. Allgemeine Java-Themen 7
T Alle Instancen einer Klasse auflisten Allgemeine Java-Themen 13
S Programm das alle aufgerufenen Methoden ausgibt..? Allgemeine Java-Themen 6
S Alle Kombinationen aus ArrayList - Potenzmenge Allgemeine Java-Themen 7
D Alle Variablen final setzen ? Allgemeine Java-Themen 26
brunothg Alle Kombiationen von n Ziffern Allgemeine Java-Themen 2
M Erste Schritte alle xmlFiles in zugehörige pdfFiles einlesen Allgemeine Java-Themen 4
B Variablen Alle RenderingHints.Keys (KEY_*) in Array + alle RenderingHints.Keys (VALUE_*) in Object[] Allgemeine Java-Themen 8
D generische Klasse für alle Maps (nicht Collections :-)) Allgemeine Java-Themen 11
E Logger loggt nicht alle Level Allgemeine Java-Themen 2
S Aus einer Liste<Oberklasse> alle Elemente die eine bestimmte Unterklasse von Oberklasse haben filter Allgemeine Java-Themen 8
K String: alle X Zeichen Zeilenumbruch Allgemeine Java-Themen 3
F Alle Exceptions abfangen Allgemeine Java-Themen 4
nrg JS als ScriptEngine - alle Punkte ersetzen Allgemeine Java-Themen 4
A Bildschirmauflösung geändert - alle Bildschirminhalte verschoben - was tun? Allgemeine Java-Themen 7
C Alle Klassen eines Packages lesen und instanzieren? Allgemeine Java-Themen 9
B Alle Exceptions auf einmal abfangen Allgemeine Java-Themen 4
S Warum packt er nicht alle Dateien? Allgemeine Java-Themen 13
J Alle Tage eines Jahres Allgemeine Java-Themen 2
AlexSpritze Alle Domains oder FQDN von einem Server erfragen? Allgemeine Java-Themen 2
Spot84 alle kombinationen einer string arraylist Allgemeine Java-Themen 2
S Alle Elemente von zwei Listen vergleichen Allgemeine Java-Themen 10
J Konstrukt um alle Paare und Tripel einer Punkte-Menge bilden Allgemeine Java-Themen 12
P alle zusammanhaengenden teilgraphen Allgemeine Java-Themen 7
A alle nicht-dplikate finden Allgemeine Java-Themen 14
M Wie kann ich alle System.out Strings in ein log window umleiten? Allgemeine Java-Themen 6
E Alle unter Prozesse der beim schließen mit schließen Allgemeine Java-Themen 3
A An alle Cracks: Anwendung beenden mit ShutdownHook? Allgemeine Java-Themen 13
J Logger gibt nicht alle Level aus Allgemeine Java-Themen 3
B in welchem verzeichnis liegen alle installierten klassen? Allgemeine Java-Themen 6
hdi Für alle fleissigen Helfer! Allgemeine Java-Themen 15
N Alle Fehler ausgeben? Allgemeine Java-Themen 4
J Zweiter Prozess der alle x Sekunden etwas abfragen soll Allgemeine Java-Themen 2
O Auf alle Events reagieren Allgemeine Java-Themen 3
B J-Unit Tests. Alle Tests eines Package einsammen. Allgemeine Java-Themen 4
U alle Dateien eines Ordners innerhalb einer JAR auflisten Allgemeine Java-Themen 6
S toString() für alle Member einer Klasse. Allgemeine Java-Themen 6
C Alle Bilder eines binären Arrays ausgeben Allgemeine Java-Themen 3
V Alle Klassen eines Package auflisten? Allgemeine Java-Themen 6
H JTable Löschen [Alle Zeilen aufeinmal Löschen] Allgemeine Java-Themen 6
@ RegEx: Alle Sonderzeichen ausser dem Punkt Allgemeine Java-Themen 4
M Gibt es ein Jar - das alle Componente Automatisch anpasst? Allgemeine Java-Themen 14
K Suche alle Objekte einer bestimmten Klasse Allgemeine Java-Themen 2
N Unter Mac Os X alle laufenden Prozesse ausgeben Allgemeine Java-Themen 3
S Änderung an Proberties datei an alle User weitergeben? Allgemeine Java-Themen 7
P Observer, nicht alle updates bearbeiten Allgemeine Java-Themen 2
der JoJo [TreeSelection] wie bekomme ich alle Elemente Allgemeine Java-Themen 4
G Alle Zeichen des Alphabets ausgeben Allgemeine Java-Themen 4
G Alle Möglichkeiten n Elemente Anzuordnen. Allgemeine Java-Themen 13
0 Alle Teiler einer Zahl performant berechnen? Allgemeine Java-Themen 9
J Funktion alle Möglichkeiten berücksichtigen Allgemeine Java-Themen 5
O Warten bis alle gestarteten Threads beendet sind? Allgemeine Java-Themen 6
G HTML file Alle relativen URL in absolute URL umschreiben? Allgemeine Java-Themen 12

Ähnliche Java Themen

Neue Themen


Oben