Text verkleinern/komprimieren

Status
Nicht offen für weitere Antworten.

najjannaj

Aktives Mitglied
Hallo habe mir folgenden Code geschrieben:


Code:
public class textkomp2 {

	public static void main(String[] args) {
		String string = "TTTTEEEsst";
		String result = pack(string);
		System.out.println(result);
	}
	public static String pack(String string){ 
	      int index = 0; 
	      StringBuffer result = new StringBuffer(); 
	       
	      for(int i = 0, n = string.length(); i<n; i++){ 
	         if(string.charAt(index) != string.charAt(i)){
	        	if(i-index != 1){
	        		result.append(i-index); 
	        	}
	            result.append(string.charAt(index)); 
	            index = i; 
	         } 
	      } 
	      if(string.length()-index != 1){
	    	  result.append(string.length()-index);
	      }
	      result.append(string.charAt(index)); 
	       
	      return result.toString(); 
	   }
}


Das macht aus dem String "TTTTEEEsst" -> "4T3E2st"! Nicht sehr effektiv reicht mir aber zum rumbasteln. Jetzt muss ich das ganze nur noch wieder rückgänig bekommen und da happert es momentan an einer fernüntigen Idee und der Umsetzung. Könnte mir da jemand weiterhelfen bzw. hat da einer ne Idee?

Mit freundlichen Grüßen
najjannaj
 

KISS

Bekanntes Mitglied
deine strings lassen sich leider nicht deterministisch entpacken sobald zahlen in dem ursprungsstring verwendet werden
 

KISS

Bekanntes Mitglied
naja, nimm nen zipstream *g*
wenn du wirklich mit dem algo spielen willst, dann google mal nach lempel ziff welch oder markov

wenn du wirklich mit deinem beispiel weiter machen willst, musst du immer ein zahl setzen, also zb

f(TTTTEESST)=4T3E2S1T, ich rate dir aber es andersrum zu schreiben (T4E3S2T1) da sich das format leichter handlen laesst
 

najjannaj

Aktives Mitglied
Das mit denn Zahlen hab ich auch so gemacht! Aber bei dem Wort "Test" kommt nun "1T1e1s1t" raus das ist doppelt so lange wie vorher :( Also vergrößerst sich das! Naja, egal! Dann lass ich es eben!
 

Sky

Top Contributor
najjannaj hat gesagt.:
Das mit denn Zahlen hab ich auch so gemacht! Aber bei dem Wort "Test" kommt nun "1T1e1s1t" raus das ist doppelt so lange wie vorher :( Also vergrößerst sich das! Naja, egal! Dann lass ich es eben!
Nochmal der Hinweis: zipstream
 

KISS

Bekanntes Mitglied
tja, die komprimierung ist so eine geschichte. mit sehr kurzen daten hat man bei den meisten algorithmen das problem das sich die entrophi erhoeht.
 

Bleiglanz

Gesperrter Benutzer
vor allem dürfen keine zwei Codewörter den gleichen anfang haben

T44

kann ja aus

TTTT4

oder

TTTTTT...44mal..TTTT

entstanden sein :)

so einfach geht das leider nicht
 

KISS

Bekanntes Mitglied
stimmt, eigentlich muesste man die tupel noch trennen, oder aber nur einstellige rle tags zulassen
 

Karl

Aktives Mitglied
Hallo,

wenn das Risiko groß ist, dass der String sich verlängert),
könnte es sinnvoll sein, grundsätzlich ein Zeichen als Flag zu "opfern".

Beispiel:
komprimierter String ...
... beginnt mit 0 --> Rest ist unkomprimiert,
... beginnt mit 1 --> Rest ist komprimiert
... beginnt mit was anderem --> StreamCorruptedException
... ist leer --> leer
... ist null --> null

Nach einer Kompression wird jeweils geprüft, ob das Ergebnis länger ist als der Eingangsstring und dann auf
'0' + str ausgewichen, sonst wird eine '1' für Kompression vor das Komprimat gesetzt.

Nochwas zur zip-Kompressionsidee: Prinzipiell kein Problem. Das Ergebnis ist aber ein Byte-Stream/ByteArray). Es ist in Java nicht ganz trivial, binäre Daten in einem String zu parken (klang so als wolltest Du als Ergebnis wieder einen String), der Header ist auch nicht gerade klein.

Gruß,
Karl
 

KISS

Bekanntes Mitglied
Also sooo unkomfortabbel ist das arbeiten mit byteAarrays nun auch nicht.
als kleines beispiel

Code:
public static void main(String[] args) throws IOException
    {
        test("Pack mich, ich mag das"); //$NON-NLS-1$
        System.out.println("------------------------"); //$NON-NLS-1$
        test("ein etwas laneger string, hoffentlich reicht es jetzt um mal wirklich zu komprimieren, lalalal daddel daddel asdpfomökydbnsdfghksdfngksdfnvkdfnvklsdfnvlksdfnvlksdfnvlkdsfnvlkjdsfnvlkjdsfvnlkjsdfnvfldksnvlksfdjnvsfdkljnvkjldfvn"); //$NON-NLS-1$
        
    }

    private static void test(final String input) throws IOException
    {
        System.out.println("orginal("+input.length()+"):\t"+input); //$NON-NLS-1$ //$NON-NLS-2$
        final ByteArrayOutputStream buffer=new ByteArrayOutputStream();
        final DeflaterOutputStream out=new GZIPOutputStream(buffer);
        out.write(input.getBytes());
        out.flush();
        out.close();
        final byte[] encoded = buffer.toByteArray();
        System.out.println("encoded("+encoded.length+"):\t"+Arrays.toString(encoded)); //$NON-NLS-1$ //$NON-NLS-2$
        final InflaterInputStream in=new GZIPInputStream(new ByteArrayInputStream(encoded));
        buffer.reset();
        while(in.available()>=1)
        {
            final int size=in.read(encoded,0,1); // geth nur bytewise, siehe doc zu available
            if(size>0)
            {
                buffer.write(encoded, 0, size);
            }
        }
        final String result = new String(buffer.toByteArray());
        System.out.println("result:\t"+result); //$NON-NLS-1$
    }
 

Icewind

Bekanntes Mitglied
bei text würd ich mal prinzipiell zu einer wörterbuchkompression raten... und da hast du auch noch einiges zu tun wenn du das selber schreiben willst ;)
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
C EML Email Text in String wandeln Allgemeine Java-Themen 10
O Text aus einer Textdatei rausholen, der zwischen zwei Schlüsselworten steht Allgemeine Java-Themen 4
K Bildschirm auslesen/ Text erkennen Allgemeine Java-Themen 5
berserkerdq2 Text über einen Shape anzeigen (Scenebuilder) Allgemeine Java-Themen 1
M Thymeleaf th value und th text Allgemeine Java-Themen 1
_user_q Eingegebenen Text Zeile für Zeile ausgeben lassen Allgemeine Java-Themen 11
_user_q Eingegebenen Text wiederholt schreiben lassen Allgemeine Java-Themen 9
G Darstellung von Text auf MapContext von GeoTools Allgemeine Java-Themen 2
Alex_99 Programm stürzt beim Aufruf der Funktion ab? Text ausgeben Allgemeine Java-Themen 45
Mozart53 JLabel nur meinen Text verschieben ohne Image Allgemeine Java-Themen 3
izoards Bestimmter Text aus PDF extrahieren Allgemeine Java-Themen 3
B Scanner erkennt keinen Text in Textdatei, obwohl welcher drinsteht Allgemeine Java-Themen 10
K HTMLEditor HTML Text in Rich Text umwandeln Allgemeine Java-Themen 14
kodela JDialog zeigt Text nicht an Allgemeine Java-Themen 5
L Text filtern Allgemeine Java-Themen 1
Bluedaishi TEXT Kodierung Allgemeine Java-Themen 3
J Die Letzte Zahl aus einer Text datei lesen Allgemeine Java-Themen 8
S Ini Text aus String parsen Allgemeine Java-Themen 1
M itext - Button der Text in Zwischenablage stellt Allgemeine Java-Themen 0
E CSV mit Text und Binärdaten auslesen Allgemeine Java-Themen 7
FRI3ND Datentypen Date-Array sortieren - Text mitnehmen? Allgemeine Java-Themen 7
I Text suchen und ersetzen im Word Dokument Allgemeine Java-Themen 3
windl Text mining / deep learning Allgemeine Java-Themen 0
I Text aus Input-Box entnehmen und zuweisen Allgemeine Java-Themen 1
KeexZDeveoper Text Mining Allgemeine Java-Themen 3
L Input/Output Wie kann man in der Konsole einen Text farbig ausgeben z.b in grün Allgemeine Java-Themen 6
B Arrays mit Text und Zahlen füllen Allgemeine Java-Themen 3
A Datenexport (Text und Draw) Allgemeine Java-Themen 1
L Text von txt auf JTextArea Allgemeine Java-Themen 4
N Das Ende von bestimmten zeilen in text datei ändern und speichern Allgemeine Java-Themen 3
A 2D-Grafik Text in ein Bild schreiben Allgemeine Java-Themen 11
T Textarea text wird immer überschrieben Allgemeine Java-Themen 4
I Apache POI Word Text einfügen Allgemeine Java-Themen 26
T itext: text in ein textfeld hinzufügen Allgemeine Java-Themen 2
B Farbiger Text in der Konsole Allgemeine Java-Themen 1
K Pdf mit dynamischem Text mit iText Allgemeine Java-Themen 0
D Text Analyzer Allgemeine Java-Themen 2
RalleYTN Audiodatein(.ogg/.wav) in Text konvertieren Allgemeine Java-Themen 0
L Nach Button drücken den Text festspeichern Allgemeine Java-Themen 9
X Löschen von einer Zeile in einer Text Datei. Klappt nicht. Allgemeine Java-Themen 4
J Text lesen und in Variablen speichern Allgemeine Java-Themen 3
S Text in mehreren Sprachen korrekt darstellen? Wie waehle ich die Fonts aus..? Allgemeine Java-Themen 0
J Java - Zeile aus Text datei löschen Allgemeine Java-Themen 13
M Text in erstelltes Excelfile schreiben Allgemeine Java-Themen 6
N Input/Output Website Text auslesen und bestimmte Zeilen wiedergeben Allgemeine Java-Themen 4
W Arraylist Text Suchen und Datei löschen Allgemeine Java-Themen 5
P HTML Text bearbeiten Allgemeine Java-Themen 1
B JFrame Text Ausgabe Allgemeine Java-Themen 7
G Makierter Text in Arbeitsspeicher Allgemeine Java-Themen 2
B Text in die Mitte der Konsole schreiben. Allgemeine Java-Themen 1
M Variablen Variablen in Text einbinden Allgemeine Java-Themen 5
P iText Text zentrieren Allgemeine Java-Themen 3
J Verschlüsselung von Text? Allgemeine Java-Themen 2
M Text datei in java jar datei einbinden Allgemeine Java-Themen 4
S Swing Text in eine JTextArea schreiben Allgemeine Java-Themen 17
M Verschlüsselung von Text und Files durch RSA (Encoding Problem) Allgemeine Java-Themen 7
S Robuste Methode um Text von HTML code zu extrahieren..? Allgemeine Java-Themen 6
achillesat Rich Text Editor Allgemeine Java-Themen 2
M CMD-Text anzeigen Allgemeine Java-Themen 10
G Text Mining Allgemeine Java-Themen 7
B Text auf Standarddrucker drucken Allgemeine Java-Themen 3
S Library fuer Internet-Text-Daten-Quellen..? Allgemeine Java-Themen 8
nrg Find and replace Text docx Allgemeine Java-Themen 6
M Ein bestimmtes Wort in einem Text zählen (String in String) Allgemeine Java-Themen 9
S Text in for Schleife in Label einfügen Allgemeine Java-Themen 4
M Funktion gesucht: Text vektorisieren Allgemeine Java-Themen 20
D Wort in Text mit >100.000 Wörter finden Allgemeine Java-Themen 7
B Text wird nicht richtig angezeigt Allgemeine Java-Themen 9
Q Text Datei einlesen Allgemeine Java-Themen 27
N .doc text ändern Allgemeine Java-Themen 12
R Komponente hat nicht die gesetzten Eingeschaften (Text, Farbe) Allgemeine Java-Themen 3
M NOA an den Source Text des Dokumentes kommen Allgemeine Java-Themen 7
A Text via RegEx durchsuchen und teile ersetzten Allgemeine Java-Themen 5
O Text mit Wildcard gegen regulären Ausdruck prüfen Allgemeine Java-Themen 3
A Umwandlung von Text/Zeichen in Polynome Allgemeine Java-Themen 8
Y Eclipse ppt Folie erzeugen + text plazieren Allgemeine Java-Themen 4
cedi Eingegebenen Text in der Konsole nicht sichtbar machen oder nur in Sternchen anzeigen Allgemeine Java-Themen 2
D markierten Text kopieren Allgemeine Java-Themen 2
P Doppeltverkettete Listen + Text Allgemeine Java-Themen 5
DEvent embedded Object Database in Text Format Allgemeine Java-Themen 5
C Datei als ASCII text einlesen ? Allgemeine Java-Themen 16
R Texterkennung - Text aus einem/r Bild/Grafik auslesen Allgemeine Java-Themen 2
M String in Html Text umwandeln Allgemeine Java-Themen 2
T eingefügter Text nach dem rendern spiegelverkehrt Allgemeine Java-Themen 2
lumo encoding einer text-datei Allgemeine Java-Themen 2
E Text ans Ende einer Textdatei anfügen Allgemeine Java-Themen 2
E JTextArea / JEditorPane + Text formatieren Allgemeine Java-Themen 3
R Java Text anderer Schriftart einlesen Allgemeine Java-Themen 2
A AES Key aus Text erzeugen Allgemeine Java-Themen 2
S Koordinaten aus einem Text filtern Allgemeine Java-Themen 11
turmaline Text aus Web-Seiten auslesen Allgemeine Java-Themen 1
MQue Graphics2D Text Allgemeine Java-Themen 2
U Text verschmelzen Allgemeine Java-Themen 8
martin82 Java-Code aus Text-Datei parsen Allgemeine Java-Themen 3
W Text curser auswählen für Paste Allgemeine Java-Themen 15
G HTML-Datei einlesen, Plain Text in Textfile speichern Allgemeine Java-Themen 4
S Bestes Text file encoding..? Allgemeine Java-Themen 36
B UTF-8 Text Allgemeine Java-Themen 3
H Passwortgschützter Text Allgemeine Java-Themen 13
C IReport Feldberechnen und als Text ausgeben Allgemeine Java-Themen 4

Ähnliche Java Themen

Neue Themen


Oben