das mit der editierung ist so ne sache:
es ist nicht erkennbar, wie genau das gemacht wird, jedoch der geschriebene text steht da drin, aber ich weis jetzt nicht genau wie man den rausliest und vom anderen "müll" unterscheidet.
generell so: datei mittels eines buffered und filereaders zeile für zeile einlesen und den brauchbaren text rausholen, einem string/stringbuffer (da viele änderungen vorgenommen werden, ist der stringbuffer sinnvoll).
aber das ganze im quellcode ist nicht ganz ohne (die trennung von sinnvoll und nichtsinnvoll)