Input/Output 6000 Zeilen einlesen und String-Array vergleichen?

Kel

Aktives Mitglied
Mein Programm läuft und es funktioniert alles so wie es soll - nur leider so langsam, dass ich 3 Minuten für einen Testdurchlauf warten muss.
Hat jemand eine Idee, um das ganze zu beschleunigen?
Gearbeitet wird mit dem JCAS-Framework für semantische Textanalysen.
Die Testdaten von Twitter werden mittels Frameworkfunktionen eingelesen, geparst und dann als "GoldSentiment" (siehe Klasse "Evaluation") eingespeist, daran kann ich nichts rütteln.

Ich habe einmal meine Testdaten von Twitter (.txt) und 2 Wortlisten (.txt).
Die Wortlisten brauche ich als String-Array, um sie mit dem String-Array der Twitterdaten abgleichen zu können :rtfm:.
Wahrscheinlich ist mein Ansatz die 2 Wortlisten in ein String-Array umzuwandeln ineffizient und da kommt ihr ins Spiel :toll:.

Auszug aus einer Wortliste, einfach Zeilenweise runter:
REWARDING
REWARDS
SATISFACTION
SATISFACTORILY
SATISFACTORY



Klasse "SentimentAnalysis":
Java:
package XYZ

import java.util.Collection;
import java.io.File;
import java.util.List;
import org.apache.commons.io.FileUtils;
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import org.apache.uima.analysis_engine.AnalysisEngineProcessException;
import org.apache.uima.cas.CASException;
import org.apache.uima.fit.component.JCasAnnotator_ImplBase;
import org.apache.uima.fit.descriptor.ConfigurationParameter;
import org.apache.uima.fit.util.JCasUtil;
import org.apache.uima.jcas.JCas;
import org.apache.uima.resource.metadata.TypeSystemDescription;

import de.tudarmstadt.ukp.dkpro.core.api.segmentation.type.Token;
import de.unidue.langtech.teaching.pp.type.DetectedSentiment;

public class SentimentAnalysis
    extends JCasAnnotator_ImplBase
    implements Runnable
{
	
	public static final String PARAM_PositiveList = "posList";
	@ConfigurationParameter(name = PARAM_PositiveList, mandatory = true)
	private String posListdic;
	
	public static final String PARAM_NegativeList = "negList";
	@ConfigurationParameter(name = PARAM_NegativeList, mandatory = true)
	private String negListdic;
	
	public static final String PARAM_NeutralList = "neutList";
	@ConfigurationParameter(name = PARAM_NeutralList, mandatory = true)
	private String neutListdic;

    private int posNumber;
    private int negNumber;
    private String[] listePos;
    private String[] listeNeg;
    private File importWordListPos;
    private File importWordListNeg;
    private List<String> importWordListStringPos;
    private List<String> importWordListStringNeg;
	
    @Override
    public void process(JCas jcas)
    		throws AnalysisEngineProcessException
    	    {   	
    	    
    	    Collection<Token> tokens = JCasUtil.select(jcas, Token.class);
    	    DetectedSentiment sentimentAnno = new DetectedSentiment(jcas);
    	    	
    	    // Variablentyp "FILE"
    	    importWordListPos = new File(posListdic);
    	    importWordListNeg = new File(negListdic);
    	        
    	    // Positiv/Negativ-Files in List<String> umwandeln
    	    importWordListStringPos = WordListRead(importWordListPos);
    	    importWordListStringNeg = WordListRead(importWordListNeg);
    	         
    	    // List<String> in String[]-Array umwandeln
    	    listePos = listenParsen(importWordListStringPos);
    	    listeNeg = listenParsen(importWordListStringNeg);

    	    // Collection<Token> tokens iterieren lassen
    	    // Abgleich von 'token' und der gesamten Positiv/Negativ-Liste + Counter jeweils hochzählen bei Treffer
    	    posNumber = tokenAbgleichWordList(tokens, listePos);
    	    negNumber = tokenAbgleichWordList(tokens, listeNeg);		
    	    
    	    // Counter auswerten = Sentiment setzen und zum Index hinzufügen
    		counter(posNumber, negNumber, sentimentAnno);
    	    }
    	         
	public void run() {
	
	}
                    
   // File in List<String>-Objekt umwandeln
    public List<String> WordListRead(File file) {
    	
    List<String> importWordList = null;
    try {
		importWordList = FileUtils.readLines(file);
	} catch (IOException e) {
		// TODO Auto-generated catch block
		e.printStackTrace();
	}
    return importWordList;
   }
   
   // List<String> in ein String[]-Array umwandeln
   public String[] listenParsen(List<String> importWordList) {
   	String[] liste = new String[importWordList.size()];
    	for (int i = 0; i < importWordList.size(); i++) {
    		liste[i] = importWordList.get(i);
    	}
   	return liste;
   }
   
   // Durch Collection<token> iterieren und Counter hochzählen
   public int tokenAbgleichWordList(Collection<Token> tokens, String[] listePos) {
   	int number = 0;
   	for (Token token : tokens) {
    		for (int i = 0; i < listePos.length; i++) {
    			if (token.getCoveredText().toLowerCase().equals((listePos[i]).toLowerCase())) {
    			number++;
    			}		
    		}	
    	}
   	return number;
   }
   
   public void counter(int pos, int neg, DetectedSentiment sentimentAnno) {
   	if (pos > neg) {
 		sentimentAnno.setSentiment("positive");
 		sentimentAnno.addToIndexes();
 	}
 	if (neg > pos) {
 		sentimentAnno.setSentiment("negative");
 		sentimentAnno.addToIndexes();
 	}
 	if (pos == neg) {
 		sentimentAnno.setSentiment("neutral");
 		sentimentAnno.addToIndexes();
 	}
}
   }

Danach wird das hier aufgerufen in der Klasse "Evaluation" (macht das JCAS-Framework automatisch):
Java:
public void process(JCas jcas)
        throws AnalysisEngineProcessException
    {
        nrOfDocuments++; 
        
        DetectedSentiment detected = JCasUtil.selectSingle(jcas, DetectedSentiment.class);
        GoldSentiment actual = JCasUtil.selectSingle(jcas, GoldSentiment.class);
        // gibt "richtiges Sentiment (Goldsentiment) = wahrscheinliches Sentiment aus
        // System.out.println(actual.getSentiment() + " detected as " + detected.getSentiment());
        
        if (detected.getSentiment().equals(actual.getSentiment())) {
            correct++;
            // gibt den aktuellen Counter = Anzahl richtig erkannter Sentiments aus
            System.out.println(correct);
        }
    }
 
Zuletzt bearbeitet:
Ähnliche Java Themen
  Titel Forum Antworten Datum
H Leere Zeilen in Textdatei löschen lassen Java Basics - Anfänger-Themen 5
Saiko Zeilen einer Datei einlesen Java Basics - Anfänger-Themen 3
districon 2D Array - Zeilen und Spalten durchsuchen Java Basics - Anfänger-Themen 3
dieter000 Kurze Frage kann mir ejmand kurz diesen Code erklären, bzw wie man die zeilen erklärt und so Java Basics - Anfänger-Themen 1
s_1895 zu viele Zeilen in der Main Methode Java Basics - Anfänger-Themen 4
W Anzahl der Zeilen ausgeben lassen Java Basics - Anfänger-Themen 20
crrnogorka Letzte Zeile einer Tabelle "überschreibt" alle anderen Zeilen Java Basics - Anfänger-Themen 1
X Textdatei: zwei-zeilenweise gleiche Zeilen rausschmeißen Java Basics - Anfänger-Themen 21
A Jede x-te Zeile, lösche 10 Zeilen Java Basics - Anfänger-Themen 9
das_leon Alle Zeilen einer CSV-Datei auslesen Java Basics - Anfänger-Themen 1
C Zeilen aus einer Datei in Array speichern Java Basics - Anfänger-Themen 4
F Mehrere Zeilen zu einer Zeile zusammenfügen und in eine Datei schreiben Java Basics - Anfänger-Themen 1
A String mit mehreren Zeilen splitten Java Basics - Anfänger-Themen 4
S Java Text splitten mit Tabs, Zeilen, Zeichen und Klammern. Java Basics - Anfänger-Themen 6
D JTable Zeilen löschen Java Basics - Anfänger-Themen 5
H Best Practice JavaFX TableView mit Zell-Rahmen anstelle von Zeilen-Balken Java Basics - Anfänger-Themen 1
V Ergebnisse in 2 Zeilen Java Basics - Anfänger-Themen 4
R Eine Datei mit mehreren Zeilen beschreiben Java Basics - Anfänger-Themen 5
C Zeilen in Array einlesen und splitten? Java Basics - Anfänger-Themen 17
T Zeilen des ListArray nach einem Wort durchsuchen und diese Zeile ausgeben Java Basics - Anfänger-Themen 4
T Exceptions - ausgeführte Zeilen Java Basics - Anfänger-Themen 4
M Input/Output Alle Zeilen auslesen und in Variable speichern Java Basics - Anfänger-Themen 5
X wie kann ich in bluej/java einene 2d array mit zahlen fuellen, so dass sich diese in der der zeilen Java Basics - Anfänger-Themen 2
J Zeilen aus einer .txt-Datei auslesen und Variablen zuweisen Java Basics - Anfänger-Themen 11
F Problem mit Tabulatoren bei Zeilen zählen einer Textdatei Java Basics - Anfänger-Themen 17
F Textdatei einlesen und Zeilen zählen Java Basics - Anfänger-Themen 10
M Array: Zeilen vergleichen Java Basics - Anfänger-Themen 4
J Klassen Hilfe bei unbekannten Zeilen bzgl. Klassen / Komponenten Java Basics - Anfänger-Themen 12
T JTable einzelne Zeilen löschen Java Basics - Anfänger-Themen 3
L String extrahieren mit Regular Expression über mehrere Zeilen hinweg Java Basics - Anfänger-Themen 1
T CSV auf Inhalt und Zeilen überprüfen Java Basics - Anfänger-Themen 2
I Datei mit 2 Spalten und millionen Zeilen Java Basics - Anfänger-Themen 19
kaoZ Input/Output Einlesen von mehreren Zeilen Java Basics - Anfänger-Themen 4
J Zeilen unsichtbar Java Basics - Anfänger-Themen 11
3 JLabel - Text in mehreren Zeilen zentrieren Java Basics - Anfänger-Themen 5
L Split + Zeilen einer Datei mit bestimmtem Inhalt löschen Java Basics - Anfänger-Themen 23
V Methoden Zeilen nach bestimmtem Attribut sortieren Java Basics - Anfänger-Themen 4
M Einzelne Zeilen nach Zeichen auslesen Java Basics - Anfänger-Themen 4
T Methoden HILFE! readLine() liest nur ungerade Zeilen?? Java Basics - Anfänger-Themen 2
G JTextArea: nur bestimmte Zeilen anders formatieren Java Basics - Anfänger-Themen 7
B Input/Output bestimmte Zeilen in .txt Dateinen überschreiben Java Basics - Anfänger-Themen 20
G 3422 Zeilen in Eclipse Console Java Basics - Anfänger-Themen 5
L Zeilen und Spalten sortieren Java Basics - Anfänger-Themen 11
K Erste Schritte Eingabetext besteht aus mehreren Zeilen? Java Basics - Anfänger-Themen 3
T BufferedReader mehrere Zeilen einlesen Java Basics - Anfänger-Themen 4
B Zählen bestimmter Zeilen einer .txt Java Basics - Anfänger-Themen 7
N Zeilen vergleichen Java Basics - Anfänger-Themen 7
N Datei mit max 2000 Zeilen schreiben Java Basics - Anfänger-Themen 9
D Input/Output Zeilen aus txt-datei in Java-Liste einfügen Java Basics - Anfänger-Themen 9
K BufferedWriter schreibt die letzten paar Zeilen nicht Java Basics - Anfänger-Themen 5
R Erste Schritte 2D-Array: Zeilen & Spalten ohne schleife übergeben? Java Basics - Anfänger-Themen 3
C Mehrere Zeilen unter ~.showMessageDialog Java Basics - Anfänger-Themen 12
K Java Split mehrere Zeilen Java Basics - Anfänger-Themen 4
H 200000 Zeilen aus Datei einlesen Java Basics - Anfänger-Themen 13
Q LogFile.log einlesen und Werte zwischen 5 zeilen vergleichen Java Basics - Anfänger-Themen 5
P Bestimmte Zeilen einer Datei ermitteln ? Java Basics - Anfänger-Themen 30
B JList und JTable: leere Zeilen bei listfiles(); Java Basics - Anfänger-Themen 5
M Zeilen aus String exportieren Java Basics - Anfänger-Themen 5
P Unterschied dieser 2 code Zeilen Java Basics - Anfänger-Themen 12
A Anzahl Zeilen eines Arrays bestimmen Java Basics - Anfänger-Themen 10
J Zeilen eines Arrays vergleichen Java Basics - Anfänger-Themen 2
S .txt einlesen->Zeilen ersetzen->neu.txt speichern Java Basics - Anfänger-Themen 13
R String über mehrere Zeilen Java Basics - Anfänger-Themen 15
M Verständnis einiger Zeilen Java Basics - Anfänger-Themen 4
E Array mit Zahlen von 1-(Zeilen*Spalten) befüllen Java Basics - Anfänger-Themen 8
S Zeilen zählen Java Basics - Anfänger-Themen 7
Ollek Bestimmte Zeilen aus einer HTML Datei lesen Java Basics - Anfänger-Themen 8
C Zeilen aus einer Datei auslesen Java Basics - Anfänger-Themen 4
H String/StringBuffer nach zeilen aufteilen Java Basics - Anfänger-Themen 2
K Wie kann ich alle Zeilen in eineR Datenbank zählen? Java Basics - Anfänger-Themen 13
JFeel-x Zeilen eines JEditorPanes Java Basics - Anfänger-Themen 2
0 CSV Import - Zeilen, Spalten Java Basics - Anfänger-Themen 15
O 2D Array - Zeilen-/Spaltenlänge ermitteln Java Basics - Anfänger-Themen 4
P String über mehrere Zeilen definieren Java Basics - Anfänger-Themen 3
G Datei zeilen anhängen Java Basics - Anfänger-Themen 3
A Scanner liest nur 999 Zeilen ein Java Basics - Anfänger-Themen 5
B Zeilen in Textdatei löschen Java Basics - Anfänger-Themen 2
D Datei einlesen, zeilen ignorieren, probleeem Java Basics - Anfänger-Themen 7
A Anzahl der Zeilen in Textdatei Java Basics - Anfänger-Themen 7
G Zeilen in Eclipse einblenden Java Basics - Anfänger-Themen 2
M Zeilen aus Textdatei in Array schreiben Java Basics - Anfänger-Themen 2
M Zeilen auslesen Java Basics - Anfänger-Themen 12
H Streams etc. erster Versuch Zeilen aus einer Datei zu lesen Java Basics - Anfänger-Themen 6
L In einer Tabelle Zeilen loeschen Java Basics - Anfänger-Themen 4
D Auf Zeilen eines zweidimensionalen Arrays zugreifen Java Basics - Anfänger-Themen 3
D txt nach Zeilen splitten. Java Basics - Anfänger-Themen 9
G Anzahl der Zeilen in einer Datei Java Basics - Anfänger-Themen 7
T die letzten X zeilen einer datei entfernen Java Basics - Anfänger-Themen 19
E was bedeuten @Zeilen Java Basics - Anfänger-Themen 4
T Einlesen von einzelnen Zeilen Java Basics - Anfänger-Themen 2
T null-Zeilen aus einem Array entfernen Java Basics - Anfänger-Themen 4
E Automatischer Zeilen-Umbruch bei JTextArea Java Basics - Anfänger-Themen 4
G zeilen aus text datei löschen Java Basics - Anfänger-Themen 6
G CSV auslesen und Zeilen in Array speichern Java Basics - Anfänger-Themen 13
ARadauer zeilen einer text datei ermitteln Java Basics - Anfänger-Themen 6
S Anzahl von zeilen einer Datei bestimmen. Java Basics - Anfänger-Themen 4
J Tabelle mit mehreren Zeilen dynamisch aufbauen Java Basics - Anfänger-Themen 2
F Zeilen und Spalten in JTable Selektieren Java Basics - Anfänger-Themen 2
S In einer CSV Datei leere Zeilen ignorieren Java Basics - Anfänger-Themen 6
W int aus Zeilen einer Textdatei Java Basics - Anfänger-Themen 3

Ähnliche Java Themen

Neue Themen


Oben