Input/Output 6000 Zeilen einlesen und String-Array vergleichen?

Kel · 14. Mrz 2014

Mein Programm läuft und es funktioniert alles so wie es soll - nur leider so langsam, dass ich 3 Minuten für einen Testdurchlauf warten muss.
Hat jemand eine Idee, um das ganze zu beschleunigen?
Gearbeitet wird mit dem JCAS-Framework für semantische Textanalysen.
Die Testdaten von Twitter werden mittels Frameworkfunktionen eingelesen, geparst und dann als "GoldSentiment" (siehe Klasse "Evaluation") eingespeist, daran kann ich nichts rütteln.

Ich habe einmal meine Testdaten von Twitter (.txt) und 2 Wortlisten (.txt).
Die Wortlisten brauche ich als String-Array, um sie mit dem String-Array der Twitterdaten abgleichen zu können :rtfm:.
Wahrscheinlich ist mein Ansatz die 2 Wortlisten in ein String-Array umzuwandeln ineffizient und da kommt ihr ins Spiel :toll:.

Auszug aus einer Wortliste, einfach Zeilenweise runter:

REWARDING
REWARDS
SATISFACTION
SATISFACTORILY
SATISFACTORY

Klasse "SentimentAnalysis":

Java:

package XYZ

import java.util.Collection;
import java.io.File;
import java.util.List;
import org.apache.commons.io.FileUtils;
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import org.apache.uima.analysis_engine.AnalysisEngineProcessException;
import org.apache.uima.cas.CASException;
import org.apache.uima.fit.component.JCasAnnotator_ImplBase;
import org.apache.uima.fit.descriptor.ConfigurationParameter;
import org.apache.uima.fit.util.JCasUtil;
import org.apache.uima.jcas.JCas;
import org.apache.uima.resource.metadata.TypeSystemDescription;

import de.tudarmstadt.ukp.dkpro.core.api.segmentation.type.Token;
import de.unidue.langtech.teaching.pp.type.DetectedSentiment;

public class SentimentAnalysis
    extends JCasAnnotator_ImplBase
    implements Runnable
{
	
	public static final String PARAM_PositiveList = "posList";
	@ConfigurationParameter(name = PARAM_PositiveList, mandatory = true)
	private String posListdic;
	
	public static final String PARAM_NegativeList = "negList";
	@ConfigurationParameter(name = PARAM_NegativeList, mandatory = true)
	private String negListdic;
	
	public static final String PARAM_NeutralList = "neutList";
	@ConfigurationParameter(name = PARAM_NeutralList, mandatory = true)
	private String neutListdic;

    private int posNumber;
    private int negNumber;
    private String[] listePos;
    private String[] listeNeg;
    private File importWordListPos;
    private File importWordListNeg;
    private List<String> importWordListStringPos;
    private List<String> importWordListStringNeg;
	
    @Override
    public void process(JCas jcas)
    		throws AnalysisEngineProcessException
    	    {   	
    	    
    	    Collection<Token> tokens = JCasUtil.select(jcas, Token.class);
    	    DetectedSentiment sentimentAnno = new DetectedSentiment(jcas);
    	    	
    	    // Variablentyp "FILE"
    	    importWordListPos = new File(posListdic);
    	    importWordListNeg = new File(negListdic);
    	        
    	    // Positiv/Negativ-Files in List<String> umwandeln
    	    importWordListStringPos = WordListRead(importWordListPos);
    	    importWordListStringNeg = WordListRead(importWordListNeg);
    	         
    	    // List<String> in String[]-Array umwandeln
    	    listePos = listenParsen(importWordListStringPos);
    	    listeNeg = listenParsen(importWordListStringNeg);

    	    // Collection<Token> tokens iterieren lassen
    	    // Abgleich von 'token' und der gesamten Positiv/Negativ-Liste + Counter jeweils hochzählen bei Treffer
    	    posNumber = tokenAbgleichWordList(tokens, listePos);
    	    negNumber = tokenAbgleichWordList(tokens, listeNeg);		
    	    
    	    // Counter auswerten = Sentiment setzen und zum Index hinzufügen
    		counter(posNumber, negNumber, sentimentAnno);
    	    }
    	         
	public void run() {
	
	}
                    
   // File in List<String>-Objekt umwandeln
    public List<String> WordListRead(File file) {
    	
    List<String> importWordList = null;
    try {
		importWordList = FileUtils.readLines(file);
	} catch (IOException e) {
		// TODO Auto-generated catch block
		e.printStackTrace();
	}
    return importWordList;
   }
   
   // List<String> in ein String[]-Array umwandeln
   public String[] listenParsen(List<String> importWordList) {
   	String[] liste = new String[importWordList.size()];
    	for (int i = 0; i < importWordList.size(); i++) {
    		liste[i] = importWordList.get(i);
    	}
   	return liste;
   }
   
   // Durch Collection<token> iterieren und Counter hochzählen
   public int tokenAbgleichWordList(Collection<Token> tokens, String[] listePos) {
   	int number = 0;
   	for (Token token : tokens) {
    		for (int i = 0; i < listePos.length; i++) {
    			if (token.getCoveredText().toLowerCase().equals((listePos[i]).toLowerCase())) {
    			number++;
    			}		
    		}	
    	}
   	return number;
   }
   
   public void counter(int pos, int neg, DetectedSentiment sentimentAnno) {
   	if (pos > neg) {
 		sentimentAnno.setSentiment("positive");
 		sentimentAnno.addToIndexes();
 	}
 	if (neg > pos) {
 		sentimentAnno.setSentiment("negative");
 		sentimentAnno.addToIndexes();
 	}
 	if (pos == neg) {
 		sentimentAnno.setSentiment("neutral");
 		sentimentAnno.addToIndexes();
 	}
}
   }

Danach wird das hier aufgerufen in der Klasse "Evaluation" (macht das JCAS-Framework automatisch):

Java:

public void process(JCas jcas)
        throws AnalysisEngineProcessException
    {
        nrOfDocuments++; 
        
        DetectedSentiment detected = JCasUtil.selectSingle(jcas, DetectedSentiment.class);
        GoldSentiment actual = JCasUtil.selectSingle(jcas, GoldSentiment.class);
        // gibt "richtiges Sentiment (Goldsentiment) = wahrscheinliches Sentiment aus
        // System.out.println(actual.getSentiment() + " detected as " + detected.getSentiment());
        
        if (detected.getSentiment().equals(actual.getSentiment())) {
            correct++;
            // gibt den aktuellen Counter = Anzahl richtig erkannter Sentiments aus
            System.out.println(correct);
        }
    }

Beatsleigher · 16. Mrz 2014

Schau dir mal dieses Programm an, ist von mir, da ist auch die Source drin. Vielleicht findest du ja was nützliches: Bukkit Log Viewer | Free software downloads at SourceForge.net

	Titel	Forum	Antworten	Datum
G	JList Zeilen-Index währen DropTarget auswerfen.	Java Basics - Anfänger-Themen	3	8. Nov 2024
H	Leere Zeilen in Textdatei löschen lassen	Java Basics - Anfänger-Themen	5	10. Sep 2023
	Zeilen einer Datei einlesen	Java Basics - Anfänger-Themen	3	7. Apr 2022
	2D Array - Zeilen und Spalten durchsuchen	Java Basics - Anfänger-Themen	3	20. Jun 2021
	Kurze Frage kann mir ejmand kurz diesen Code erklären, bzw wie man die zeilen erklärt und so	Java Basics - Anfänger-Themen	1	13. Jan 2021
	zu viele Zeilen in der Main Methode	Java Basics - Anfänger-Themen	4	11. Jan 2021
W	Anzahl der Zeilen ausgeben lassen	Java Basics - Anfänger-Themen	20	30. Dez 2020
	Letzte Zeile einer Tabelle "überschreibt" alle anderen Zeilen	Java Basics - Anfänger-Themen	1	14. Dez 2020
X	Textdatei: zwei-zeilenweise gleiche Zeilen rausschmeißen	Java Basics - Anfänger-Themen	21	1. Mrz 2020
A	Jede x-te Zeile, lösche 10 Zeilen	Java Basics - Anfänger-Themen	9	20. Mai 2019
	Alle Zeilen einer CSV-Datei auslesen	Java Basics - Anfänger-Themen	1	25. Dez 2017
C	Zeilen aus einer Datei in Array speichern	Java Basics - Anfänger-Themen	4	11. Dez 2017
F	Mehrere Zeilen zu einer Zeile zusammenfügen und in eine Datei schreiben	Java Basics - Anfänger-Themen	1	17. Okt 2017
A	String mit mehreren Zeilen splitten	Java Basics - Anfänger-Themen	4	12. Okt 2017
S	Java Text splitten mit Tabs, Zeilen, Zeichen und Klammern.	Java Basics - Anfänger-Themen	6	1. Mai 2017
D	JTable Zeilen löschen	Java Basics - Anfänger-Themen	5	14. Dez 2016
H	Best Practice JavaFX TableView mit Zell-Rahmen anstelle von Zeilen-Balken	Java Basics - Anfänger-Themen	1	3. Okt 2016
V	Ergebnisse in 2 Zeilen	Java Basics - Anfänger-Themen	4	8. Jul 2016
R	Eine Datei mit mehreren Zeilen beschreiben	Java Basics - Anfänger-Themen	5	12. Jun 2016
C	Zeilen in Array einlesen und splitten?	Java Basics - Anfänger-Themen	17	7. Apr 2016
T	Zeilen des ListArray nach einem Wort durchsuchen und diese Zeile ausgeben	Java Basics - Anfänger-Themen	4	5. Jan 2016
T	Exceptions - ausgeführte Zeilen	Java Basics - Anfänger-Themen	4	4. Jan 2016
M	Input/Output Alle Zeilen auslesen und in Variable speichern	Java Basics - Anfänger-Themen	5	3. Nov 2015
X	wie kann ich in bluej/java einene 2d array mit zahlen fuellen, so dass sich diese in der der zeilen	Java Basics - Anfänger-Themen	2	31. Okt 2015
J	Zeilen aus einer .txt-Datei auslesen und Variablen zuweisen	Java Basics - Anfänger-Themen	11	20. Dez 2014
F	Problem mit Tabulatoren bei Zeilen zählen einer Textdatei	Java Basics - Anfänger-Themen	17	12. Nov 2014
F	Textdatei einlesen und Zeilen zählen	Java Basics - Anfänger-Themen	10	11. Nov 2014
M	Array: Zeilen vergleichen	Java Basics - Anfänger-Themen	4	27. Jun 2014
J	Klassen Hilfe bei unbekannten Zeilen bzgl. Klassen / Komponenten	Java Basics - Anfänger-Themen	12	18. Jun 2014
T	JTable einzelne Zeilen löschen	Java Basics - Anfänger-Themen	3	28. Apr 2014
L	String extrahieren mit Regular Expression über mehrere Zeilen hinweg	Java Basics - Anfänger-Themen	1	14. Jan 2014
T	CSV auf Inhalt und Zeilen überprüfen	Java Basics - Anfänger-Themen	2	7. Jan 2014
I	Datei mit 2 Spalten und millionen Zeilen	Java Basics - Anfänger-Themen	19	20. Okt 2013
	Input/Output Einlesen von mehreren Zeilen	Java Basics - Anfänger-Themen	4	1. Okt 2013
J	Zeilen unsichtbar	Java Basics - Anfänger-Themen	11	4. Jan 2013
3	JLabel - Text in mehreren Zeilen zentrieren	Java Basics - Anfänger-Themen	5	25. Dez 2012
L	Split + Zeilen einer Datei mit bestimmtem Inhalt löschen	Java Basics - Anfänger-Themen	23	4. Nov 2012
V	Methoden Zeilen nach bestimmtem Attribut sortieren	Java Basics - Anfänger-Themen	4	24. Jul 2012
M	Einzelne Zeilen nach Zeichen auslesen	Java Basics - Anfänger-Themen	4	17. Jul 2012
T	Methoden HILFE! readLine() liest nur ungerade Zeilen??	Java Basics - Anfänger-Themen	2	12. Mai 2012
G	JTextArea: nur bestimmte Zeilen anders formatieren	Java Basics - Anfänger-Themen	7	9. Mai 2012
B	Input/Output bestimmte Zeilen in .txt Dateinen überschreiben	Java Basics - Anfänger-Themen	20	29. Apr 2012
G	3422 Zeilen in Eclipse Console	Java Basics - Anfänger-Themen	5	23. Jan 2012
L	Zeilen und Spalten sortieren	Java Basics - Anfänger-Themen	11	27. Dez 2011
K	Erste Schritte Eingabetext besteht aus mehreren Zeilen?	Java Basics - Anfänger-Themen	3	3. Dez 2011
T	BufferedReader mehrere Zeilen einlesen	Java Basics - Anfänger-Themen	4	25. Nov 2011
B	Zählen bestimmter Zeilen einer .txt	Java Basics - Anfänger-Themen	7	7. Nov 2011
N	Zeilen vergleichen	Java Basics - Anfänger-Themen	7	30. Aug 2011
N	Datei mit max 2000 Zeilen schreiben	Java Basics - Anfänger-Themen	9	20. Jul 2011
D	Input/Output Zeilen aus txt-datei in Java-Liste einfügen	Java Basics - Anfänger-Themen	9	26. Jun 2011
K	BufferedWriter schreibt die letzten paar Zeilen nicht	Java Basics - Anfänger-Themen	5	24. Mai 2011
R	Erste Schritte 2D-Array: Zeilen & Spalten ohne schleife übergeben?	Java Basics - Anfänger-Themen	3	18. Mai 2011
C	Mehrere Zeilen unter ~.showMessageDialog	Java Basics - Anfänger-Themen	12	27. Jan 2011
K	Java Split mehrere Zeilen	Java Basics - Anfänger-Themen	4	17. Dez 2010
H	200000 Zeilen aus Datei einlesen	Java Basics - Anfänger-Themen	13	8. Dez 2010
Q	LogFile.log einlesen und Werte zwischen 5 zeilen vergleichen	Java Basics - Anfänger-Themen	5	17. Okt 2010
P	Bestimmte Zeilen einer Datei ermitteln ?	Java Basics - Anfänger-Themen	30	9. Sep 2010
B	JList und JTable: leere Zeilen bei listfiles();	Java Basics - Anfänger-Themen	5	28. Aug 2010
M	Zeilen aus String exportieren	Java Basics - Anfänger-Themen	5	10. Aug 2010
P	Unterschied dieser 2 code Zeilen	Java Basics - Anfänger-Themen	12	5. Aug 2010
A	Anzahl Zeilen eines Arrays bestimmen	Java Basics - Anfänger-Themen	10	21. Mai 2010
J	Zeilen eines Arrays vergleichen	Java Basics - Anfänger-Themen	2	11. Mai 2010
S	.txt einlesen->Zeilen ersetzen->neu.txt speichern	Java Basics - Anfänger-Themen	13	13. Apr 2010
R	String über mehrere Zeilen	Java Basics - Anfänger-Themen	15	5. Jan 2010
M	Verständnis einiger Zeilen	Java Basics - Anfänger-Themen	4	27. Dez 2009
E	Array mit Zahlen von 1-(Zeilen*Spalten) befüllen	Java Basics - Anfänger-Themen	8	24. Nov 2009
S	Zeilen zählen	Java Basics - Anfänger-Themen	7	20. Okt 2009
	Bestimmte Zeilen aus einer HTML Datei lesen	Java Basics - Anfänger-Themen	8	21. Sep 2009
C	Zeilen aus einer Datei auslesen	Java Basics - Anfänger-Themen	4	17. Aug 2009
H	String/StringBuffer nach zeilen aufteilen	Java Basics - Anfänger-Themen	2	10. Mrz 2009
K	Wie kann ich alle Zeilen in eineR Datenbank zählen?	Java Basics - Anfänger-Themen	13	12. Feb 2009
	Zeilen eines JEditorPanes	Java Basics - Anfänger-Themen	2	7. Dez 2008
0	CSV Import - Zeilen, Spalten	Java Basics - Anfänger-Themen	15	5. Dez 2008
O	2D Array - Zeilen-/Spaltenlänge ermitteln	Java Basics - Anfänger-Themen	4	25. Nov 2008
P	String über mehrere Zeilen definieren	Java Basics - Anfänger-Themen	3	22. Nov 2008
G	Datei zeilen anhängen	Java Basics - Anfänger-Themen	3	18. Sep 2008
A	Scanner liest nur 999 Zeilen ein	Java Basics - Anfänger-Themen	5	17. Sep 2008
B	Zeilen in Textdatei löschen	Java Basics - Anfänger-Themen	2	5. Sep 2008
D	Datei einlesen, zeilen ignorieren, probleeem	Java Basics - Anfänger-Themen	7	11. Mrz 2008
A	Anzahl der Zeilen in Textdatei	Java Basics - Anfänger-Themen	7	28. Dez 2007
G	Zeilen in Eclipse einblenden	Java Basics - Anfänger-Themen	2	16. Dez 2007
M	Zeilen aus Textdatei in Array schreiben	Java Basics - Anfänger-Themen	2	31. Okt 2007
M	Zeilen auslesen	Java Basics - Anfänger-Themen	12	29. Okt 2007
H	Streams etc. erster Versuch Zeilen aus einer Datei zu lesen	Java Basics - Anfänger-Themen	6	28. Aug 2007
L	In einer Tabelle Zeilen loeschen	Java Basics - Anfänger-Themen	4	24. Jul 2007
D	Auf Zeilen eines zweidimensionalen Arrays zugreifen	Java Basics - Anfänger-Themen	3	4. Jul 2007
D	txt nach Zeilen splitten.	Java Basics - Anfänger-Themen	9	4. Jul 2007
G	Anzahl der Zeilen in einer Datei	Java Basics - Anfänger-Themen	7	25. Jun 2007
T	die letzten X zeilen einer datei entfernen	Java Basics - Anfänger-Themen	19	23. Jun 2007
E	was bedeuten @Zeilen	Java Basics - Anfänger-Themen	4	4. Jun 2007
T	Einlesen von einzelnen Zeilen	Java Basics - Anfänger-Themen	2	24. Jan 2007
T	null-Zeilen aus einem Array entfernen	Java Basics - Anfänger-Themen	4	7. Nov 2006
E	Automatischer Zeilen-Umbruch bei JTextArea	Java Basics - Anfänger-Themen	4	7. Nov 2006
G	zeilen aus text datei löschen	Java Basics - Anfänger-Themen	6	11. Okt 2006
G	CSV auslesen und Zeilen in Array speichern	Java Basics - Anfänger-Themen	13	10. Okt 2006
	zeilen einer text datei ermitteln	Java Basics - Anfänger-Themen	6	21. Sep 2006
S	Anzahl von zeilen einer Datei bestimmen.	Java Basics - Anfänger-Themen	4	30. Aug 2006
J	Tabelle mit mehreren Zeilen dynamisch aufbauen	Java Basics - Anfänger-Themen	2	19. Aug 2006
F	Zeilen und Spalten in JTable Selektieren	Java Basics - Anfänger-Themen	2	26. Jul 2006
S	In einer CSV Datei leere Zeilen ignorieren	Java Basics - Anfänger-Themen	6	17. Jul 2006

Input/Output 6000 Zeilen einlesen und String-Array vergleichen?

Kel

Aktives Mitglied

Beatsleigher

Bekanntes Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen