Von Oracle zu Couchbase

Chaya

Mitglied
Hallo zusammen,

ich sitze hier gerade an einer Aufgabe und komme nicht weiter.

Zum Hintergrund:
Die Aufgabe besteht im Grunde darin Daten aus einer Oracle-DB in eine Couchbase zu überführen.
In der Oracle-DB sind Keys mit zugehörigen XML-Strings hinterlegt, diese werden dann in JSON umgewandelt (das funktioniert bereits).
In der Oracle-DB sind derzeit 11 Millionen Datensätze.

Derzeit habe ich folgenden Ansatz:


Java:
package multithreading;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.ResultSet;
import java.sql.SQLException;
import java.sql.Statement;

import com.couchbase.client.java.Bucket;
import com.couchbase.client.java.document.JsonDocument;

import couchbase.ConnectionManager;
import couchbase.InsertBuild;

public class TestClob {
	static ResultSet res;
	static Statement stmt;
	private static Bucket bucket;
	
	
	
public static void insertStuff(String id, String xml, Bucket bucket) throws Exception {
		JsonDocument doc = InsertBuild.buildJsonDocument(id, xml);
		bucket.async().upsert(doc);
	}
	
	
	public static void main(String[] args) throws Exception{
		long lStartTime = System.nanoTime();
		ConnectionManager cm = new ConnectionManager();
		bucket = cm.connect();
		Class.forName("oracle.jdbc.driver.OracleDriver");
		String url = "jdbc:oracle:thin:@host:port:name";
		Connection conn = DriverManager.getConnection(url, "nutzer", "pwd");
		String sql = "select NVL(LAST_UPDATE_DATE,'01.01.1000') as LAST_UPDATE_DATE, XML_MESSAGE from db" +
				"inner join db" +
				"on db.ORDER_HEADER_ID = db2.ORDER_HEADER_ID " +
				"and db.ORDER_HEADER_ID< 25348167";
		stmt = conn.createStatement(ResultSet.TYPE_SCROLL_INSENSITIVE, ResultSet.CONCUR_READ_ONLY);
		stmt = conn.createStatement();
		res = stmt.executeQuery(sql);
		
		while(res.next()){
			insertStuff(res.getString(1), res.getString(2), bucket);
		}
		
		long lEndTime = System.nanoTime();
		 
		long difference = lEndTime - lStartTime;
	 
		System.out.println("Elapsed milliseconds: " + difference/1000000);
		
		
		bucket.close();
		conn.close();
		
		
	}

}

Das Problem hierbei ist allerdings, das das mit den 11 Millionen Datensätzen ewig dauert.
Daher dachte ich daran, das ganze eventuell mit Threads zu lösen, das wäre das Einzige was mir jetzt noch eingefallen wäre.
Nur habe ich hierbei keine Ahnung, wie man anfangen soll, gerade weil es ja ein scrollable Resultset ist.
Threads habe ich im Studium zwar schon einmal kurz gehört und auch kurz ausprobiert, allerdings nie in Verbindung mit Datenbanken.

Könnte mir hierbei vielleicht jemand "Starthilfe" geben?
Auch eine vollkommen andere Lösung wäre ok. Hauptsache das geht alles ein bisschen schneller


vielen Dank und liebe Grüße
Chaya
 
Zuletzt bearbeitet von einem Moderator:

dzim

Top Contributor
Per se würde dir Threading vermutlich nicht helfen. Machst du die lesende und die schreibende Operation auf der selben Maschine?
Wie sieht die IO-Belastung aus? Ist die Anwendung am Limit (also CPU 100%)? Ist es lediglich eine Tabelle (mit den 11 Mio. einträgen), bzw. ein ResultSet, die es zu überführen gilt?

Ich habe mich noch nie mit diesem NoSQL-Zeug auseinandergesetzt (bisher waren SQL-DBs immer die für mich bessere Wahl), aber ich vermute, auch dort gibt es für bessere Performance so etwas wie Batch-Jobs. Denn ich vermute, dass die vielen einzelnen "Insert"-Operationen und evtl. Updates auf dem Index auf CouchDB (gibt es da so etwas?) zu einer unnötig hohen Last führen.

Such vielleicht mal nach "couchdb batch insert" oder "couchdb bulk insert"

Nutzt du LightCouch für die Java-Seite?
LightCouch User Guide 0.1.6
CouchDbClientBase (LightCouch 0.1.6 API)

Also ich denke, ein Bulk-Insert sollte dir helfen.

Aber: Nicht alle 11 Mio Datensätze erst im Speicher halten. Vielleicht ein Bulk-Insert wenn 1000 oder so angesammelt wurden (mal herumspielen, ob das was bringt).

#edit: Gib dem Java-Programm eventuell auch etwas mehr Speicher. Google mal nach "Xmx" und "Xms"...
 
Zuletzt bearbeitet:
Ähnliche Java Themen
  Titel Forum Antworten Datum
S Das printen der Ausgabe des Oracle-SQL-Statements in der Java-Eclipse-Konsole funktioniert nicht Datenbankprogrammierung 6
S Den letzten Eintrag aus Datenbank ziehen (Oracle SQL Dev.) Datenbankprogrammierung 14
S Oracle DB-Connection in .jar file ändern Datenbankprogrammierung 11
D Oracle Gateway oder Relay-Server Datenbankprogrammierung 5
N Oracle SQL - Nächst kleineren Namen2 zu einem Namen aus einer Tabelle Datenbankprogrammierung 3
M Oracle SQL Zeitabstand in Tagen Datenbankprogrammierung 11
P Datenbank Tool - besser als oracle SQL Developer gesucht mit effizinte Verbindungsverwaltung Datenbankprogrammierung 2
X JPA (EclipseLink) und Oracle Datenbank Datenbankprogrammierung 2
H Oracle Resize eines Images in Java und Rückgabe des Image als BLOB an die Oracle Datebank Datenbankprogrammierung 14
H Java Class zum komprimieren von Jpeg-Images zum Einbinden in Oracle DB - Bild als blob (in und out) Datenbankprogrammierung 23
L Oracle Oracle Datumsspalte auslesen Datenbankprogrammierung 5
L Oracle Daten von Oracle zu MSSQL übertragen Datenbankprogrammierung 4
L LOAD DATA INFILE mit Oracle Datenbankprogrammierung 24
D Abfrage - Spalte(Datum) ändern (Oracle) Datenbankprogrammierung 7
L Oracle Datenbank über Java aufrufen Datenbankprogrammierung 29
R ERModel der Datebanken (ORACLE,MySQL,MS-SQL usw) Datenbankprogrammierung 4
I Datenbankverbindung Oracle DB klappt nicht - getConnection returned null Datenbankprogrammierung 8
R DB2 Oracle 12 - invalid username/passwort Datenbankprogrammierung 1
AssELAss Verbindung i5 Series 7.1 / 7.2 (DB2) mit Oracle SQL Developer Datenbankprogrammierung 3
E Was sind die Vorteile von DB2 im Gegensatz zu einer Oracle-Datenbank? Datenbankprogrammierung 5
R Oracle jdbc Zugriff auf Oracle Datenbankprogrammierung 2
B No suitable driver found for jdbc:oracle:thin:@$HOST:$PORT:$SID Datenbankprogrammierung 7
S Oracle Database 11g , eclipse , Tabelle erstellen Datenbankprogrammierung 2
0 JDBC Oracle Verbindungsaufbau Datenbankprogrammierung 6
Q Oracle Linux: ClassNotFoundException: oracle.jdbc.driver.OracleDriver Datenbankprogrammierung 6
F Oracle Oracle JDBC Anbindung unter Glassfish 3.1.2 Datenbankprogrammierung 3
P Oracle Hibernate - Oracle-VarChar-Index wird nicht genutzt Datenbankprogrammierung 3
Kenan89 Oracle passwortspalte Datenbankprogrammierung 2
Kenan89 Oracle Daten einer Tabelle in Array speichern Oracle Datenbankprogrammierung 10
S Problemme mit oracle Datenbankprogrammierung 13
H Oracle Hibernate + Oracle Datenbankprogrammierung 3
c_sidi90 JDBC Oracle Connection schlägt fehl Datenbankprogrammierung 2
D Oracle SQL Ergebnis anzeigen und Applet Fehlermeldung Datenbankprogrammierung 12
1 Java - Oracle Restore Point Datenbankprogrammierung 2
X Rollback mit Savepoint funktioniert auf Oracle nicht (ORA-01086) Datenbankprogrammierung 4
E Datenbankverbindung mit Oracle JDBC und Eclipse Plugin Quantum db Datenbankprogrammierung 2
M Kann Oracle Datenbanktreiber nicht laden Datenbankprogrammierung 5
F Performance-Tool für Oracle Datenbankprogrammierung 2
Dit_ Oracle Oracle DB | Installation Datenbankprogrammierung 3
T Datum anpassen in Oracle Datenbankprogrammierung 5
R Oracle Java -> Tomcat -> Oracle Datenbankprogrammierung 4
M Oracle Probleme mit dem anbinden einer Oracle 10g Datenbank Datenbankprogrammierung 27
H Oracle DBUnit/JUnit auf Oracle mit verschiedenen Schemata? Datenbankprogrammierung 8
G Stored Procedure in Oracle, Txt erzeugen Datenbankprogrammierung 9
G Oracle Zeile löschen Datenbankprogrammierung 2
G Auf Oracle Schema Name zugreifen Datenbankprogrammierung 7
G INSERT DATE in Oracle-DB Datenbankprogrammierung 11
J Oracle oder SQL-Server Datenbankprogrammierung 18
A Oracle Session Parameter per JDBC? Datenbankprogrammierung 14
Z [ORACLE] Ausgabe Tabelle im GUI Datenbankprogrammierung 4
S Oracle Trigger Datenbankprogrammierung 5
cosmic Problem beim Update einer Oracle DB Datenbankprogrammierung 7
L JDBC Oracle Datenbankprogrammierung 2
N Oracle DB liefert nicht alle Datensätze Datenbankprogrammierung 3
H Oracle - Indizes werden nicht genommen Datenbankprogrammierung 6
P Probleme mit Oracle Timestamp Datenbankprogrammierung 3
A Loader-Dateien in Oracle Datenbankprogrammierung 4
G Oracle DB Link Datenbankprogrammierung 3
padde479 Connection String Oracle Datenbankprogrammierung 5
S Oracle Abfrage mit Platzhaltern Datenbankprogrammierung 3
D Oracle Datenbank exportieren Datenbankprogrammierung 3
Q admin tool für oracle datenbank - freeware Datenbankprogrammierung 7
G Blob aus Oracle-Datenbank Datenbankprogrammierung 2
J jdbc Oracle Connection refused Datenbankprogrammierung 6
S Oracle JDBC Treiber Problem Datenbankprogrammierung 4
J Bild in Oracle Datenbank - Grundkurs Datenbankprogrammierung 7
M Verbindung zu Oracle DB Datenbankprogrammierung 4
G Float Problem Java Oracle Datenbankprogrammierung 4
O Vector als Blob in Oracle Datenbank speichern Datenbankprogrammierung 3
O Oracle 11g wirft bei 90 % der installation eine Exception ? Datenbankprogrammierung 5
W ID des letzten eingefügten Werts ermitteln (Oracle) Datenbankprogrammierung 4
ARadauer Date Problem bei Oracle DB Datenbankprogrammierung 4
R oracle Anbindung geht im jar nicht Datenbankprogrammierung 8
D Insert Oracle BLOB Datenbankprogrammierung 1
O Oracle Client Software für ojdbc5! Datenbankprogrammierung 1
Y ORACLE - Autoincrement funktioniert nicht Datenbankprogrammierung 2
E Ein If und ein SELECT in Oracle? Datenbankprogrammierung 2
M Problem mit SUBSTR (Oracle) bzw. substring (Java) Datenbankprogrammierung 13
J Fehler bei Oracle-Datenbankverbindung Datenbankprogrammierung 2
E [SQL, Oracle] Zeile einfügen Datenbankprogrammierung 8
G Connection zu einer Oracle DB erstellen Datenbankprogrammierung 8
L Oracle: PL/SQL und Java Datenbankprogrammierung 3
K Oracle XE Connection Problem Datenbankprogrammierung 2
T INSERT-Befehl in Java für Oracle Datenbankprogrammierung 4
G Oracle-Record auslesen Datenbankprogrammierung 2
E JDBC Oracle Fehler, zugriff auf datenbank (Cluster) Datenbankprogrammierung 5
H Oracle - Partionierung von Tabellen Datenbankprogrammierung 4
H Oracle XE 10 mit Java Datenbankprogrammierung 4
B Oracle Driver Probleme Datenbankprogrammierung 2
R ResultSet liefert oracle.sql.TIMESTAMP, aber unbrauchbar Datenbankprogrammierung 9
thE_29 Speicherplatz von Oracle DB Datenbankprogrammierung 2
D Problem beim Zugriff auf eine Oracle-DB Datenbankprogrammierung 23
G Single Sign On bei Oracle Datenbankprogrammierung 3
E Jar File: NoClassDefFoundError: oracle/sql/ORAData Datenbankprogrammierung 2
H MIt oracle Verbinden (ungültiges Argument in Aufruf) Datenbankprogrammierung 4
W Wie auf Oracle zugreifen? Datenbankprogrammierung 3
R Oracle Express 10g mit JDBC Datenbankprogrammierung 3
N Wie kann ich mich mit Oracle verbinden? Datenbankprogrammierung 3
L oracle:ORA-01008: Nicht allen Variablen ist ein Wert zugeord Datenbankprogrammierung 1
G import Oracle.jdbc*; Datenbankprogrammierung 6

Ähnliche Java Themen

Neue Themen


Oben