Für welche Art von Berechnungen macht JCUDA Sinn?

Status
Nicht offen für weitere Antworten.

nipnip

Mitglied
Hallo Leute,

bin vorhin auf JCUDA gestossen, womit ich CUDA in Java verwenden kann. Jetzt hab ich mir einige Sample-Sources angeschaut, in denen verschiedene Operationen durchgeführt werden.

Es ist ja so, dass CUDA natürlich sehr speziell ist und wahrscheinlich nur in bestimmten Gebieten effektiv ist(Grafik). Dennoch stellt sich mir die Frage, wie man (j)CUDA für normale Anwendungen verwenden kann. Die Frage könnte man so formulieren:

Zu welchen Berechnungen ist CUDA fähig, also welche Berechnungen können mit CUDA stark beschleunigt werden?

Ich versuche gerade zu verstehen, ab wann es Sinn macht, CUDA zu verwenden, bei welchem Einsatzzweck. Vielleicht gibt es ja hier Leute, die schon einmal mit CUDA gearbeitet haben? Wenn ja, für welche Projekte bzw. welchen Zweck kam CUDA zum Einsatz?

mfg nipnip
 

nipnip

Mitglied
Den Thread von Marco hab ich mir schon durchgelesen, jedoch hat sich mir immer noch nicht erschlossen, wie groß der Bereich ist und wo dieser abgegrenzt wird, in dem ich CUDA verwenden kann...

€dit: Gibt es irgendwo eine Liste von (Arten der) Berechnungen, zu deren CUDA in der Lage ist?

€dit: Ok, also CUDA ist für Vektor- und Matrixberechnungen und schnelle Fourier Transformationen sehr gut, wobei ich noch nicht verstanden hab, wo letzteres eingesetzt wird...
 
Zuletzt bearbeitet:

-MacNuke-

Bekanntes Mitglied
Ich würde gar nicht mal so sehr auf CUDA setzen, da die Plattformunabhängige (funzt auch ohne entsprechende Grafikkarte auf der CPU) Alternative OpenCL schon verfügbar ist.
 

Marco13

Top Contributor
Erstmal vorneweg zu OpenCL: http://www.java-forum.org/codeschnipsel-u-projekte/86140-jocl-java-bindings-opencl.html ;) Ich bin gerade am basteln: AMD hat inzwischen sein Stream-SDK rausgebracht, wo OpenCL schon unterstützt wird - aber da gibt's mit der JNI-Anbindung noch einige Probleme, die ich hoffentlich mit Unterstützung einiger AMDler schon bald klären kann.

Zu CUDA: CUDA ist definitiv nicht "sehr speziell". Im Gegenteil: Man kann mit CUDA grundsätzlich fast alles machen, was man auch mit C machen kann (abgesehen von Details wie Rekursionen, Funktionspointern usw.). CUDA ist eine ganz allgemeine Programmiersprache - und sie ist so gesehen eine "Obermenge" von C.

Der wichtigste Unterschied ist, dass man in CUDA eine Funktion als "kernel" definieren kann, und diese Funktion dann parallel ausgeführt wird. Und eben nicht mit den lächerlichen 4 oder 8 Threads, die auf einem Quad-Core Sinn machen. Nein, mit CUDA kann so ein Funktionsblock (je nach Hardware) von 10000 (zehntausend) Threads gleichzeitig ausgeführt werden, und das Erstellen und verwalten dieser Threads ist praktisch kostenlos. Also auch wenn man sagt, dass ein Problem mit 1000000 (1 Million) Threads gelöst werden soll, entsteht dadurch kein nennenswerter Overhead.

Trotzdem gibt es natürlich bestimmte Bereiche, in denen CUDA mehr Sinn macht als in anderen. Im speziellen ist die Speicherverwaltung eine Herausforderung. (Für die Hardware, und für den Programmierer - wobei die Herausforderung für den Programmierer darin besteht, die Speicherverwaltung für die Hardware keine zu große Herausforderung werden zu lassen ;) ). Der Transfer von Daten vom Host (also dem RAM im PC) auf das Device (also den Grafikkartenspeicher) ist i.a. der Bottleneck. Zusätzlich hat jeder Zugriff auf den Grafikkartenspeicher nochmal einen Overhead von ca. 400-600 Zyklen.

Richtig schnell ist dagegen der "Shared Memory" - eine Art Cache. Wenn man es schafft, seine Berechnungen NUR im shared memory zu machen, ist einem ein Speedup fast sicher. CUDA ist also (etwas pauschalisiert) insbesondere dort von Vorteil, wo auf "wenigen" Daten "viel" gerechnet werden muss, und diese Berechnungen parallel ablaufen können.

Das ist z.B. bei der Matrizenmultiplikation der Fall: Der Aufwand ist etwa O(n^3), und kann sehr gut von vielen Threads gleichzeigig bearbeitet werden - also lohnt es sich, den Speicher für diese Berechnung an die Grafikkarte zu schicken. Was dagegen keinen großen Vorteil bringt, ist etwa, die Suche nach dem maximalen Element eines Arrays in CUDA zu machen - einmal mit einem Thread über viele Daten laufen, dabei praktisch nichts rechnen - das macht man besser auf der CPU (außer, wenn die Daten sowieso schon auf der GPU liegen).

Aber ich muss noch erwähnen, dass ich das alles auch nicht gut kann: Ich habe selbst noch nicht viel mit CUDA programmiert - in erster Linie die Anbindung (also JCuda) geschrieben, und ein paar Geschwindigkeitsvergleiche mit JCufft/JCublas gemacht. "Gut" in CUDA zu programmieren ist eine Wissenschaft für sich. Und keine überflüssige, weil die gleichen "Regeln" auch bei OpenCL gelten werden - es geht um die grundsätzliche Frage, wie man Probleme für VIELE Threads optimiert, und dabei die Speicherzugriffe optimiert.

Trotzdem nochmal: CUDA eignet sich für alle Arten von "aufwändigen" Berechnungen, die nicht zu "memory bound" sind. Wie viel man bei welchem Anwendungsfeld rausholen kann, erkennt man an den "Speedups", die bei den Beispielen auf CUDA Zone -- The resource for CUDA developers dabeistehen.

Und WIE man diese Speedups erreicht - geht z.B. aus dem CUDA Best Practives Guide (PDF-Datei) hervor, der mit CUDA 2.3 veröffentlicht wurde.
 

Marco13

Top Contributor
Für alle, die's interessiert: In der aktuellen c't gibt es einen Bericht über GPU-Programmierung: c't - Inhalt 20/2009 - Seite 190

Und noch zwei kleine updates:

Zu OpenCL / JOCL: Die aktuelle OpenCL-Beta in der ATI Stream-Bibliothek enthält noch einen kleinen Bug, der bewirkt, dass unter WinXP JNI-Aufrufe nicht richtig funktionieren - unglücklicherweise entwickle ich unter XP, darum wird JOCL noch nicht auf Basis dieser Beta verfügbar sein - aber laut ATI soll der Fehler in der nächsten Release (ende September) behoben sein.

Zu JCuda: Ich habe auch mal angefangen, eine "high-leveligere" API für den Java-Zugriff auf CUDA zu basteln. Insbesondere soll das eine (so weit wie möglich) objektorientierte Sicht auf CUDA sein... im Sinne von Quelltext wie
Java:
// Array erstellen, der vollautomatisch zwischen Host und Device synchronisiert wird
CudaFloatArray array = new CudaFloatArray(100);
array.set(12, 0.1234f);

// Ein Modul zur Laufzeit aus Quelltext generieren
Module module = JC.compileModule(
    "extern \"C\" __global__ sampleKernel(int x, float y, float *z) { ... /* CUDA-Code */ ... }");

// Eine Funktion aus dem Modul aufrufen
Function function = module.getFunction("sampleKernel");
function.call(123, 1.23f, array);

Die IMHO wichtigsten Vereinfachungen dabei sind (bzw. werden)
- Einfache, Objektorientierte Arrayverwaltung, die einem das Hin- und Herkopieren der Arraydaten zwischen Host und Device abnimmt
- Die Möglichkeit, den CUDA-Code direkt in Java zu schreiben und zur Laufzeit compilieren zu lassen (optional kann man ihn natürlich auch in einer eigenen Datei ablegen, oder die schon fertig compilierte Datei laden)
- Die Möglichkeit, Kernelfunktionen direkt mit [c]function.call(...)[/c] aufzurufen - so ein Aufruf braucht normalerweise (mit der low-leveligen, an CUDA orientierten API von JCuda) sonst schon mal 10 Zeilen, in denen man per Hand die einezlenen Parameter definiert usw...

Eine Vorschau dafür könnte ich "bald" hochladen, aber im Moment ist das noch eher inoffiziell - speziell wenn es um Dinge wie Texturen geht muss da noch einiges getan werden. Wenn jemand an der Vorschau interessiert ist: PN an mich :)
 
T

tuxedo

Gast
Mal ne andere Frage:
Hat man mit CUDA auch irgendwie zugriff auf den aktuellen Grafikoutput?

Hintergrund: VNC ... In der professionellen System-Visualisierungslösungen kommt immer mehr VNC in den Vordergrund. Herausfoderung ist hier einen Remote-Desktop mit einer Möderauflösung von 10.000x10.000 Pieln und höher zu scrapen. Der "Aufwand" des "dirty rectangle detection", also das erkennen des Bereichs der sich seit dem letzten Bilder geändert hat, ist bei einer solchen Datenmenge recht groß. Mit FFT und anderen "schicken" Algos kann man da schon viel ausrichten. Da ja CUDA da sich super dafür eignet, stellt sich einem nur noch die Frage: Krieg ich den riesen Desktop mit 10.000x10.000 Pixeln da schnell und effizient in den Speicher um die "dirty rectangle
detection" drauf los zu lassen?

Gruß
Alex
 

Marco13

Top Contributor
Es gibt Interoperabilität zwischen CUDA und OpenGL, wie bei den letzten beiden Beispielen auf jcuda.org - Samples und natürlich den CUDA-Beispielen von NVIDIA zu sehen ist: Man kann mit CUDA z.B. auf PixelBufferObjects rumhantieren, die mit OpenGL (oder JOGL, im Falle von JCuda) gezeichnet werden, oder auf Speicherbereiche als Texturen zugreifen.

Nach einer kurzen Websuche findet man z.B. desktop screen capture - OpenGL.org Discussion and Help Forums, wo darüber diskutiert wird, wie man einen Desktop in ein PBO grabbt (und weiter unten wird auch gesagt, dass dort jemand CUDA drauf loslassen will ;) ). Es könnte also prinzipiell möglich sein, aber ich kenne mich mit VNC nicht aus, und im Moment ist mir (noch) nicht klar, "wo" dieser 10000x10000 Deskopt "liegt", und ob man diesen großen Bereich auch noch (effizient) in ein PBO bringt: Das ist ja nichts, was mit einem "BitBlit" oder wie das heißt einfach von irgendeinem "FrontBuffer" irgendwo hin kopiert werden kann... ???:L

So eine effiziente "dirty rectangle detection" könnte ich auch gebrauchen, aber weiß nicht, ob ich die Prioritäten so verteilen kann, dass ich wirklich dazu komme, da mal genauer nachzuforschen...
 

ice-breaker

Top Contributor
Krieg ich den riesen Desktop mit 10.000x10.000 Pixeln da schnell und effizient in den Speicher um die "dirty rectangle
detection" drauf los zu lassen?

also wenn ich mich nicht ganz verrechnet habe dann sind das doch:

10.000 * 10.000 * 4 Byte = 100.000.000 * 4 Byte = 400.000.000 Byte = 390.625 KiloByte = 381 MegaByte.

das dürfte schon mit dem Speicherplatz recht knapp werden.
 
Zuletzt bearbeitet:

Marco13

Top Contributor
Naja, heutige Grafikkarten ham' ja meistens mindestens 512 MB (meine erste hatte 512KB - interessant zu sehen, an welchen Stellen der "Power of 1000" wann zuschlägt :) ) - aber das ist auch Teil meiner Frage, nämlich wo diese Daten rumliegen...?!
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
M Welche Umgebung und Frameworks für mich als Umsteiger Allgemeine Java-Themen 6
F Welche Systeme für hoch skalierbare Webanwendung? Allgemeine Java-Themen 7
S Welche Datenstruktur für verschiedene Sprachen sinnvoll? Allgemeine Java-Themen 2
vladimir Welche API für Grafik und Drag&Drop Allgemeine Java-Themen 3
E Welche Icons für sichtbar /unsichtbar Allgemeine Java-Themen 2
J Welche Lösung für Servlets und JSPs in Eclipse? Allgemeine Java-Themen 5
J Welche Daten für Ative-X Funktion? Allgemeine Java-Themen 5
P welche java version für javax.mail? Allgemeine Java-Themen 7
B Algorithmus für Arbeit mit fehlenden Listenelementen? Allgemeine Java-Themen 1
kodela Eingabe für TextArray bedingt sperren Allgemeine Java-Themen 3
Karl_Der_Nette_Anfänger Hat wer ne Lösung für verknüpfte Postleitzahlen? (Baum/Wurzel Struktur) Allgemeine Java-Themen 11
R 11 GB File lesen ohne zu extrahieren Filedaten Bereich für Bereich adressieren dann mit Multi-Thread id die DB importieren Allgemeine Java-Themen 3
G KeyListener für JTextField Allgemeine Java-Themen 5
webracer999 Library für Textsuche (z. B. include/exclude, and/or)? Allgemeine Java-Themen 5
I Module-Info für Jar erzeugen Allgemeine Java-Themen 7
krgewb Java-Bibliothek für ONVIF Allgemeine Java-Themen 1
B Simpler Eventlistener für Tastaturtaste bauen? Allgemeine Java-Themen 13
_user_q Eingegebenen Text Zeile für Zeile ausgeben lassen Allgemeine Java-Themen 11
E Key für TOTP Algorythmus(Google Authentificator) Allgemeine Java-Themen 0
S Formel für Sonnenwinkel in ein Programm überführen Allgemeine Java-Themen 11
M pfx-Zertifikat in Tomcat für SSL-Verschlüsselung nutzen Allgemeine Java-Themen 14
R Best Practice Erfahrungswerte für eine Migration von JSF nach Angular (oder anderes JS-Framework) Allgemeine Java-Themen 1
B HeapSort für Array of Strings funktioniert nur teilweise Allgemeine Java-Themen 3
jhCDtGVjcZGcfzug Klassen Was genau passiert hier? Kann mir das jemand bitte Zeile für Zeile erklären? Allgemeine Java-Themen 1
rosima26 Bester Sortieralgorithmus für kurze Arrays Allgemeine Java-Themen 40
S Mit Methoden kann man definieren für was <T> steht. Geht das auch irgendwie für Variablen? Allgemeine Java-Themen 12
MangoTango Operatoren while-Schleife für Potenz Allgemeine Java-Themen 3
B Lottospiel, genug Reihen tippen für 3 Richtige (Spaß mit Arrays)? Allgemeine Java-Themen 46
B Mit welchen Datentypen und Strukturierung am Besten dutzende Baccaratspiele Shcritt für Schritt durchsimulieren? Allgemeine Java-Themen 26
D Klassendesign für einen Pascal Interpreter Allgemeine Java-Themen 6
I OCR Library für Belegerkennung Allgemeine Java-Themen 7
farah GetterMathod für Farbkanäle Allgemeine Java-Themen 6
B Welcher Datentyp für sehr große Zahlenbereiche? Allgemeine Java-Themen 1
S Webservices für binäre Daten? Allgemeine Java-Themen 5
G Licence-Header für InHouse entwickelten Source Allgemeine Java-Themen 8
M Schleife für einen TicTacToe Computer Allgemeine Java-Themen 5
O git ignore für Intellji braucht es die .idea Dateien? Allgemeine Java-Themen 8
F Java Script für das Vorhaben das richtige? Allgemeine Java-Themen 9
M wiviel Java muss ich für die Berufswelt können ? Allgemeine Java-Themen 5
Robertop Datumsformat für GB ab Java 16 Allgemeine Java-Themen 1
Thallius Verschiedene entities für gleichen Code…. Allgemeine Java-Themen 8
OnDemand Zentrale "Drehscheibe" für verschiedene APIs Allgemeine Java-Themen 14
S Übergabe eines Sortierkriteriums für ein Artikel Array mittels BiPredicate<Artikel, Artikel> Allgemeine Java-Themen 13
F Streams als Alternative für dieses Problem ? Allgemeine Java-Themen 15
D SHA-3 für Java-version 1.8 Allgemeine Java-Themen 1
N Validator für einen SQL-Befehl Allgemeine Java-Themen 22
Muatasem Hammud Erstellung von Testdaten für Arrays Allgemeine Java-Themen 6
B Logikfehlersuche, das perfekte Lottosystem für 3 Richtige mit Arraylists? Allgemeine Java-Themen 61
G Methoden für die Zukunft sinnvoll? Allgemeine Java-Themen 4
M API für PLZ Umkreissuche Allgemeine Java-Themen 3
1Spinne JDK 8 für Eclipse installieren Allgemeine Java-Themen 5
Tobero Meine Funktion für das beinhalten eines Punktes in einem Kreis funktioniert nicht Allgemeine Java-Themen 5
L Methoden Parser für gängige Datumsformate? Allgemeine Java-Themen 1
H Interface PluginSystem ClassNotFound exception für library Klassen Allgemeine Java-Themen 10
N relativier Pfad für sqlite-Datenbank in Gradle/IntelliJ Allgemeine Java-Themen 2
buchfrau Anagram für beliebiges Wort Allgemeine Java-Themen 2
TonioTec Api für Datenaustausch zwischen Client und Server Allgemeine Java-Themen 0
W Suche Ursache für NPE - woher kommt sie? (Hilfe beim Debugging) Allgemeine Java-Themen 19
Kirby.exe Distanz Map für die Distanztransformation erstellen Allgemeine Java-Themen 1
F PI Regler für Heizung Allgemeine Java-Themen 7
8u3631984 Generelle Log4j.xml für alle Module Allgemeine Java-Themen 5
M Wie übergebe ich den Zähler für die Anzahl Rekursionsschritte korrekt? Allgemeine Java-Themen 2
B Login für User, der im Hintergrund Schedules ausführt Allgemeine Java-Themen 16
L RegEx für Teile einer Berechnung Allgemeine Java-Themen 14
S Java-Task-Management-Tool für Windows und Mac selber programmieren Allgemeine Java-Themen 4
M Java 2D Array für ein Grid erstellen ? Allgemeine Java-Themen 2
Z Welches GUI Framework für Java ist aktuell? Allgemeine Java-Themen 16
N Convert.FromBase64 von C# für Java Allgemeine Java-Themen 11
N fixed-keyword von C# für Java Allgemeine Java-Themen 6
O Suche Scripter für alt:V Project! Allgemeine Java-Themen 0
S Interface Design von HookUp oder Callback Methoden für eigenes Framework Allgemeine Java-Themen 9
O Suche Unterstützung für ein OpenSource-Projekt (grafischer Editor) Allgemeine Java-Themen 13
Kirby.exe Software für Graphische Visualisierung Allgemeine Java-Themen 20
B OOP Auslöser für NullPointerException Allgemeine Java-Themen 3
L Generator für einen Parser implementieren Allgemeine Java-Themen 13
DonMalte Ambitioniertes Projekt für Einsteiger & Motivierte Allgemeine Java-Themen 0
Kirby.exe Movement System für Spiel Allgemeine Java-Themen 13
Kirby.exe Framework für Game Design Allgemeine Java-Themen 8
W Alternative für Threads Allgemeine Java-Themen 6
S Rückgabe einer HttpURLConnection für eine Seite einlesen bei der man eingeloggt ist..? Allgemeine Java-Themen 5
Elyt Compiler-Fehler Datei kann nicht erstellt werden. Die Syntax für den Dateinamen etc. ist falsch. Allgemeine Java-Themen 2
Thallius Rätsel für Windows Profis Allgemeine Java-Themen 8
D OOP Gemeinsamen ID-Raum für zwei Klassen implementieren Allgemeine Java-Themen 7
D Input/Output Implementierung eines CommandHandlers/Parsers für viele Eingaben Allgemeine Java-Themen 26
Thallius Alternative für SwingWorker Allgemeine Java-Themen 5
I Lohnt sich heutzutage der Aufwand einer Portierung für MacOS Allgemeine Java-Themen 8
L Klassen Algorithmus für das folgende Problem entwickeln? Allgemeine Java-Themen 30
J Datenstruktur für eine Map erstellen Allgemeine Java-Themen 2
H OOP Setting(config) für Applikation sicheren? Allgemeine Java-Themen 9
OnDemand PDF Libary für Formulare Allgemeine Java-Themen 7
S Warmup für Lineare-Suche mit Zeitmessung Allgemeine Java-Themen 2
T Allgemeine Frage: GUI für 3D-Visualisierung Allgemeine Java-Themen 5
M Brainstorming für mein Projekt Allgemeine Java-Themen 30
K OOP Suche Hilfe + Erklärung für eine Hausaufgabe Allgemeine Java-Themen 1
F Was ist der Dateityp meines Parameters für die Main Methode. Allgemeine Java-Themen 6
C Bibliotheken für Algorithmische Geometrie Allgemeine Java-Themen 2
C Daten für Klassifikationsverfahren gewinnen Allgemeine Java-Themen 6
C code oder Bibliotheken für 2-Center Problem Allgemeine Java-Themen 4
I Overlay für Spiele Allgemeine Java-Themen 5
B Suche nach einem Testprogramm für meine BA Allgemeine Java-Themen 0

Ähnliche Java Themen

Neue Themen


Oben