Zufallsauswahl aus ResultList bei JPA(Hibernate) / Performance

JanHH

Top Contributor
Hallo,

folgende Problemstellung: Eine simple JPA-Query liefert eine ResultList, unter Umständen eine recht lange (mehrere 10.000 Einträge). Nun soll aus dieser Liste eins (oder auch mal mehrere) Elemente zufällig ausgewählt werden.

Wie macht man das richtig, wie verhält sich das performancetechnisch?

Ich kann ja problemlos die Länge der Liste in Erfahrung bringen, dann eine Zufallszahl erzeugen (welche niedriger als die Länge der Liste ist), und mit list.get(zufallszahl) auf ein Element zufällig zugreifen. Aber was passiert da intern?

Mir wurde mal erzählt, die Liste bzw. ihr Iterator ist in Wirklichkeit ein Pointer auf das entsprechende ResultSet innerhalb der Datenbank, und erst wenn man auf die Objekte zugreift, werden sie tatsächlich aus der Datenbank geladen. Stimmt das? Also wenn ich bspws. sage: list.get(10000), werden dann a) alle Objekte aus der Liste aus der Datenbank geladen und dann auf das 10.000te zugegriffen (was langsam sein dürften), b) alle Objekte bis zum 10.000ten gelanden, c) nur das 10.000te geladen?

Also wenn ich nun, sagen wir mal, 50 zufällige Objekte aus einer 20.000 Einträge langen Liste haben will, wie macht man das optimalerweise, so dass die performance nicht den Bach runter geht?

Gruß+Danke
Jan
 
Zuletzt bearbeitet:
S

SlaterB

Gast
ResultList finde ich bei google nicht, ResultSet dagegen schon,
oder erhältst du irgendwo eine java.util.List als Rückgabe? so kenne ich es bei Hibernate

ich kann mir nicht vorstellen, das es dort einen Index-Zugriff gibt (ResultSet) oder irgendeine Art Durchlaufen,
bei dem letzlich nicht alle Objekte aus der DB geladen werden, aber sicher bin ich mir da längst nicht

zwei Alternativen:
1. lade nur 50 Elemente aus der DB, setzte also maxResults, wie immer das bei deiner DB oder deinem Java-Framework funktioniert,
vorher noch die Ergebnisse zufällig sortien, also mischen, wiederum 'wie immer das auch geht', order by rand() habe ich im Ohr, aber vielleicht DB-abhängig,

im äußersten Notfall eine zusätzliche Spalte einfügen und die irgendwann mal mit Zufallszahlen besetzen,
allzu variabel ist das dann nicht für mehrere Queries, vielleicht helfen dafür Berechnungen:
[c]order by (randAttribut * x) modulo y[/c] mit zufälligen x/y pro Query

2. lade nur die Ids oder sonstwas kleines, so dass es nicht mehr belastend ist, alle 20.000 Einträge direkt in Java vorliegen zu haben,
da dann auf beliebige Weise 50 auswählen und nur diese komplett nachladen
 
Zuletzt bearbeitet von einem Moderator:

JanHH

Top Contributor
Query q=entityManager.createQuery();
List l=q.getResultList();

gibt in der Tat eine List zurück.

Naja ich denk ich werd die Performance bei 10.000 Einträgen einfach mal Testen..
 

JanHH

Top Contributor
Für meine Anwendung scheint folgende Variante optimal:

- schon beim Anlegen der Daten in der Datenbank pro Zeile eine eindeutige Zufallszahl vergeben (b.random)
- bei der query dann "order by b.random" und setMaxResults()

geht bei 13.000 Zeilen zumindest ruckzuck.

Danke
Jan
 
Ähnliche Java Themen
  Titel Forum Antworten Datum
T Hibernate/Spring JPA: eigene ID generieren Data Tier 5
Avalon @ManyToOne Hibernate oder JPA? Data Tier 5
D Hibernate Hibernate mit MariaDB Data Tier 1
ToBJo Hibernate Glassfish deploy mit Hibernate schlägt fehl Data Tier 1
C JPA Hibernate Map<String,String> richtig mappen Data Tier 2
S JPA Hibernate Search & EclipseLink (oder OpenJPA) Data Tier 0
R JPA Probleme mit Wechsel von EclipseLink auf Hibernate Data Tier 4
ARadauer Hibernate Entität readonly laden... Data Tier 1
G Hibernate SQL in Hibernate: Keine Parameter mit Index? Data Tier 2
P Wildfly + Hibernate + SQL Server Data Tier 0
E JPA Hibernate Query mit Timestamp hat seltsames Verhalten Data Tier 1
M Eclipse 4 RCP Hibernate Problem Data Tier 3
C Hibernate ProgressBar updaten mit Daten aus Hibernate Data Tier 4
B Hibernate und MySQL testen Data Tier 8
I Hibernate HQL: generiertes SQL ausgeben Data Tier 1
R mapping-file für hibernate zum Überschreiben der Annotationen Data Tier 7
R Hibernate Hibernate und Logback Data Tier 2
R Hibernate möchte Schema zwei mal undeployen Data Tier 2
F Hibernate Hibernate / JPA Data Tier 4
E Hibernate: Session vs EntityManager Data Tier 3
C Hibernate Hibernate Code Generation Data Tier 3
S Hibernate Mehrfachverbindung mit Hibernate Data Tier 3
M Hibernate Einstiegsfrage Data Tier 5
M Exception in thread "main" org.hibernate.MappingException: java.lang.ClassNotFoundException: Message Data Tier 4
S Hibernate Einstieg in Hibernate 3.2 sinnvoll? Data Tier 8
P JPA Eigene Vererbungsstrategie mit JPA / Hibernate Data Tier 2
J Hibernate Problem bei Master-Detail-Tabellen Data Tier 5
Y Jboss seam-hibernate-jpa Data Tier 5
RaoulDuke Hibernate Map<String,String> mit Annotations mappen Data Tier 2
M Hibernate Hibernate with GWT Data Tier 4
C Hibernate JPA mysql db erstellen Data Tier 4
M Hibernate Hibernate liest Daten zu oft aus! Data Tier 16
pg1337 Hibernate Fragen Data Tier 11
D Probleme bei Left Joins mit Hibernate createCriterias() Data Tier 2
D Hibernate probleme mit Verlinkungstabelle Data Tier 4
2 Hibernate Annotations Data Tier 7
G Hibernate select update no wait Data Tier 8
Z Hibernate: Many-To-Many nur eine bestimmte Spalte Data Tier 3
K Hibernate - Envers - Erzeugung der SQL Skripte Data Tier 4
G Hibernate 1:n Beziehung mit Vererbung Data Tier 5
D Hibernate-Criteria-API (Projections und MAX-Funktion) Data Tier 6
L Hibernate: failed to lazily initialize a collection of role Data Tier 3
S Hibernate hibernate.cfg.xml Data Tier 14
D JPA vs Hibernate.cfg und Entitymanager Data Tier 6
H Hibernate - Mapping für Enumeration Data Tier 1
R Hibernate Criteria Abfrageproblem Data Tier 2
A Hibernate und jdbc zusammen Data Tier 4
D Mit Hibernate aus JUnit ein DB-Schema erzeugen Data Tier 6
S [Hibernate] No Persistence provider for EntityManager Data Tier 5
B Problem mit org.hibernate.LazyInitializationException Data Tier 11
G Hibernate HQL und Interface Data Tier 4
G JSF Hibernate no session or session was closed Data Tier 12
T JPA2/Hibernate: Many-to-Many-Relation wird u.a. beim löschen nicht aktualisiert Data Tier 14
S (Hibernate) Mapping einer Datenbanktabelle mit mehreren Fremdschlüssel Data Tier 7
X [Hibernate] Zusammengesetzte Entities möglich? Data Tier 7
N Hibernate Fake? Data Tier 2
S Problem beim Insert mit Hibernate Data Tier 9
V Hibernate Projection Data Tier 2
T org.hibernate.impl.SessionFactoryImpl Memory Leak Data Tier 10
G Hibernate Composite key Data Tier 11
X [Hibernate] Connection Pool - MinSize ? Data Tier 2
R Hibernate Criteria OR Data Tier 2
T hibernate/jpa abgefragte Listen immer mit Null-Werten gefüllt Data Tier 8
X [Hibernate] Anderen Connection Pool - Vorschläge? Data Tier 3
ARadauer Hibernate DDL Loggen Data Tier 6
G Hibernate abfrage Collection Data Tier 3
X [Hibernate] ReverseEngineering - Eigene Strategy verwenden? Data Tier 3
R Hibernate Criteria .group größer als Data Tier 5
R Hibernate daten laden Data Tier 7
H [Hibernate]1:1 Beziehung Data Tier 8
H [Hibernate]No CurrentSessionContext configured! Data Tier 6
X [Hibernate] Lässt sich die Dauer eines SELECTs loggen? Data Tier 4
R Hibernate n:n Relationtabelle mit Date Data Tier 3
H [Hibernate] Unknown Entity Data Tier 3
H [Hibernate] Configuration Data Tier 3
C [Hibernate] Generierung von hbm.xml to Java Data Tier 4
lumo Eclipse & JPA & Hibernate & Derby Data Tier 5
M Hibernate: Datum 0001-01-01 erzeugt null-Datum Data Tier 4
G Datenbankzugriff mit Hibernate Data Tier 7
Y Hibernate - Angabe des Schemas Data Tier 6
LadyMilka (Hibernate) in Criteria implizierter Join durch Subquery's Data Tier 8
M Hibernate Mehr als 1 Object speichern? Data Tier 18
M Unerklärliche Hibernate Exception Data Tier 20
LadyMilka (Hibernate) subquery in FROM-Clause Data Tier 9
haemi Viele DTOs in hibernate IdentityMap Data Tier 3
LadyMilka (hibernate) UNION dem Dialekt hinzufügen Data Tier 3
M Hibernate + Oracle 10g XE Data Tier 3
lumo Hibernate - entity class not found Data Tier 5
P SQL PRoblem Hibernate? Data Tier 8
J Vererbung mit JPA / Hibernate - pro/contra Data Tier 3
T JBoss/Hibernate: Abfrage dauert lang + hohe CPU? Data Tier 19
7 Hibernate-Abfrage (SubSelect im FROM) Data Tier 2
G Hibernate: many-to-one - Verwaiste Datensätze löschen Data Tier 2
G Layer für Datenbankzugriff Hibernate Data Tier 5
G Hibernate Zwischentabelle Data Tier 2
Java.getSkill() Hibernate und Spalte vom Typ xml Data Tier 6
G Hibernate 0...1 : 1 Beziehung Data Tier 6
G Hibernate mehrere @oneToone Data Tier 2
G Hibernate 1:n, 1:1 Data Tier 26
E Hibernate: Unlogische Exception bei Tabellengeneriung Data Tier 12

Ähnliche Java Themen

Neue Themen


Oben