Hallo,
folgende Problemstellung: Eine simple JPA-Query liefert eine ResultList, unter Umständen eine recht lange (mehrere 10.000 Einträge). Nun soll aus dieser Liste eins (oder auch mal mehrere) Elemente zufällig ausgewählt werden.
Wie macht man das richtig, wie verhält sich das performancetechnisch?
Ich kann ja problemlos die Länge der Liste in Erfahrung bringen, dann eine Zufallszahl erzeugen (welche niedriger als die Länge der Liste ist), und mit list.get(zufallszahl) auf ein Element zufällig zugreifen. Aber was passiert da intern?
Mir wurde mal erzählt, die Liste bzw. ihr Iterator ist in Wirklichkeit ein Pointer auf das entsprechende ResultSet innerhalb der Datenbank, und erst wenn man auf die Objekte zugreift, werden sie tatsächlich aus der Datenbank geladen. Stimmt das? Also wenn ich bspws. sage: list.get(10000), werden dann a) alle Objekte aus der Liste aus der Datenbank geladen und dann auf das 10.000te zugegriffen (was langsam sein dürften), b) alle Objekte bis zum 10.000ten gelanden, c) nur das 10.000te geladen?
Also wenn ich nun, sagen wir mal, 50 zufällige Objekte aus einer 20.000 Einträge langen Liste haben will, wie macht man das optimalerweise, so dass die performance nicht den Bach runter geht?
Gruß+Danke
Jan
folgende Problemstellung: Eine simple JPA-Query liefert eine ResultList, unter Umständen eine recht lange (mehrere 10.000 Einträge). Nun soll aus dieser Liste eins (oder auch mal mehrere) Elemente zufällig ausgewählt werden.
Wie macht man das richtig, wie verhält sich das performancetechnisch?
Ich kann ja problemlos die Länge der Liste in Erfahrung bringen, dann eine Zufallszahl erzeugen (welche niedriger als die Länge der Liste ist), und mit list.get(zufallszahl) auf ein Element zufällig zugreifen. Aber was passiert da intern?
Mir wurde mal erzählt, die Liste bzw. ihr Iterator ist in Wirklichkeit ein Pointer auf das entsprechende ResultSet innerhalb der Datenbank, und erst wenn man auf die Objekte zugreift, werden sie tatsächlich aus der Datenbank geladen. Stimmt das? Also wenn ich bspws. sage: list.get(10000), werden dann a) alle Objekte aus der Liste aus der Datenbank geladen und dann auf das 10.000te zugegriffen (was langsam sein dürften), b) alle Objekte bis zum 10.000ten gelanden, c) nur das 10.000te geladen?
Also wenn ich nun, sagen wir mal, 50 zufällige Objekte aus einer 20.000 Einträge langen Liste haben will, wie macht man das optimalerweise, so dass die performance nicht den Bach runter geht?
Gruß+Danke
Jan
Zuletzt bearbeitet: