Naja. Von Bearbeiten hast du nichts gesagt. Und mit pdf2xml hätte man wenistens eine Struktur, mit der man recht einfach durchsuchen kann. So war mein Gedankengang

Mit PDFBox habe ich bisher nur mehrere PDFs zu einer gemerget. Daher kann ich dir leider dabei nicht weiter behilflich sein.
Viel Erfolg. Und wenn du etwas nützliches herausgefunden hast, würd ich mich freuen, wenn du das hier mal kurz erläuterst.
Lg
sayang