Moin,
da dürftest Du kaum den erwarteten Erfolg haben, weil PDF ein ganz eigenes (sog. geschlossenes Datei-) Format ist und das, was nach Text aussieht, nicht unbedingt auch Text ist, sondern durchaus aus reinen Vektoren (Pfaden) bestehen kann. Bei PDF geht's um eine zuverlässige Ausgabe (Bildschirm, Druck...) oder Archivierung, nicht um eine andersweitige Weiter-Nutzung der Inhalte.
Zudem sind die Texte, sofern vorhanden, selten als zusammengehörige Blöcke nutzbar und Bilder z.T. gespliced. Von Verschlüsselung ganz zu schweigen. Da den Inhalt rauszufrickeln... viel Spaß
Es gibt da diverse Tricks, mit denen die Problematik umgangen wird (z.B. eine OCR drauf los lassen).
Ich glaube nicht, dass Du in JAVA fündig wirst, die Sache ist wirklich nicht trivial.
Ausschließen will ich das aber auch nicht :noe: wünsch Dir viel Erfolg!