PDF strukturiert herauslesen

feil

Neues Mitglied
Hallo ich bin neu im forum,

ich möchte ein skript schreiben, dass eine pdf datei strukturiert herausliest dh. ich habe einen digitalen katalog (pdf) mit unzähligen artikeln und möchte in diesem nach der artikelnummer eines artikels suchen und somit alle daten dieses artikels herauslesen.

zB:

ich suche nach der artikelnummer 103 311 351 und will damit Werk Nr., Montageart, Preis, Bild, ... auf einmal herauslesen.

Ich habe nur leider keine ahnung wie ich das anstelle.

Mit freundlichen Grüßen
feil
 

Bleiglanz

Gesperrter Benutzer
Wenn das eine einmalige Angelegenheit ist: Das Programm Foxit Reader (ein kostenloser PDF Betrachter) kann das PDF als Textdatei (.txt) speichern. Würde ich machen und dann mit Java weiterbearbeiten...
 

Ullenboom

Bekanntes Mitglied
iText wurde ja schon genannt, alternativ Apache PDFBox. Ich hatte mal einen Extractor für Kontoauszüge gebaut und die Ergebnisse waren mit PDFBox deutlich besser.
 

Ähnliche Java Themen


Oben