Archiv verlassen und diese Seite im Standarddesign anzeigen : Win 7 x64 - Sammlung nicht lesbarer PDFs möglichst schnell lesbar machen und Durchsuchen
Lawmachine79
2018-08-07, 14:03:41
Hey Leute, ich habe hier so 600 PDF-Dateien. Keine davon ist lesbar. Gibt es einen Weg, die "durch 'nen Wolf zu drehen" (also nicht einzeln mit Nuance lesbar zu machen, das dauert ja ewig). Danach will ich die Dokumente nach einem bestimmten Begriff durchsuchen. Lösungen, bei denen ich Dokumente irgendwo hochladen muss, sind ausgeschlossen.
seba86
2018-08-07, 18:41:02
Aktuelle OCR-Software sollte doch dafür längst Batch-Aufgaben bieten.
Abby Page Reader oder Omnipage waren bzw. sind doch dort die Platzhirsche.
Rooter
2018-08-07, 18:42:44
Warum sind die nicht lesbar?
MfG
Rooter
Lawmachine79
2018-08-07, 18:46:07
Warum sind die nicht lesbar?
MfG
Rooter
Weiß ich nicht.
seba86
2018-08-07, 20:07:59
..weil es z.B. PDF mit eingescannten Bildern sind, welche Text darstellen...
Simon Moon
2018-08-08, 21:24:32
Probier mal den PDF Reader neu zu installieren.
Rooter
2018-08-09, 02:18:50
@TS, was verstehst du bitte unter "nicht lesbar"? Kann man sie nicht öffnen oder kann man sie öffnen aber nicht nach Text durchsuchen wegen dem was Seba86 geschrieben hat? :|
MfG
Rooter
lumines
2018-08-11, 13:46:01
Wenn sie nicht zu öffnen sind, würde ich mit einem Hex-Editor (oder was auch immer man dafür nimmt) einmal den Header angucken und den eventuell hier posten.
Wenn es einfach nur Bilder in PDFs sind, ist definitiv irgendein OCR-Programm die richtige Wahl. Wenn die Qualität der Scans gut ist und eine Schrift benutzt wurde, mit der OCR-Programme gut umgehen können, sollten die Ergebnisse schon sehr gut sein. Ich meine, dass ich einmal vor Ewigkeiten Abbyy benutzt habe und das hat sehr gut funktioniert.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.