PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : WinXP - Leistungsfähigkeit von Desktop-Suchprogrammen


nino
2007-09-03, 11:31:14
Hi,
wie leistungsfähig sind desktop suchmaschinen wie google desktop oder windows desktop search? konkret geht es darum ca 30gb an pdf dateien im volltext zu durchsuchen. das is ja im prinzip auch mit der in windows xp integrierten suche möglich, nur dauert das ja locker ne stunde ;)
wie lange schätzt ihr würde eine suche nach dem indexieren der dateien dauern? und wie groß wäre dann der index?

Haarmann
2007-09-03, 11:37:03
nino

Ideal ist für sowas auch Paperport.
Nebenher kochen alle nur mit Wasser bei dieser Aufgabe, aber Paperport kann auch OCR auf PDFs und Bilder ansetzen.

nino
2007-09-03, 11:40:54
hi,
das klingt schonmal sehr interessant. die software wird für ne druckerei gebraucht und in dem dokumentenarchiv sind auch ne ganze reihe scans enthalten.
wie gut funktioniert denn das ocr?
das scheint ja aber ein recht umfangreiches paket zum dokumentenmanagement zu sein, eigentlich sind unsere dateien schon ganz gut organisiert.

ich werd morgen erstmal die desktop suche von microsoft testen.

Haarmann
2007-09-03, 11:51:55
nino

Perfektes OCR gibts bekanntlich nicht und es ist letzten Endes so gut, wie die Vorlagen. Ich kenne Leute, die nutzen dies für ihr Papierarchiv und finden sich damit gut zurecht.
Im Zeitalter der Scan to PDF Funktion vieler Kopierer ist dies imho recht nützlich.

CrazyHorse
2007-09-03, 12:09:21
Also ich benutze Copernic Desktop Search auf meinen beiden Rechnern. Der findet jedes Stichwort in allen möglichen Dateien und zwar ratz fatz, wenn alles indexiert ist.

Den Dateityp kann man bei der Suche einstellen. Kann ich weiterempfehlen.

nino
2007-09-03, 12:28:27
Perfektes OCR gibts bekanntlich nicht und es ist letzten Endes so gut, wie die Vorlagen.

naja wie gesagt ich arbeite in ner druckerei und die scanner sind schon sehr gut. ich frag weil es sich ja nicht lohnt extra geld für die ocr funktion auszugeben wenn sie nicht vernünftig funktioniert.
ich kenn jetzt nur das ocr von adobe, welches an sich ganz gut ist, aber wörter oder zeilen nicht immer als zusammenhängend erkennt.

so oft wird ne volltextsuche momentan aber nicht gebraucht, deswegen denk ich probier ichs erstmal mit ner kostenlosen variante ohne ocr.