PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Programm zum identifizieren von Dateien?


stickedy
2005-03-17, 14:56:02
Gibt es ein Programm, dass den Inhalt der Dateien unabhängig von der Dateiendung identifizieren kann?
Ich weiss, dass das schwierig ist, denkbar wäre ja dass die Datei auf bestimmte Muster bekannter Dateitypen (Word, Excel, mp3 usw) gescannt wird. Jedenfalls war google diesmal nicht mein Freund...

Konkret geht es um die Identifizierung von umbenannten MP3s (Firmennetzwerk).

Danke schon mal!

Lokadamus
2005-03-17, 16:27:49
mmm...

Im Prinzip kann man es selber machen, zumindest, wenn man nur zwischen bestimmten Sachen wie Rar, MP3, WAV und Doc machen will => alle Dateien mit einem Hex- Editor öffnen und den Anfang anschauen ... ein Programm, was selbstständig Dateiendungen auf mehrere Dateien anwenden kann, kenne ich nicht ...

stickedy
2005-03-17, 17:18:10
Naja, die Methode ist es etwas müsig bei ungefähr 250 GB an Daten. Wobei man natürlich Einschränken könnte auf alle Dateien > 2,5 MB oder so, aber trotzdem ist das dann ne Schweine-Arbeit...

littlejam
2005-03-17, 17:37:58
Wenn du Dateien mit "^ID3" als regular expression suchst, hast du schon mal viele MP3s gefunden.
Schwieriger wirds bei einigen MP3s die kein ID3 Tag haben, da kannst du nach "^ÿû" suchen, nur da wirst du auch viele .pdf finden.

Mir fällt auf die schnelle keine Lösung ein, eine Datei nur auf die ersten 3 Zeichen zu prüfen, das würde die Suche zuverlässiger machen.

Gruß
Daniel

Gasst
2005-03-17, 17:44:07
Irgendwie muss es ja gehen. Nehmen wir mal an, jemand hat illegale Dokumente/Dateien, wasweisich und wird von den Bullen erwischt. Er hat aber Millionen Dateien auf seinem PC. Die Ermittler suchen dann ja auch nicht von Hand in allen Dateien, ob die umbenannt sein könnten. Oder gibt es keine andere lösung?

littlejam
2005-03-17, 23:15:53
awk und evtl. grep unter linux/unix können das bequemer. Es gibt auch Portierungen auf Windows, die kann man auch nehmen.

Man kann auch leicht selber was proggen, nur das ist ja dann keine schnelle/allgemeine Lösung ;)
Ein Programm, was die ersten x Zeichen von allen Dateien einliest, geht in c ganz fast´n dirty.

Gruß