HeldImZelt
2009-07-06, 21:04:46
Hallo,
ich habe zwei Dateien, die fast identisch sind, bzw. nur an einer bestimmten Stelle geringfügig andere Unterschiede aufweisen. Zu 99% sind die Dateien bitgleich. Sie sind jeweils ungefähr 100MB groß.
Jetzt wollte ich diese Dateien mit 7zip packen, da dieses sehr große Dictionary Größen erlaubt. Meine Theorie war, eine Wörterbuchgröße größer als die Datei zu wählen, damit die 2.Datei dadurch repliziert werden kann.
Dies geschah nicht. Es kam ein fast 200MB großes 7zip file dabei raus.
Die Einstellungen waren 7z, Normal, PPMd, 256MB (dictionary), 32 (word), 4GB (solid block size).
Ich weiß, dass es funktioniert. Ich habe schon öfter solche Dateien erstellt, nur nicht in dieser Größenordnung von 100MB. Bei LZMA kann nur eine Wörterbuchgröße bis 64MB gewählt werden, bei Wikipedia steht aber sie ginge bis 4GB(?) (http://en.wikipedia.org/wiki/7-Zip). Ich habe für diesen Fall PPMd gewählt, hilft aber nicht.
Kann man da was machen oder sind solch Große Dateien nicht in dieser Form zu komprimieren?
Edit: Ich habe eine Datei angehängt, die demonstriert was ich meine. Sie enthält Daten von über 20MB bei einer Größe von gerade mal 24kb. Alle Dateien sind mit Random data gefüllt und identisch.
ich habe zwei Dateien, die fast identisch sind, bzw. nur an einer bestimmten Stelle geringfügig andere Unterschiede aufweisen. Zu 99% sind die Dateien bitgleich. Sie sind jeweils ungefähr 100MB groß.
Jetzt wollte ich diese Dateien mit 7zip packen, da dieses sehr große Dictionary Größen erlaubt. Meine Theorie war, eine Wörterbuchgröße größer als die Datei zu wählen, damit die 2.Datei dadurch repliziert werden kann.
Dies geschah nicht. Es kam ein fast 200MB großes 7zip file dabei raus.
Die Einstellungen waren 7z, Normal, PPMd, 256MB (dictionary), 32 (word), 4GB (solid block size).
Ich weiß, dass es funktioniert. Ich habe schon öfter solche Dateien erstellt, nur nicht in dieser Größenordnung von 100MB. Bei LZMA kann nur eine Wörterbuchgröße bis 64MB gewählt werden, bei Wikipedia steht aber sie ginge bis 4GB(?) (http://en.wikipedia.org/wiki/7-Zip). Ich habe für diesen Fall PPMd gewählt, hilft aber nicht.
Kann man da was machen oder sind solch Große Dateien nicht in dieser Form zu komprimieren?
Edit: Ich habe eine Datei angehängt, die demonstriert was ich meine. Sie enthält Daten von über 20MB bei einer Größe von gerade mal 24kb. Alle Dateien sind mit Random data gefüllt und identisch.