- PVSM.RU - https://www.pvsm.ru -

Оптимальная сортировка непрерывного архива

Воплощение одной идеи – расположить файлы так, чтобы размер архива был минимальным.
Программа проверяет сжимаемость файлов в паре и затем сортирует список для сжатия архиватором.

sourceforge.net/projects/saro-vks/ [1]
Если кому надо – берите.

В общем-то, мысль не нова – например, WinRAR пятой версии может находить дубликаты и сохранять их в архиве как ссылки.
Здесь похожий принцип – «подобность» файлов определяется проверкой сжатия.

Лучше всего результат получается с большими файлами, когда размер пары файлов больше объёма «словаря» архива.
Например, 1.5 Гб исполняемых файлов, примерно по 50 Мб каждый, ужались с 709 до 696 Мб, а архив с 25 Мб MIDI файлов, 30..300 кб каждый, уменьшился с 5.55 до 5.51 Мб, по сравнению с «заводской» сортировкой.

p.s. Извиняюсь за сыроватую версию, но «допиливание» идёт медленно, и когда будет окончательный вариант – неизвестно, а пользоваться ей уже вполне можно.
Пока есть существенный минус – размер архивов с парами файлов ограничен 4 Гб (очень большие файлы были не нужны, а обработка 64-битных размеров занимает больше времени).
Если чего-то не хватает – пишите, сделаю, если получится.

Автор: VaKonS

Источник [2]


Сайт-источник PVSM.RU: https://www.pvsm.ru

Путь до страницы источника: https://www.pvsm.ru/open-source/86146

Ссылки в тексте:

[1] sourceforge.net/projects/saro-vks/: http://sourceforge.net/projects/saro-vks/

[2] Источник: http://habrahabr.ru/post/253313/