Главная

Удаление метаданных из PDF

2017-03-20 в 8:27, admin, рубрики: adobe acrobat, exiftool, forensic toolkit, howto, MetaData, PDF, qpdf, xpdf, информационная безопасность, метаданные

Вот, казалось бы, тривиальная задача — удалить metadata из документа. Уже тысячу раз специалисты по ~~паранойе~~ информационной безопасности давали подобного рода рекомендации: «обязательно удаляйте избыточную метаинформацию из документов перед публикацией». И объясняли зачем это может понадобиться (пример). В сети масса инструкций о том как это сделать для различных форматов изображений и документов, но в то же время про такой распространённый формат как PDF внятной информации довольно мало.

Я провел небольшой эксперимент и по результатам собрал небольшой toolchain и freeware утилит. Вот этим всем и хочу поделиться.

Итак, первое что было сделано — проведена попытка удалить данные средствами самого Adobe Acrobat по соответствующей инструкции. Результат есть, но его никак нельзя назвать удовлетворительным, т.к. во-первых это стрельба из пушки по воробьям, а во-вторых объём файла на выходе почему-то увеличился почти на порядок.

Затем, среди кучи crapware была найдена чудесная windows утилита BeCyPDFMetaEdit, но она уверенно справляется с PDF v 1.6 и ниже, а для более новых ревизий формата результат не гарантирован.

Ultimate решение как водится пришло из мира *nix и сообщества сторонников свободного ПО с отрытым исходным кодом. Это связка из утилит ExifTool, QPDF и Xpdf, каждая их которых доступна также и под Windows. Т.к. лицензии этих утилит не запрещают их свободно распространять без изменений, то я смело собрал их в едином архиве со скриптом и элементарной инструкцией по применению. Если кратко, то Вы распаковываете архив, кладете подлежащий очистке pdf файл в получившуюся папку и затем перетаскиваете его на DEMETA.bat. Скрипт отработает и ваш файл станет девственно чист.

Источники вдохновения и ссылки на используемое ПО

www.metawiper.com/How-to-remove-metadata-from-pdf-file
askubuntu.com/questions/27381/how-to-edit-pdf-metadata-from-command-line
gist.github.com/hubgit/6078384
www.sno.phy.queensu.ca/~phil/exiftool
qpdf.sourceforge.net
stackoverflow.com/questions/19263643/windows-equivalent-for-unixs-pdfinfo
www.foolabs.com/xpdf/download.html
www.becyhome.de/becypdfmetaedit/description_eng.htm

Автор: zilia

Источник