Настоящая статья предназначена для IT-менеджеров и системных администраторов, отвечающих за разработку и внедрение стратегий резервного копирования и сохранности данных. В статье рассматриваются типичные проблемы, связанные с повреждением данных, недостатки традиционных способов решения этих проблем и способы улучшения имеющихся стратегий для дальнейшей минимизации потерь при сбоях.
Статья основана на уникальной статистике, собранной на массиве из 200 тысяч поврежденных файлов, прошедших восстановление в системе OfficeRecovery Online.
Проблема и причины ее возникновения
Одной из самых важных задач при планировании и реализации информационной инфраструктуры является обеспечение сохранности данных. Порча или исчезновение накопленной информации может нанести ощутимый ущерб бизнесу. Поэтому обеспечение надежности и сохранности данных должно быть разнообразным и многоуровневым, защищающим от как можно большего числа возможных ситуаций потери данных.
Для того, чтобы рассмотреть основные методы обеспечения сохранности данных, рассмотрим основные причины их повреждения:
- Аппаратный сбой. Утеря данных в результате сбоя физического носителя. При таком повреждении произвольные части файлов заменяются на бессмысленные данные. В тяжелых случаях повреждения выходят за пределы файлов и могут затронуть файловую систему в целом, из-за чего могут возникнуть проблемы даже с нахождением файлов, а не только с их чтением.
- Программный сбой. Утеря данных после ошибки в работе обрабатывающего их приложения, например, при сохранении изменений в файл. Типичные разновидности проблем этого типа: нехватка памяти, ошибка в приложении, сбой в работе операционной системы. В таком случае данные в файле могут перестать быть целостны, но хорошо поддаются восстановлению.
- Человеческий фактор. Например, утрата важных данных из-за ошибочного удаления файлов. Современные средства восстановления удаленных данных с диска применяют специализированные алгоритмы, но это далеко не всегда приносит нужный результат. В итоге, некоторые части файлов могут быть “затерты” произвольным мусором с диска.
В качестве основного способа борьбы с последствиями перечисленных причин порчи данных применяется резервное копирование, а в крупных организациях — так называемый Disaster Recovery Planning, планирование на случай чрезвычайных ситуаций (далее — DR-стратегия и DR-планирование).
Резервное копирование и DR-планирование как решения проблемы испорченных данных
Интересно отметить, что если на западе DR-планирование — горячая тема уже в течении многих лет, то в отечественном IT-глоссарии этот термин не существует, во всяком случае русского аналога у соответствующей статьи в википедии нет.
Отличие стратегии резервного копирования от DR-планирования состоит в том, что второе — это всеобъемлющий набор технологий и процедур, отвечающий на все вопросы, сопутствующие восстановлению IT-инфраструктуры бизнеса после катастрофических событий. Если задача резервного копирования — вернуть пользователям целостный набор данных, то задача DR-планирования — вернуть в строй работающую IT-инфраструктуру, что часто эквивалентно возвращению в строй всего бизнеса.
Резервное копирование, использование устойчивых к сбоям хранилищ данных (например, дисковых массивов RAID), таким образом, является лишь технологическими приемами, используемыми при разработке DR-стратегии.
Конечной целью DR-планирования заявляется полная ликвидация ситуаций, когда приходится иметь дело с испорченными файлами и базами данных. Любой поставщик решений в этой области с уверенностью расскажет вам, как в случае форс-мажора ваши данные вернутся к вам, стоит лишь нажать на несколько кнопок.
К сожалению, это не совсем так. Если посмотреть правде в глаза, придется признать, что испорченные файлы все равно появляются, даже в организациях с миллиардными вложениями в защиту данных.
Основные причины этого следующие:
- Ненадлежащее использование систем резервного копирования и неправильное исполнение внедренных практик. Вероятность того, что внедренное вами решение защиты данных работает через три дня после внедрения — 99% и, скорее всего, даже намного выше. Но время идет, хранилища переполняются, сотрудники приходят и уходят. Через два года может обнаружиться, что решение уже давно перестало работать, но за этим не уследили.
- Неизбежное существование зон, не покрытых системами резервного копирования. Ваш сотрудник имеет привычку редактировать важный для бизнеса конфиденциальный документ прямо на флешке? Одно несвоевременное извлечение флешки из компьютера во время редактирования — и вот получился очередной испорченный файл.
- Периодичность резервного копирования. Характерна периодичность в 24 часа, но это может быть и 72 часа, и 12 часов, в зависимости от того, сколько ресурсов вы можете выделить на хранение резервных копий. Проблема состоит в том, что при наступлении форс-мажора вам гарантированы целостные данные 24-часовой (или 72-часовой, или 12-часовой) давности. Данные, накопленные с момента последнего бекапа, никто вам восстановить не обещает. А это самые новые, и нередко самые ценные данные.
- Подверженность систем резервного копирования тем же сбоям, которые испортили данные на рабочих серверах. Это, конечно, относится к недостаткам DR-планирования, но часто случается, что резервный RAID заливает дождем даже чуть раньше, чем защищаемый им рабочий сервер, стоящий неподалеку.
Что же делать если файл повредился, работающее с ним приложение отказывается его открывать, а система резервного копирования не может предложить копию, содержащую нужные вам данные? Возможно ли восстановить данные, находящиеся в самом поврежденном файле? Какова вероятность того, что удастся это сделать? Что это значит для улучшения DR-планирования в вашей организации?
OfficeRecovery Online: анализ 200000 восстановлений испорченных файлов
В августе 2011 года OfficeRecovery запустила облачный сервис по онлайн-восстановлению поврежденных файлов (https://online.officerecovery.com/ru/). К сентябрю 2012 года через систему прошло 200 тысяч файлов, и была собрана статистика, представляющая значительный интерес с точки зрения DR-планирования для организаций, ищущих способы повысить устойчивость бизнеса к техногенным форс-мажорным обстоятельствам.
Порядка месяца ушло на обработку собранных данных и выявление типичных причин повреждений. Вот статистика успешности восстановления некоторых популярных типов файлов:
- Файлы Corel WordPerfect — 93.1% успешно восстанавливаются
- Архивы ZIP — 79.0%
- Документы Microsoft Word — 75.9%
- Файлы Microsoft Project — 66.2%
- Изображения Adobe Photoshop — 66.1%
- Электронные таблицы Microsoft Excel — 63.2%
- Базы данных Microsoft Access — 55.4%
- Презентации Microsoft PowerPoint — 52,1%
- Графические форматы (картинки, фотографии) — 46.4%
Примечание: восстановление считается успешным, когда из файла удается достать хотя бы часть данных. Потери данных обычно неизбежны, но часто даже небольшой восстановленный фрагмент представляет для клиентов большую ценность.
Основную сложность для восстановления представляют графические форматы. Связано это с тем, что зачастую содержимое изображения хранится в сжатом виде и восстановить следующую за местом повреждения часть рисунка в приемлемом виде практически невозможно. В основном это касается форматов JPEG, TIFF и RAW.
Заметно лучше ситуация с форматами офисных приложений. OfficeRecovery работает с форматами офисных приложений уже более 14 лет и имеет большой опыт в этой области.
Легкими в плане восстановления считаются файлы Microsoft Word, так как в случае даже очень серьёзных повреждений файла, остается как минимум возможность достать весь хранящийся в файле текст, хотя и с потерей форматирования. Зачастую это является единственной возможностью помочь пользователям.
Следующим по легкости восстановления является Microsoft Excel: если внутренняя структура файла серьёзно повреждена и невозможно полноценно прочитать набор листов в рабочей книге, то остается возможность извлечь содержимое всех ячеек на одну страницу.
В среднем, восстановления были успешными в более чем половине случаев! Иными словами, OfficeRecovery Online вернула пользователям полное или частичное содержимое из 100 тысяч файлов, считавшихся утраченными.
Восстановление испорченных файлов как часть стратегии обеспечения сохранности данных
Как показывает настоящая статья, сломанные файлы а) являются распространенной проблемой и б) в большинстве своем подлежат “лечению” разной степени успешности.
Вывод: разрабатывая свою DR-стратегию, сразу включите в нее программные продукты и процедуры для восстановления испорченных данных, образующихся в результате сбоев в вашей IT-инфраструктуре. Не рассчитывайте на то, что благодаря внедрению системы резервного копирования такая ситуация “невозможна в принципе”.
OfficeRecovery предлагает комплекс продуктов, дополняющий традиционные решения DR-планирования возможностью восстановить данные, по тем или иным причинам оказавшиеся за пределами покрытия системами резервного копирования.
Для таких “легких” форматов, как Word, Excel, PowerPoint и десятков других, составляющих основу делового электронного документооборота, хорошо подойдет онлайн-сервис OfficeRecovery Online. При помощи этого сервиса любой сотрудник может восстановить сломанный файл, не имея специальных навыков и используя только браузер. Сразу после восстановления доступны демо-результаты, и даже есть возможность бесплатного получения результатов через 2-4 недели с момента восстановления. За дополнительную плату возможен анализ и лечение проблемных файлов квалифицированными специалистами.
Для восстановления больших объемов данных (например, при повреждении баз данных, образов виртуальных дисков, почтовых баз Exchange) на основном сайте OfficeRecovery (www.officerecovery.com) предлагается набор традиционных “оффлайновых” программных продуктов для восстановления данных большинства распространенных форматов. Эти продукты также рекомендованы для случаев, когда онлайн-восстановление невозможно из соображений конфиденциальности. Вместо закачки поврежденных данных на онлайн-сервис, клиент может купить соответствующий программный продукт и восстановить данные, не отдавая их за пределы своей компании.
Автор: nicks