Социальная сеть "Одноклассники" удивила Рунет нехарактерно долгим "блэкаутом" - с 4 по 7 апреля, представители компании лаконично сослались на проблемы в дата-центре, вызвав массу домыслов о том, что же можно так долго чинить.
Roem.ru узнал у руководителя сервиса Ильи Широкова о подробностях произошедшего:
В результате технического сбоя во время выкладки конфигурационного файла на все сервера ОК произошли необратимые изменения. В течение 10 минут произошел рост использования ресурсов серверов до 100%. От нас потребовался принудительный рестарт и ручное переконфигурирование значительной части из более чем 5 000 серверов. Это повлекло за собой восстановление работы систем хранения данных и запуск сервисов с нуля.
С утра воскресения Одноклассники работают в полном режиме.
- Связано ли это, как предположил Николай Дуров, со спецификой базы (распределенная MS SQL)?
Наш MS SQL вообще не был затронут сбоем. Проблемы коснулись только Linux-серверов.
- Как блэкаут отразился на аудитории пользователей (сколько трафика потеряли, как себя чувствует саппорт) и рекламодателей (компенсируете ли простой, и как?)
Если посмотреть статистику LI то наша ежедневная аудитория после устранения сбоя не упала, а даже немного приросла. Говорить о каких-то детальных оценках сейчас рано, так как должно пройти время, чтобы мы могли оценить потери.
Мы точно будем продлевать для пользователей, которые имели платные услуги, срок действия этих услуг. Над другими компенсационными мерами мы думаем, и точно объявим о них в ближайшее время. Что касается рекламодателей, то они платят за фактические показы или клики.