В пятницу 19 июня клиенты облачного сервиса Яндекса стали жертвами редкого стечения обстоятельств: сбой произошёл одновременно на четырех физических серверах.
Сетевой диск выдерживает одновременный отказ двух серверов без потери данных. В момент отказа сервера данные начинают реплицироваться на другие сервера. Но одновременный отказ 4-х серверов за такой короткий промежуток времени привел к тому, что не все данные успели реплицироваться. В результате этого часть данных на дисках оказалась потеряна.
В ночь с понедельника на вторник представители «Облака» сообщили, что работа пострадавших сервисов управляемых баз данных полностью восстановлена. Инцидент затронул менее 1% физических дисков, расположенных в зоне доступности ru-central-b.