Аварии, даже в самых надежных дата-центрах, происходят регулярно. Как правило, владельцы серверных ферм с большой неохотой делятся данной информацией. Согласно статистике, средний размер расходов из-за даунтаймов на серверных фермах только растет, показатель увеличился на 41% по сравнению с 2010 годом, теперь сумма издержек составляет почти 8 тысяч долларов в минуту ( отчет исследовательских компаний Ponemon Institute и Emerson Network Power). Теряются деньги, имидж компаний задет, репутация запятнана, ведь надежность вычислительной инфраструктуры компании — первый показатель высокотехнологичности этой же компании. Но как показывает практика, никто не застрахован от аварий.
ЦОД Northrop Grumman
В конце мая почти 60 государственных организаций штата Вирджиния (США) не могли достучаться к своим ИT-системам несколько часов. Вызвано это было из-за отключения местной серверной фермы, которая принадлежит компании Northrop Grumman (ЦОД в городе Честер).
Неисправный сетевой коммутатор, вызвавший отключение электричества, — вот причина 5 часового даунтайма. Проблему устранили, заменив неисправное оборудование резервным с тестовой площадки. Выход из работы коммутатора привел к отключению исходящего и входящего трафика в рамках информационно-технологической инфраструктуры органов исполнительной власти. Все это еще более обострило и так нелегкие отношения между компанией Northrop Grumman и властями. Не так давно уже была выдвинута инициатива о расторжении контракта на предоставление ИT-услуг компанией Northrop Grumman. Данный контракт был подписан 10 лет назад на общую сумму $2,3 млрд.
Amazon
На прошлой неделе на официальном сайте Amazon Web Services (AWS) были опубликованы извинения за случившийся даунтайм, который привел к недоступности многих сайтов. В офлайне оказались сайты клиентов AWS, это и новостные ресурсы, сервисы потоковой трансляции медиа-контента и другие.
Причиной послужило аварийное отключение электропитания из-за крупного шторма, который обрушился на юго-восточное побережье Австралии. В офлайн ушла облачная серверная ферма в Сиднее. Шторм стал одним из самых мощных в этом году. Штормовой ветер, ливневый дождь и наводнение потрепали Новый Южный Уэльс, стихия вызвала перебои в работе общественного транспорта, были затоплены улицы. Почти 9 тысяч домов в Сиднее, Центральном побережье остались без электричества.
На устранение неполадок в дата-центре потребовалось менее двух часов. Для Австралии характерны такие экстремальные погодные условия, не редко это становится причиной ухода серверных ферм в офлайн.
Salesforce
Серверная ферма облачного гиганта Salesforce в городе Вашингтон (округ Колумбия США) ушла в офлайн почти на сутки. Это американская компания была основана еще в марте 1999 года, головной офис расположен в Сан-Франциско, региональные в 25 странах по всему миру. Изначально компания специализировалась на CRM-системах.
Причиной считается кратковременное отключение электричества из-за отказа автоматического выключателя, которое привело к проявление неизвестного ранее бага микропрограммы.
Марк Бениофф, генеральный директор Salesforce, принес свои извинения клиентами через Twitter. Извинился за принесенный ущерб, пообещав, что если вдруг в будущем произойдет подобное, проблема будет устранена намного быстрее.
Автор: ua-hosting.company