Метка «авария» - 11

О наводнении мы узнали глубокой ночью от инженера, следящего за мониторингом. Базовые станции одна за другой показывали сразу каскад аварий (срабатывали чуть ли не все датчики), а потом полностью уходили из сети. Чуть позже в техслужбу начали поступать новости о самом наводнении, на место выехали два инженера из Новороссийска, так как они находились ближе всех, и у одного из них там жили родители.

Город в это время был закрыт на въезд: пускать обещали только к вечеру. Один из наших инженеров пробился в город к обеду (он поспешил к родителям), и после того как убедился, что с семьёй всё в порядке — у них, фактически, было затоплена квартира под потолок, но обошлось без жертв — начал объезжать базовые станции и сообщать что с ними произошло. Подойти удалось только к нескольким, вокруг остальных ещё находилась вода и можно было понять только то, что они были затоплены полностью.

Восстановление связи после наводнения в Крымске
Вот так выглядел город, когда мы приехали — и чем дальше шли, тем больше разрушений видели.Читать полностью »

image
Прежде всего, мы хотим принести официальные извинения за самый большой даунтайм в истории Селектела. Ниже мы постараемся подробно восстановить хронологию событий, рассказать о том, что сделано для предотвращения таких ситуаций в будущем, а также о компенсациях для клиентов, пострадавших в результате этих неполадок.
Читать полностью »

Эта история произошла с ЦОДом одной компании уже довольно давно, все последствия аварии устранены, плюс выполняются доработки, исключающие повторение ситуаций. Тем не менее, отчёт о происшедшем, полагаю, будет интересен и тем, кто занимается дата-центрами, и тем, кто любит почти детективные IT-истории.

Итак, ожидалось плановое отключение электричества. В дата-центр приходило две линии, владельцы ЦОДа заранее знали о ситуации, подготовились и провели все необходимые тесты. Всё что было нужно – просто перейти на дизели по стандартной процедуре.
Читать полностью »

Лично у меня Last.fm не открывается уже порядка 6 часов. Однако официальная информация появилась буквально час-полчаса назад. На странице сервиса в Facebook была опубликована следующая заметка:

Hey folks. The site is currently down due to a major power outage at one of our data centres. We have staff on site, bring things back up.

Привет, народ. Сайт в данный момент не работает из-за серьезного отключения электричества в одном из наших датацентров. Наши сотрудники на месте, занимаются восстановлением.

В твиттере аналогичный пост появился около часа назад: twitter.com/lastfm/status/222625254579765249

UPD: Ссылка на статус служб Last.fm: Читать полностью »

Вышки связи Пожар, разгоревшийся 4 апреля в 5 утра в Роттердаме в здании, расположенном рядом с узлом связи сотового оператора Vodafone, перекинулся на здание узла и вывел из строя находившееся там оборудование. Что повлекло за собой два тяжёлых последствия — заявляет в опубликованном видеоролике (англ.) Роб Шутер (Rob Shuter), CEO Vodafone Netherlands. Читать полностью »

Ответ на вопрос, чем заняться в международный день бэкапа (который приходится на 31 марта, то есть сегодня), напрашивается сам собой — конечно бэкапом своих данных!

Чем заняться в международный день бэкапа?Посвятите этот день установке и настройке систем резервного копирования, утвердите SLA по восстановлению информации в случае аварий, передайте свежие резервные копии по сети в соседний офис на случай пожара. А если вы до сих пор не делаете бэкап — тогда мы идем к вам самое время его сделать!

По нашим данным, немногие айтишники поставят на кон свою зарплату в споре о том, что в случае сбоя смогут восстановить свои данные из резервных копий. 2/3 этого делать не станут.
Читать полностью »

Энергетическая авария в Киеве, лежит целый ряд хостинг компаний

Точка отсчета:

«На платформе станции Киевского метрополитена „Осокорки“ в 16:44 (по Киеву) в среду произошло возгорание пластиковой подшивки потолка, сообщили агентству „Интерфакс-Украина“ в пресс-службе МинЧС Украины.»

Предварительные причины выясняются. Но судя по всему возгорание зацепило какую-то из магистралей.

Ряд хостингов лежит (hostpro, мирохост и т.д.), в том числе лежат такие крупные украинские сайты (статусом на 19:00) как i.ua и другие.

UA-IX уже поднят — noc.ix.net.ua/ua-ix-daily.png. Судя по графику ситуация еще неЧитать полностью »

Около 22:50 по Москве перестала отвечать машина в облаке.

Успел посмотреть график загрузки — на нем последние 15 минут была нулевая активность процессора.

Произвел 2 попытки перезагрузки и 2 принудительных выключения — неудачно.
Сейчас управление облаком отключено вообще.

На тикет ответил системный инженер:

Здравствуйте. Действительно, в работе нескольких серверов нашего облака прозошёл сбой. Наши специалисты работают над этой проблемой.
Приносим вам свои извинения.

Топик создаю, чтобы уведомить сообщество и немного снизить нагрузку на техподдержку.

updated.
01:25 Моя машина подняласьЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js