Вчерашний 11-часовой сбой в Gmail (на эту тему был жестоко изруганный топик), из-за которого проблемы с доставкой писем или(и) вложений в них, наблюдались почти в трети почтового трафика, получил своё официальное объяснение.
Сама компания описывает масштабы проблемы в таких цифрах: 71% почтового трафика не испытывал каких-либо проблем, тогда как в остальных 29% средняя задержка доставки писем составляла 2.6 секунды. Также Google честно признаётся, что около 1.5% писем доставлялось с задержкой более двух часов. Пользователи, пытавшиеся загрузить большие вложения, также наблюдали множественные сообщения об ошибках. При всё при этом уже доставленная почта работала без заметных проблем.
Задержка с доставкой сообщений была вызвана двойным сбоем в сети. Это очень редкий случай, при котором два отдельных избыточных сегмента сети перестают работать одновременно. Это сбои никак не связаны между собой, но их комбинация привела к уменьшению мощностей Gmail для доставки сообщений и в 5.54 утра по тихоокеанскому времени сообщения стали накапливаться.
В итоге восстановление функциональности Gmal потребовало от команды инженеров, которая занялась проблемой незамедлительно, добавления недостающих мощностей и, собственно, восстановления упомянутых сбоев, в результате чего примерно через 10 часов пользователи перестали испытывать проблемы с почтой Google.
Компания сделала из произошедшего выводы: планируются мероприятия по улучшению пропускной способности сетей, даже в случае одновременных сетевых сбоев — таких, которые произошли вчера. При этом, как утверждается, не стоит забывать о том, что аптайм Gmail составляет 99.9% и компания очень старается, чтобы так это и оставалось в будущем.
[Источник]
Автор: jeston