Рубрика «uptime»
Аптайм вахтер: мониторинг веб-сервисов с помощью Globalping и уведомлениями в Telegram
2024-10-27 в 9:10, admin, рубрики: nodejs, telegram, TypeScript, uptimeКак реализуется отказоустойчивая веб-архитектура в платформе Mail.ru Cloud Solutions
2019-11-05 в 13:00, admin, рубрики: api, BGP, HA, haproxy, ITSumma, Mail.Ru Cloud Solutions, openstack, uptime, uptimeday, балансировщик, Блог компании Mail.Ru Group, виртуализация, высокая производительность, Облачные вычисления, отказоустойчивость, системное администрирование
Привет! Я Артем Карамышев, руководитель команды системного администрирования Mail.Ru Cloud Solutions (MCS). За последний год у нас было много запусков новых продуктов. Мы хотели добиться, чтобы API-сервисы легко масштабировались, были отказоустойчивыми и готовыми к быстрому росту пользовательской нагрузки. Наша платформа реализована на OpenStack, и я хочу рассказать, какие проблемы отказоустойчивости компонентов нам пришлось закрыть, чтобы получить отказоустойчивую систему. Я думаю, это будет любопытно тем, кто тоже развивает продукты на OpenStack.
Общая отказоустойчивость платформы складывается из устойчивости её компонентов. Так что мы постепенно пройдём через все уровни, на которых мы обнаружили риски и закрыли их.
Видеоверсию этой истории, первоисточником которой стал доклад на конференции Uptime day 4, организованной ITSumma, можно посмотреть на YouTube-канале Uptime Community.
Читать полностью »
Failover: нас губит перфекционизм и… лень
2019-07-19 в 7:12, admin, рубрики: accessibility, diy или сделай сам, failover, highload, ITSumma, uptime, uptimeday, Блог компании ITSumma, доступность, инфраструктура, отказоустойчивость, резервирование, резервное копированиеЛетом традиционно снижается и покупательская активность, и интенсивность изменения инфраструктуры веб-проектов, говорит нам Капитан Очевидность. Просто потому что даже айтишники, случается, ходят в отпуск. И CТО тоже. Тем тяжелее тем, кто остаётся на посту, но сейчас не об этом: возможно, именно поэтому лето — лучший период для того, чтобы не торопясь обдумать существующую схему резервирования и составить план по её улучшению. И в этом вам будет полезен опыт Егора Андреева из AdminDivision, о котором он рассказал на конференции Uptime day.
При строительстве резервных площадок, при резервировании есть несколько ловушек, в которые можно попасть. А попадаться в них совершенно нельзя. И губит нас во всем этом, как и во многом другом, перфекционизм и… лень. Мы пытаемся сделать всё-всё-всё идеально, а идеально делать не нужно! Нужно делать только определённые вещи, но сделать их правильно, довести до конца, чтоб они нормально работали.
Failover — это не какая-то такая весёлая фановая штука «чтоб было»; это вещь, которая должна сделать ровно одно — уменьшить время простоя, чтобы сервис, компания, теряла меньше денег. И во всех методах резервирования я предлагаю думать в следующем контексте: где деньги?
«Битрикс24»: «Быстро поднятое не считается упавшим»
2019-06-06 в 13:58, admin, рубрики: amazon, Amazon Web Services, bitrix, bitrix24, failover, ITSumma, uptime, uptimeday, битрикс, Битрикс24, Блог компании ITSumma, конференции, конференция, облачные сервисы, резервирование, резервное копирование, ркн, РоскомнадзорНа сегодняшний день у сервиса «Битрикс24» нет сотен гигабит трафика, нет огромного парка серверов (хотя и существующих, конечно, немало). Но для многих клиентов он является основным инструментом работы в компании, это настоящее business-critical приложение. Поэтому падать — ну, никак нельзя. А что если падение все-таки случилось, но «восстал» сервис так быстро, что никто ничего и не заметил? И как удаётся реализовать при этом failover без потери качества работы и количества клиентов? Александр Демидов, директор направления облачных сервисов «Битрикс24», рассказал для нашего блога о том, как за 7 лет существования продукта эволюционировала система резервирования.
Uptime day: 12 апреля, полёт нормальный
2019-03-22 в 4:43, admin, рубрики: admindivision, badoo, bitrix24, ITSumma, kubernetes, mcs, qrator, uptime, uptimeday, Блог компании ITSumma, высокая производительность, конференции, распределенные системы, резервирование, резервное копирование, сложная архитектура
«Да чего же ждать от конференций? Сплошь танцовщицы, вино, гулянки» — шутил герой фильма «Послезавтра».
Наверное, на каких-то конференциях и не такое бывает (делитесь историями в комментах), но на it-сборищах обычно вместо вина пиво (по завершении), а вместо танцовщиц — «танцы» с кодами и информационными системами. 2 года назад мы тоже вписались в эту хореографию, организовав конференцию Uptime day. В этом апреле, на День космонавтики, мы проводим её уже в четвёртый раз — традиционно бесплатно и традиционно под аккомпанемент вопросов «зачем вам это надо?»
На весеннем Uptime day будем говорить об организации резервирования веб-проектов со сложной распределённой архитектурой — способам переключения с боевого окружения на резервное, а также разбору различных сценариев отката и переключения на резервную площадку в случае неудачного деплоя.
А зачем нам это надо?.. Об этом под катом. И о том, чем вам будет полезна конференция Uptime day.
Как убедиться, что мой сайт не заблокирован РКН
2018-04-27 в 13:28, admin, рубрики: host-tracker, monitoring, uptime, website monitoring, Блог компании ХостТрекер, всё очень серьёзно, Законодательство и IT-бизнес, информационная безопасность, мониторинг сайта, мониторинг сервера, но можно держать руку на пульсе, проверка доступности сайта, ркн, Роскомнадзор, роскомнадзор не пройдет, Сетевые технологии, Тестирование веб-сервисовПо причине блокирования целых подсетей, многие сайты попадают под раздачу случайно. При этом обнаружить сей факт достаточно сложно, потому что Роскомнадзор утверждает, что все хорошо и такого адреса в базе нет. Так как история продолжает набирать обороты, сервис мониторинга ХостТрекер допилил функцию проверки блокировки, и теперь она позволяет сопоставлять конкретные адреса с содержанием базы блокировок. И давать однозначный ответ.
Инструмент для мониторинга околороскомнадзорных пертурбаций
2018-04-19 в 11:07, admin, рубрики: host-tracker, monitoring, uptime, website monitoring, Блог компании ХостТрекер, всё очень серьёзно, информационная безопасность, мониторинг сайта, мониторинг сервера, но можно держать руку на пульсе, проверка доступности сайта, ркн, Роскомнадзор, роскомнадзор не пройдет, Сетевые технологии, Тестирование IT-систем, Тестирование веб-сервисовВ связи с всем известными обстоятельствами, сервис мониторинга сайтов ХостТрекер предлагает возможность бесплатного использования наших инструментов для целей информирования общественности, сбора статистики и других интересных вещей. Цель — спасти всех. Ну или хотя бы ползти в том направлении. Что и как можно cделать, а также наши рекомендации для тех, кого это явление уже затронуло или потенциально может затронуть — под катом.
DDoS в обход Куратора: простые действия для спокойной жизни
2017-11-29 в 6:56, admin, рубрики: ddos, DNS, firewall, ITSumma, port scan, Qrator Labs, uptime, Блог компании ITSumma, Блог компании ТechMedia, Сетевые технологии, системное администрированиеНедавно в Москве проходила вторая конференция по эксплуатации и администрированию информационных систем Uptime.commuinty, на которой мы тоже решили поделиться своим опытом. У нас как обычно, про наболевшее — про DDoS.
DDoS-атаки на Хабр начались лет десять назад и до сих пор представляют для нас неприятную проблему. Сначала были робкие попытки чуть-чуть подзалить, а сейчас для нас обычный DDoS — это порядка 30 Гбит/с. Это и не удивительно, потому что сейчас у каждой бабушки в Москве есть 50Мб. Всё по классике: одна старушка — 50, 10 старушек — 500…
Uptime day 2: российские ИТ-компании расскажут о том, как справляются с катастрофами
2017-09-21 в 14:19, admin, рубрики: uptime, Блог компании ITSumma, конференции, Серверное администрирование, системное администрированиеЧерез три недели, в пятницу, 13-го, в коворкинге Deworkacy в Москве пройдет уже вторая конференция сообщества Uptime, тема которой — аварии в ИТ-инфраструктуре. Мест всего 300, участие бесплатное — под катом есть ссылка на регистрацию.
Анонс второй конференции сообщества Uptime в Москве: поговорим о самом страшном
2017-08-23 в 6:52, admin, рубрики: badoo, bitrix24, caprice, uptime, Блог компании ITSumma, конференция, Серверное администрирование, системное администрированиеВторой Uptime day (первый прошёл в апреле) мы решили посвятить фатальным происшествиям в IT-инфраструктуре — такие рано или поздно случаются в жизни у каждого. Выбрать дату было несложно — встречайте «Uptime day: Пятница, 13-е» (кстати, в этом году осталась только одна такая пятница).
Про аварии не принято говорить публично. Есть IT-конференции про разработку, высокие нагрузки, но тем не менее, аварии — это часть жизни любого бизнеса и как их устранять, как сделать так, чтобы их не повторять, как научиться понимать, как их быстрее решать — это важнейшие вопросы в жизни любого проекта. Читать полностью »