Привет! Мы продолжаем серию митапов Backend United. Четвёртая встреча называется «Окрошка», и посвящена она будет инцидентам. Вместе с коллегами из Tutu.Ru, Ozon и Авито поговорим про работу с инцидентами, об инструментах для улучшения incident response и о ценности техдолга.
Встреча пройдёт 10 августа, начало в 12:00. Регистрируйтесь сами и приглашайте коллег. Под катом — тезисы выступлений, ссылки на регистрацию и видеотрансляцию митапа.
Доклады
Простые инструменты для улучшения incident response: опыт Tutu. Андрей Борзов (Tutu.ru)
Все мы хотим, чтобы наши пользователи были счастливы, а сервисы работали и быстро чинились после поломок. Чем больше разработчиков и команд, тем больше разных сервисов, больше разных инструментов контроля, что это всё работает. И больше возможных действий, которые приходится предпринимать для диагностики и восстановления.
Я расскажу, как простые технические решения помогли нам облегчить себе жизнь во время инцидентов. Как, пользуясь возможностями чата, почти без магии мы дали командам настраиваемую систему, которая делает важную для них диагностику ближе, алерты от разных систем полезнее, а их маршрутизацию проще.
И бонусом расскажу, как можно померить заветные «девятки» доступности вашего сервиса, и что получилось у нас.
Работа с Production взрывами: обнаружение, оценка потерь, управление инцидентами. Дмитрий Химион (Авито)
Случалось ли в вашей практике такое, что сбой, который ещё совсем недавно казался незначительным, приводил к тому, что пригорюнивался весь прод? Или вы чинили проблему, которая была не особо серьёзной?
Как понять фактическое влияние и распознать мину замедленного действия? Как управлять потоком багов и сбоев и вычленять значимые? В докладе расскажу о том, как практика устроена в Авито и какие изыскания и автоматизацию мы применяем в нашей работе.
AutoLSR — автоматизированный сбор сведений при значительных инцидентах. Владимир Колобаев (Авито)
Иногда возникают ситуации, при которых всё ломается, все графики красные, и всё в огне. Вроде бы при детальном разборе всё становится понятно… но нет. Корневую причину проблемы отловить не легко, особенно когда ты не обладаешь полной картиной происходящего в монолите, сервисах, микросервисах, базах, в головах разработчиков и т.п.
Я расскажу, как мы собрали все тайные знания, сценарии отказов различных систем и сервисов и перенесли все это в код с целью автоматизированного обнаружения и первичного анализа значительных инцидентов.
Мы это сломали сейчас, но починим потом. Техдолг и его ценность. Борис Кайзер (Ozon)
Высокие темпы разработки приводят к ускорению темпов накопления технического долга. Всё чаще и чаще приходится идти на уступки в стабильности и качестве разработанных решений в пользу новой функциональности и новых атрибутов продукта. Без должного контроля объемов техдолга ситуация со стабильностью системы и, как следствие, с технической стабильностью бизнеса может ухудшаться. Я расскажу про то, что мы делаем для контроля всего того, что ломается и оперативно чинится, как мы помогаем командам не забыть про данные обещания, а также обеспечиваем бизнес полной и понятной информацией о том, что произошло, как починили и что сделаем, чтобы это не повторилось.
Расписание
12:30 — 13:15 — Простые инструменты для улучшения incident response: опыт Tutu. Андрей Борзов (Tutu.ru)
13:20 — 14:00 — Работа с Production взрывами: обнаружение, оценка потерь, управление инцидентами. Дмитрий Химион (Авито)
14:00 — 14:45 — Обед
14:45 — 15:30 — AutoLSR — автоматизированный сбор сведений при значительных инцидентах. Владимир Колобаев (Авито)
15:40 — 16:20 — Мы это сломали сейчас, но починим потом. Техдолг и его ценность. Борис Кайзер (Ozon)
16:30 — Afterparty в баре ONE MORE PUB
Пароли и явки
Митап начнётся 10 августа в 12:00. Участие в мероприятии бесплатное, но нужно зарегистрироваться. Пожалуйста, указывайте вашу фамилию и имя так, как в паспорте, и не забудьте взять его (или водительское удостоверение) с собой, иначе вас не пропустят в офис.
Адрес: офис Авито, Лесная 7.
Смотрите прямую трансляцию митапа на ютуб-канале AvitoTech.
До встречи!
Автор: vkolobaev