Рубрика «системное администрирование» - 83

Прим. перев.: Рады поделиться переводом замечательного материала от старшего технологического евангелиста из AWS — Adrian Hornsby. В простых словах он объясняет важность экспериментов, призванных смягчить последствия сбоев в ИТ-системах. Вы, наверное, уже слышали про Chaos Monkey (или даже применяли подобные решения)? На сегодняшний день подходы к созданию подобных инструментов и их реализация в более широком контексте осуществляются в рамках деятельности, которую называют chaos engineering. Подробнее о ней читайте в этой статье.

Chaos Engineering: искусство умышленного разрушения - 1

«Но за всей этой красотой скрывается хаос и безумие». — Tanner Walling

Пожарные. Эти высококвалифицированные специалисты каждый день рискуют жизнью, борясь с огнем. Знаете ли вы, что перед тем, как стать пожарным, необходимо провести в тренировках минимум 600 часов? И это только начало. Согласно отчетам, пожарные тренируются до 80% своего рабочего времени.

Почему?

Читать полностью »

How to deploy Python Telegram bot using Webhooks on Google Cloud Platform

Вместо предисловия

image

— Напиши телеграм-бота. Сейчас даже школьники пишут, — сказала она.
— А почему бы и нет, — подумал я тогда ( — Ну, ну, — сказал бы я сейчас).

Мы сидели в Бине и за чашкой кофе обсуждали возможности тестирования идей с моделями искусственного интеллекта на близком и не очень круге друзей. Лена, моя бывшая коллега, и во всех отношениях не блондинка, только что закончившая магистратуру, рассуждала так. Создав бота, можно сэкономить силы и время на интерфейсе, сосредоточившись на ядре с машинным обучением. Согласитесь, что устоять против такой логики “спортсменки, комсомолки и просто красавицы” в то прекрасное воскресное утро было невозможно. Решено. Телеграм-бот, значит телеграм-бот.

Первым делом я залез в гугл и нашел большое число ссылок “как сделать бот за 30 минут”. Это меня настолько воодушевило, что дальше названий я не пошел и занялся созданием ядра. В самом первом приближении мне предстояло написать систему обработки поисковых запросов с использованием NLP (natural language processing). Написание ядра заняло некоторое, вполне разумное, время (все же опыт кока-колой не пропить). И через несколько дней я был готов к тому, чтобы за пару часов обернуть первую тестовую версию ядра в пару другую команд send-receive, запустив все это в Телеграме на благо моим друзьям. Но не тут-то было.

Неожиданно возник целый клубок проблем. Потратив пару дней на поиски в интернете и общение с коллегами по цеху, я понял, что очевидное не очевидно, и еще одна “инструкция” точно не повредит. Так и появилась эта статья.

Читать полностью »

Те, кто способен отдать свою свободу, чтобы обрести недолговечную защиту от опасности, не заслуживает ни свободы, ни безопасности.

Бенджамин Франклин

Данный дайджест призван повысить интерес Сообщества к проблеме приватности, которая в свете последних событий становится как никогда прежде актуальной.

На повестке дня:

  • Центр сертификации «Medium Root CA» вводит проверку сертификатов по протоколу OCSP
  • Особенности протокола OCSP: зачем нужен заголовок Expect-Staple
  • Приглашаем на летний Medium Summer Meetup 3 августа — встречу энтузиастов, заинтересованных в вопросах информационной безопасности, приватности в Интернете и разработке сети «Medium»

Medium Weekly Digest #3 (26 Jul – 2 Aug 2019) - 1
Читать полностью »

Команда Слёрма планировала в Челябинске снимать продвинутый онлайн-курс по Kubernetes.
Челябинская #Sysadminka готовила митап по Kubernetes. Мы увязали эти события по датам, чтобы Павел Селиванов, архитектор проектов Kubernetes и спикер Слёрма, выступил на митапе. Доклад Павла начнется около 18:00 по Москве.

Павел Селиванов:

Заделываем дыры в кластере Kubernetes
Я расскажу о безопасности в Kubernetes и как закрыть «дыры» в кластере. Затрону темы PodSecurityPolicy, LimitRange/ResourceQuota, расскажу, что и куда торчит портами в кластере.

Кроме Павла будут выступать Вадим Исаканов, (#Sysadminka org), Денис Катаев (Тинькофф), Михаил Кузнецов (Интерсвязь).

Читать полностью »

Зачем вам нужно специальное ПО для техподдержки, особенно если у вас уже есть багтрекер, CRM и электронная почта? Вряд ли об этом кто-то задумывался, потому что скорее всего у компаний с сильной техподдержкой хелпдеск система давно есть, а остальные справляются с обращениями и заявками клиентов «на коленке», например, с помощью электронной почты. А это чревато: если есть обращения клиентов, они должны обрабатываться и храниться так, чтобы не было «заявка закрыта и забыта», «заявка забыта и закрыта», «заявка висит в статусе уточнения информации 7 месяцев», «обращение потеряно», «ой, простите» (универсальный вариант на все случаи некорректной работы с обращением — почти что человеческий эксепшен). Мы оказались ИТ-компанией, которая прошла путь от потребности в тикет-системе до продакшена этой самой системы. В общем, у нас есть история и мы вам её расскажем.

Техподдержка на раз… два… три… - 1
Читать полностью »

27 мая в главном зале конференции DevOpsConf 2019, проходящей в рамках фестиваля РИТ++ 2019, в рамках секции «Непрерывная поставка», прозвучал доклад «werf — наш инструмент для CI/CD в Kubernetes». В нём рассказывается о тех проблемах и вызовах, с которыми сталкивается каждый при деплое в Kubernetes, а также о нюансах, которые могут быть заметны не сразу. Разбирая возможные пути решения, мы показываем, как это реализовано в Open Source-инструменте werf.

С момента выступления наша утилита (ранее известная как dapp) преодолела исторический рубеж в 1000 звёзд на GitHub — мы надеемся, что растущее сообщество её пользователей упростит жизнь многим DevOps-инженерам.

werf — наш инструмент для CI-CD в Kubernetes (обзор и видео доклада) - 1

Итак, представляем видео с докладом (~47 минут, гораздо информативнее статьи) и основную выжимку из него в текстовом виде. Поехали!Читать полностью »

1 августа — день работника технической поддержки в России (международный — 16 мая). Упоминаний о нём не так много и он не так популярен как день программиста, но почему бы и нет? Техническая поддержка, саппорт, справочная служба — эти ребята отвечают на тысячи сложных, простых, дурацких и тупых вопросов в день, знают всё о 24/7, 2/2 и ⅓, имеют стальные нервы, большую выдержку и специфическое чувство юмора. Именно они решают вопросы бизнеса и частных пользователей, стоят на переднем крае работы с клиентами, недаром саппортёров нередко называют фронт-офисом — теми, кто впереди. На передовой, по-нашему. Так что если сегодня придётся звонить или писать в какую-нибудь техподдержку, сперва удивите ребят — поздравьте, — а потом уже спрашивайте о том, за чем шли :-)

С Днём работника технической поддержки - 1
Читать полностью »

Как Dark развертывает код за 50 мс - 1

Чем быстрее процесс разработки, тем быстрее развивается технологическая компания.

К сожалению, современные приложения работают против нас — наши системы должны обновляться в режиме реального времени и при этом никому не мешать и не приводить к простоям и перерывам. Развертывание в таких системах становится сложной задачей и требует сложных пайплайнов непрерывной поставки даже в маленьких командах.

Эти пайплайны обычно имеют узкое применение, медленно работают и не отличаются надежностью. Разработчики должны сначала создать их вручную, а потом управлять ими, и компании часто нанимают для этого целые команды DevOps.

От скорости этих пайплайнов зависит скорость разработки. У лучших команд развертывание занимает 5–10 минут, но обычно все делается гораздо дольше, и для одного развертывания требуется несколько часов.

Читать полностью »

В этом сезоне разработчики Veeam представили решение для бэкапа и восстановления серверов и баз данных SAP HANA. Читатели нашего блога проявили интерес к новинке — а тут как раз подоспела и полезная статья от моего коллеги Клеменса Зербе. Сегодня поделюсь ею с вами, немного дополнив. Итак, добро пожаловать под кат.

Плагин Veeam для бэкапа и восстановления баз данных SAP HANA - 1
Читать полностью »

Прим. перев.: Представляем вашему вниманию технические подробности о причинах недавнего простоя в работе облачного сервиса, обслуживаемого создателями Grafana. Это классический пример того, как новая и, казалось бы, исключительно полезная возможность, призванная улучшить качество инфраструктуры… может навредить, если не предусмотреть многочисленные нюансы её применения в реалиях production. Замечательно, когда появляются такие материалы, позволяющие учиться не только на своих ошибках. Подробности — в переводе этого текста от вице-президента по продукту из Grafana Labs.

Как приоритеты pod'ов в Kubernetes стали причиной простоя в Grafana Labs - 1

В пятницу, 19 июля, сервис Hosted Prometheus в Grafana Cloud перестал функционировать примерно на 30 минут. Приношу извинения всем клиентам, пострадавшим от сбоя. Наша задача — предоставлять нужные инструменты для мониторинга, и мы понимаем, что их недоступность усложняет вашу жизнь. Мы крайне серьезно относимся к этому инциденту. В этой заметке объясняется, что произошло, как мы на это отреагировали и что делаем для того, чтобы подобное больше не повторялось.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js