Рубрика «системное администрирование» - 60

Как я неделю был стажером SRE-инженера. Дежурство глазами инженера ПО

2019-12-25 в 11:22, admin, рубрики: gitlab, incident management, Блог компании Southbridge, Серверное администрирование, системное администрирование, Софт

Как я неделю был стажером SRE-инженера. Дежурство глазами инженера ПО - 1

SRE-инженер — стажер

Для начала позвольте представиться. Я — @tristan.read, фронтэнд-инженер в группе Monitor::Health GitLab'а. На прошлой неделе мне выпала честь побыть стажером у одного из наших дежурных SRE-инженеров. Целью было ежедневное наблюдение за тем, как дежурный реагирует на инциденты, и получение реального опыта работы. Нам бы хотелось, чтобы наши инженеры лучше понимали потребности пользователей функций Monitor::Health.

Мне предстояло неделю всюду следовать за SRE-инженер. То есть я присутствовал на передаче дежурства, наблюдал за теми же каналами оповещений и реагировал на инциденты, если и когда таковые имели место.

Читать полностью »

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

2019-12-25 в 11:03, admin, рубрики: devops, kubernetes, Блог компании Флант, логи, системное администрирование

Логи в Kubernetes (и не только) сегодня: ожидания и реальность - 1

Шёл 2019 год, а у нас всё ещё нет стандартного решения для агрегации логов в Kubernetes. В этой статье мы хотели бы, используя примеры из реальной практики, поделиться своими поисками, встречаемыми проблемами и их решениями.

Однако для начала оговорюсь, что разные заказчики под сбором логов понимают очень разное:

кто-то хочет видеть security- и audit-логи;
кто-то — централизованное логирование всей инфраструктуры;
а кому-то достаточно собирать только логи приложения, исключив, например, балансировщики.

О том, как мы реализовывали различные «хотелки» и с какими трудностями столкнулись, — под катом.Читать полностью »

Как оценить ёмкость сервиса и не упасть под нагрузкой

2019-12-24 в 7:18, admin, рубрики: capacity planning, load balancing, performance testing, sre, Блог компании Яндекс, команда яндекс.маркета, Разработка веб-сайтов, системное администрирование, Тестирование IT-систем, Тестирование веб-сервисов

Как оценить ёмкость сервиса и не упасть под нагрузкой - 1

Рано или поздно любому растущему сервису приходится оценивать свои технические возможности. Сколько посетителей мы в силах обслужить? Какова ёмкость (она же capacity) системы? Не добрались ли мы до предела и не упадём ли, если привлечём ещё несколько тысяч пользователей? Сколько дополнительных вычислительных ресурсов заложить в бюджет на следующий год, чтобы соответствовать планам роста?

Ответы можно получить аналитическим путём, адресовав вопросы опытному разработчику/DevOps/SRE/админу. Достоверность оценки зависит от огромного числа факторов: начиная с темпов наполнения системы функциональностью и графа взаимосвязей между компонентами и заканчивая временем, которое эксперт с утра провёл в пробке. Чем сложнее система — тем больше сомнений в адекватности аналитической оценки.

Меня зовут Максим Куприянов, вот уже пять лет я работаю в Яндекс.Маркете. Сегодня я расскажу читателям Хабра, как мы учились оценивать ёмкость наших сервисов и что из этого вышло.
Читать полностью »

PagerDuty, или Почему по ночам может не спать отдел эксплуатации

2019-12-23 в 15:48, admin, рубрики: alerting, devops, monitoring, pagerduty, Блог компании FunCorp, системное администрирование

Чем сложнее система, тем больше она обрастает всевозможными алертами. И возникает потребность на эти самые алерты реагировать, агрегировать их и визуализировать. Думаю, ситуация, знакомая многим до нервного тика.

Решение, о котором пойдёт речь, не самое неожиданное, но полноценной статьи по этой теме поиск не выдаёт.

Поэтому я решил поделиться опытом FunCorp и рассказать о том, как выстроен процесс дежурств, кто звонит, почему и как на это всё можно смотреть.

PagerDuty, или Почему по ночам может не спать отдел эксплуатации - 1
Читать полностью »

Разбор настройки ELK 7.5 для анализа логов Mikrotik

2019-12-23 в 8:26, admin, рубрики: data engineering, docker, elasticsearch, home server, kibana, logstash, mikrotik, визуализация данных, Сетевые технологии, системное администрирование

Давно была мысль посмотреть, что можно делать с ELK и подручными источниками логов и статистики. На страницах хабра планирую показать практический пример, как с помощью домашнего мини-сервера можно сделать, например, honeypot с системой анализа логов на основе ELK стека. В этой статье расскажу про простейший пример анализа логов firewall с помощью стека ELK. В дальнейшем хотелось бы описать настройку окружения для анализа Netflow трафика и pcap дампов инструментом Zeek.

Разбор настройки ELK 7.5 для анализа логов Mikrotik - 1

Если у вас есть публичный IP-адрес и более-менее умное устройство в качестве шлюза/файрволла, вы можете организовать пассивный honeypot, настроив логирование входящих запросов на «вкусные» TCP и UDP порты. Под катом пример настройки маршрутизатора Mikrotik, но если у вас под рукой маршрутизатор другого вендора (или какая-то ещё security система), нужно просто немного разобраться с форматами данных и вендоро-специфичными настройками, и получится тот же результат.

Disclaimer

Статья не претендует на оригинальность, здесь не рассматриваются вопросы отказоустойчивости сервисов, безопасности, лучших практик и т.д. Нужно рассматривать этот материал как академический, он подходит для ознакомления с базовым функционалом стека ELK и механизмом анализа логов сетевого устройства. Однако и не новичку может быть что-то интересно.

Проект запускается из docker-compose файла, соответственно развернуть своё подобное окружение очень просто, даже если у вас под рукой маршрутизатор другого вендора, нужно просто немного разобраться с форматами данных и вендоро-специфичными настройками. В остальном я постарался максимально подробно описать все нюансы, связанные с конфигурированием Logstash pipelines и Elasticsearch mappings в актуальной версии ELK. Все компоненты этой системы хостятся на github, в том числе конфиги сервисов. В конце статьи я сделаю раздел Troubleshooting, в котором будут описаны шаги по диагностике популярных проблем новичков в этом деле.
Читать полностью »

Сегодня в 17:00 пройдет вебинар «DevOps: инструменты и цифры»

2019-12-23 в 6:29, admin, рубрики: devops, Блог компании Southbridge, вебинар, мероприятие, обучение, системное администрирование, Слёрм

Те, кто уже работает в DevOps-культуре, не узнают ничего нового. А тем, кто только присматривается или планирует DevOps-трансформацию, мы расскажем:
— на каком этапе жизненного цикла сейчас находится DevOps как концепция;
— как с цифрами в руках понять экономический эффект от DevOps-трансформации и убедить руководство, что эта трансформация выгодна;
— как выглядит список DevOps-инструментов, и как мы на Слёрме DevOps помогаем изучить конкретный стек, чтобы быстро войти в тему;
— небольшое погружение в одну из тем Слёрма DevOps.

Ведет вебинар Эдуард Медведев, CTO Tungsten Lab, SRE-инженер, один из спикеров Слёрма DevOps.

Читать полностью »

Спасибо, 2019

2019-12-20 в 14:12, admin, рубрики: open source, zabbix, zabbix мониторинг, Блог компании Zabbix, Серверное администрирование, системное администрирование

Сейчас, когда наступил конец года и пришло время подводить итоги, мы хотим оглянуться на проделанную работу, отпраздновать достижения и поблагодарить всех, кто провел 2019 год вместе с Zabbix.

Читать полностью »

В поисках LD_PRELOAD

2019-12-19 в 20:19, admin, рубрики: C, ld_preload, libc, linux, ptrace, информационная безопасность, ненормальное программирование, системное администрирование

Эта заметка была написана в 2014-м году, но я как раз попал под репрессии на хабре и она не увидела свет. За время бана я про неё забыл, а сейчас нашёл в черновиках. Думал было удалить, но авось кому пригодится.

В поисках LD_PRELOAD - 1

В общем, небольшое пятничное админское чтиво на тему поиска «включенного» LD_PRELOAD.
Читать полностью »

Тестирование виртуальных серверов от DigitalOcean, Vultr, Linode и Hetzner. Человеческие жертвы: 0.0

2019-12-18 в 12:02, admin, рубрики: vds, vps, виртуализация, виртуальный сервер, производительность, Сетевые технологии, системное администрирование, тест, Тестирование IT-систем, хостинг

В одной из предыдущих статей я привел результаты тестирования дешевых виртуальных серверов от различных хостеров рунета. Спасибо всем комментаторам и людям, писавшим в личные сообщения, за обратную связь.

В этот раз я хочу представить результаты тестирования виртуальных серверов от известных и крупных компаний: DigitalOcean, Vultr, Linode и Hetzner. Сделано 38 тестов для всех доступных локаций.

Хотя характеристики виртуальных серверов на этот раз очень близки, но все же стоит напомнить, что формат тестирования не слишком объективен, и результаты стоит рассматривать с определенной долей иронии, так как измеренные величины весьма относительны.
Читать полностью »

Разворачиваем Active Directory всеми возможными методами

2019-12-18 в 10:13, admin, рубрики: active directory, UltraVDS, Блог компании UltraVDS, Серверное администрирование, системное администрирование

Одним из реально полезных нововведений в Windows Server 2019 является возможность вводить серверы, не делая Sysprep или чистую установку. Развернуть инфраструктуру на виртуальных серверах с Windows Server никогда еще не было так просто.

Разворачиваем Active Directory всеми возможными методами - 1

Сегодня поговорим о том, насколько же, оказывается, просто устанавливать и управлять Active Directory через Powershell.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «системное администрирование» - 60

Как я неделю был стажером SRE-инженера. Дежурство глазами инженера ПО

SRE-инженер — стажер

Логи в Kubernetes (и не только) сегодня: ожидания и реальность

Как оценить ёмкость сервиса и не упасть под нагрузкой

PagerDuty, или Почему по ночам может не спать отдел эксплуатации

Разбор настройки ELK 7.5 для анализа логов Mikrotik

Disclaimer

Сегодня в 17:00 пройдет вебинар «DevOps: инструменты и цифры»

Спасибо, 2019

В поисках LD_PRELOAD

Тестирование виртуальных серверов от DigitalOcean, Vultr, Linode и Hetzner. Человеческие жертвы: 0.0

Разворачиваем Active Directory всеми возможными методами

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «системное администрирование» - 60

SRE-инженер — стажер

Disclaimer

Новости

Актуальные темы

Архив