Приближаются новогодние праздники, и это особое время для многих сфер деятельности. Для кого-то это мертвый сезон, для других же — возможность дополнительно заработать. Людям, чья деятельность тесно связана с работой сайтов и вообще ИТ инфраструктуры, тоже нелегко. С одной стороны, хочется расслабиться, но с другой — присутствует иррациональный страх, что тщательнейшим образом настроенная система, работающая без перебоев уже много месяцев, упадет, как только от нее отвернешься. Что характерно, нередко так и бывает. Как все же позволить себе отдохнуть? Один из выходов — внешний мониторинг сайтов и серверов.
Рубрика «monitoring» - 7
Падают ли сайты на праздники чаще, чем обычно? Мифы, реальность и как себя обезопасить
2016-12-28 в 11:04, admin, рубрики: host-tracker, monitoring, uptime, web-разработка, Блог компании ХостТрекер, веб-проекты, веб-сервисы, ит-инфраструктура, мониторинг сайта, мониторинг сервера, Серверное администрирование, Сетевые технологии, хостинг, ХостТрекерМониторинг Elasticsearch через боль и страдания
2016-12-08 в 15:31, admin, рубрики: devops, elastic, elasticsearch, monitoring, troubleshooting, Блог компании okmeter.io, Серверная оптимизация, Серверное администрирование, системное администрирование, хранилища данных
Мы наконец допинали функционал мониторинга elasticsearch до публичного релиза. Суммарно мы переделывали его три раза, так как результат нас не устраивал и не показывал проблемы, которые мы огребали на нашем кластере ES.
Под катом история про наш production кластер, наши проблемы и наш новый мониторинг ES.
Роcкомнадзор: держим ухо востро. Как вовремя заметить внесение в список
2016-11-04 в 7:11, admin, рубрики: host-tracker, monitoring, uptime, website monitoring, Блог компании ХостТрекер, информационная безопасность, мониторинг сайта, мониторинг сервера, проверка доступности сайта, Разработка веб-сайтов, Роскомнадзор, роскомнадзор не пройдет, Тестирование IT-систем, Тестирование веб-сервисовПо многочисленным просьбам трудящихся, сервис мониторинга ХостТрекер реализовал функцию, позволяющую регулярно проверять списки сайтов на попадание в базу Роскомнадзора. О некоторых особенностях — ниже.
Мониторинг докер-хостов, контейнеров и контейнерных служб
2016-11-02 в 4:37, admin, рубрики: containers, devops, docker, monitoring, Блог компании centos-admin.ru, Серверное администрирование, системное администрированиеЯ искал self-hosted мониторинговое решение с открытым кодом, которое может предоставить хранилище метрик, визуализацию и оповещение для физических серверов, виртуальных машин, контейнеров и сервисов, действующих внутри контейнеров. Опробовав Elastic Beats, Graphite и Prometheus, я остановился на Prometheus. В первую очередь меня привлекли поддержка многомерных метрик и несложный в овладении язык запросов. Возможность использования одного и того же языка для графических изображений и уведомления сильно упрощает задачу мониторинга. Prometheus осуществляет тестирование по методу как черного, так и белого ящика, это означает, что вы можете тестировать инфраструктуру, а также контролировать внутреннее состояние своих приложений.
Мониторинговый агент: простая штука или нет?
2016-10-13 в 17:11, admin, рубрики: devops, monitoring, Блог компании okmeter.io, ПрограммированиеСейчас существует достаточно много систем для хранения и обработки метрик (timeseries db), но ситуация с агентами (софтом, который собирает метрики) сложнее. Не так давно появился telegraf, но все равно выбор не велик.
При этом практически все облачные сервисы мониторинга разрабатывают свои агенты и мы не исключение. Мотивация достаточно простая — есть много специфичных требований, которые слабо вписываются в архитектуру существующих решений.
Основные наши специфичные требования:
- надежность доставки метрик в облако
- непростая логика плагинов: они взаимодействуют друг с другом
- диагностика: мы должны уметь понимать, почему агент не может собрать те или иные метрики
- агент должен потреблять как можно меньше ресурсов клиентского сервера
Под катом расскажу несколько аспектов разработки агента для сбора метрик.
Малодокументированные особенности IBM Tivoli Monitoring
2016-10-06 в 15:00, admin, рубрики: IBM, monitoring, Tivoli, ит-инфраструктураЯ занимаюсь внедрением продуктов мониторинга от компании IBM и мне стало интересно, чего достиг open source в сравнении с решениями от IBM в направлении мониторинга железа и программного обеспечения. Для чего я стал устанавливать наиболее популярные системы мониторинга из мира open source и читать документацию. Меня в основном интересовали архитектура решений. В мое поле зрения попали следующие open source продукты: Zabbix, Nagios, NetXMS. Я счел их наиболее популярными и часто упоминаемыми. Все их можно сравнить с IBM Tivoli Monitoring (ITM). ITM это ядро мониторинга сервисов от IBM. В результате решил описать не документируемую архитектуру ITM продукта, которая и является преимуществом в крупных инсталляциях.
Читать полностью »
Мониторинг Postgresql: запросы
2016-09-30 в 8:12, admin, рубрики: monitoring, postgresql, Блог компании okmeter.ioВ 2008 году в списке рассылки pgsql-hackers началось обсуждение расширения по сбору статистики по запросам. Начиная с версии 8.4 расширение pg_stat_statements входит в состав постгреса и позволяет получать различную статистику о запросах, которые обрабатывает сервер.
Обычно это расширение используется администраторами баз данных в качестве источника данных для отчетов (эти данные на самом деле являются суммой показателей с момента сброса счетчиков). Но на основе этой статистики можно сделать мониторинг запросов — посмотреть на статистику во времени. Это оказывается крайне полезно для поиска причин различных проблем и в целом для понимания, что происходит на сервере БД.
Я расскажу, какие метрики по запросам собирает наш агент, как мы их группируем, визуализируем, так же расскажу о некоторых граблях, по которым мы прошли.
Вышел Zabbix 3.2
2016-09-14 в 9:54, admin, рубрики: monitoring, zabbix, Блог компании Zabbix, Серверное администрирование, системное администрирование
Хотим сообщить о выходе новой версии open source системы мониторинга Zabbix. Релиз несет принципиально новые возможности такие как:
- Дополнительные поля событий (тэги)
- Ручное закрытие проблем
- Корреляцию событий
- Вложенные группы узлов сети
- Определение отдельных условий для создания аварий и их восстановления
- Non-strict расчет триггерных выражений
- Интерфейс в подгружаемых модулях для репликации исторических данных во внешнее хранилище
…и многое другое. Под катом кратко расскажем о некоторых нововведениях
Читать полностью »
Мониторинг сетевого стэка linux
2016-09-10 в 12:57, admin, рубрики: devops, monitoring, netstat, Блог компании okmeter.io, системное администрированиеЧасто мониторинг сетевой подсистемы операционной системы заканчивается на счетчиках пакетов, октетов и ошибок сетевых интерфейсах. Но это только 2й уровень модели OSI!
С одной стороны большинство проблем с сетью возникают как раз на физическом и канальном уровнях, но с другой стороны приложения, работающие с сетью оперируют на уровне TCP сессий и не видят, что происходит на более низких уровнях.
Я расскажу, как достаточно простые метрики TCP/IP стэка могут помочь разобраться с различными проблемами в распределенных системах.
Мир не идеален
2016-09-01 в 15:32, admin, рубрики: Amazon Web Services, AWS, aws lambda, clojure, monitoring, функциональное программирование
Мир не идеален. В любой момент что-то может пойти не так. К счастью, большинство из нас не запускает ракеты в космос и не строит самолеты. Современный человек зависит от приложения в его телефоне и наша задача, сделать так, что бы в любой момент времени при любом стечении обстоятельств, он мог открыть приложеньку и посмотреть картинки с котиками.
Читать полностью »