- Как повлияло отключение одного сервера на здоровье инфраструктуры в целом?
- Можно ли предсказать ухудшение работоспособности инфраструктуры?
- Какое влияние оказывают на систему критически важные службы?
В этой статье мы расскажем о том, как Splunk может помочь в поиске ответов на эти вопросы.
Сегодня мы продолжим говорить о возможностях системы Splunk, специализирующейся на сборе данных журналов в реальном времени, обработке и выполнении сложных поисков, оперативном анализе данных и создании динамических панелей мониторинга и оповещений.
В предыдущих статьях мы уже писали о том, как Splunk можно использовать для аналитики работы приложений, аналитики событий безопасности, а также промышленных данных и интернета вещей.
Что касается мониторинга IT инфраструктуры, то он полезен в тех случаях, когда ваша цель заключается не в том, чтобы фокусироваться на том, что работает в данный момент, а знать, что сломано или находится в критическом режиме, наблюдаются ли потери производительности в отдельных сервисах.
Многие проблемы в перспективе могут привести к снижению клиентской удовлетворенности и потере клиентов, потере времени сотрудников и денег организации из-за простоя оборудования. Поэтому важно научиться опережать и выявлять проблемы до их возникновения.
Задачи, которые можно решать с помощью мониторинга IT инфраструктуры, можно разделить на 4 области:
- Ситуационная осведомленность – определение того, что работает хорошо, а что нужно исправлять.
- Планирование производительности и емкости – оценивание в течение времени значений показателей производительности и их зависимость от других показателей, на основе чего можно получать прогнозы о производительности и емкости.
- Расследование инцидентов – проведение анализа журналов, по которым можно восстановить полную картину инцидента.
- Составление отчетности – создание графиков и отчетов, обновляемых в режиме реального времени.
Давайте разберемся подробнее, что Splunk может предложить нам для мониторинга инфраструктуры:
Полная интеграция
С помощь Splunk можно произвести полную интеграцию всех систем, приложений и надстроек, объединяя между собой на первый взгляд несвязанные данные. Установка хостов и получение первых логов и метрик зачастую требует совсем немного времени.
Постоянный мониторинг и корреляция
Постоянный мониторинг в режиме реального времени и коррелированные показатели на основе данных со всех устройств позволяют видеть полную картину работоспособности системы, выявлять аномалии и первопричины проблем, определять области воздействия.
Прогнозирование
На основе исторических данных и комплексных KPI можно предсказывать уровень здоровья инфраструктуры, что позволит предотвратить сбои в работе системы до того, как они произойдут.
Фильтрация событий и сокращение времени расследования
Использование алгоритмов машинного обучения позволяет автоматически сокращать количество событий до тех, которые требуют усиленного внимания. А всесторонняя видимость событий и построение прогнозов позволят сократить время расследования инцидентов и уменьшить общее число инцидентов и сбоев.
Настраиваемые визуализации и оповещения
Возможность создавать различные отчеты и визуализации своих IT-сервисов, ключевых показателей и тенденций. Панели отчетности могут отличаться и легко настраиваться для разных категорий пользователей. А также на основе значений различных показателей, группы показателей или конкретных событий можно настраивать оповещения для быстрого информирования о проблемах и скорейшего реагирования.
Готовые решения
У Splunk существует несколько готовых решений, которые позволяют максимально быстро внедрять мониторинг IT-инфраструктуры. Это Splunk Insights for Infrastructure www.splunk.com/en_us/software/splunk-enterprise/infrastructure-insights.html и Splunk IT Service Intelligence (ITSI), которое мы подробно разбирали ранее.
Если вы все еще не пробовали Splunk, то самое время начать, бесплатная версия до 500Мб в сутки доступна всем желающим. А если у вас есть вопросы или проблемы со Splunk — вы можете задать их нам, а мы поможем.
Мы являемся официальным Premier Партнером Splunk.
Автор: JuliaKoroleva