Observium — больше, чем система мониторинга

в 14:53, , рубрики: observium, snmp, Сетевое оборудование, Сетевые технологии, системное администрирование

Network monitoring with intuition

Уже давно являюсь читателем Хабра, но написать статью заставило желание ответить на вопросы и, вероятно, диалог из первых уст. Прошу простить за возможную спутанность статьи — «чукча не писатель».

На Хабре уже есть несколько статей, посвященных данной системе («Мониторинг сетевого оборудования Cisco в системе Observium», «Observium — установка системы мониторинга») и мне хотелось бы их дополнить. В статье нет инструкций по установке или настройке, все это есть в официальной документации и по ссылкам, указанным выше.

В статье много картинок, некоторые спрятаны под спойлерами.

Observium, как гласит слоган на основном сайте, является системой мониторинга и наблюдения за сетевыми устройствами и серверами. При этом список поддерживаемых устройств огромен и не ограничивается только сетевыми устройствами, главное условие — чтобы устройство поддерживало работу SNMP. Но и кроме SNMP собираемая информация может быть дополнена другими способами и протоколами, например, syslog, rancid, unix-agent.

Немного истории. Изначально система создана «подданным его величества» Адамом Армстронгом примерно в 2005-2006 году (к сожалению, точную дату он и сам уже не помнит). В последствии к проекту присоединились еще разработчики, в том числе и ваш покорный слуга. Сначала система называлась Kikker (2005-2006), потом Project Observer (2006–2008), ObserverNMS (2008–2010) и, наконец, в 2010 году обрела текущее название Observium. Основным логотипом является хомяк индустриального вида.

Hamster

Основной целью создания являлось создание системы с максимально простым управлением и наблюдением за устройствами, каковая остается и по сей день.

Модель распространения системы поделена на Community (выпускается раз в 6 месяцев) и Subscription (доступна подписчикам через непрерывные обновления stable/rolling).

Многим знакомы такие системы, как cacti, prtg, mrtg, но ни одна из них не сравнится по удобству добавления устройств и количеству поддерживаемых датчиков (по умолчанию).

Как выглядит процесс добавления нового устройства в систему:

1. Добавляем имя устройства (в командной строке или веб-интерфейсе).
2. Ждем 5-10 минут пока завершаться процессы discovery и первый poller, на этом всё.

Добавление устройства см. под спойлером

Добавление нового устройства:

Добавление устройства

Устройство добавлено, ждем завершения discovery/poller:

Устройство добавлено

Обзор устройства:

Linux device

Кроме того, добавление новых устройств возможно в автоматизированном режиме из файла со списком устройств и/или через обнаружение устройств по протоколам CDP/LLDP и BGP/OSPF.

Весь сбор статистики поделен на 2 основных процесса:

  • discovery, где выполняется основное обнаружение поддерживаемых на данном устройстве датчиков или счетчики;
  • poller, где обнаруженные датчики опрашиваются каждые 5-т минут;

Есть еще также 2 дополнительных процесса, работающих совместно с poller процессом, но они идут только в версии для подписчиков:

  • bill, подсчет биллинговой информации на отдельных портах для пользователей;
  • alert, это относительно недавно появившийся процесс для генерации уведомлений по практически любому собираемому системой параметру.

Процессы, в свою очередь, поделены на модули, соответствующие собираемой информации. Модулей много, основные — это os, system, ports, mempools, processors, sensors и другие. На снимке страницы выше можно заметить, что собираются такие параметры, как ОС, версия, начинка устройства.

И, наконец, модули поделены на MIBы, список который берется из файла определений для различных ОС.

Информация разнится в зависимости от производителя устройства, типа и доступных датчиков для конкретного устройства. Под спойлером несколько примеров:

Различные устройства

Cisco 7606
Cisco 7600
Cisco 2960C
Cisco 2960C
APC PDU
APC PDU
Olivetti printer
Printer

Обзорная страница:

Обзорная страница

Еще несколько спойлеров

Обзор всех устройств:

image

Быстрый поиск:

image

Поиск по IP/MAC/ARP/FDB:

image

BGP:

image

RANCID и история изменений конфигурации:

image
image

Как упомянул выше, в платной версии имеется процесс для активных уведомлений. Он не заменит такие системы, как nagios/icinga или zabbix, так как на данный момент ограничен 5-ти минутными интервалами опроса устройств, но 60% потребностей по уведомлениям он способен обеспечить. А для систем с небольшим (<50) количеством устройств он полностью готов заменить любую другую систему. Под спойлером еще несколько картинок для него.

С картинками, наверно, хватит, всего не показать. Большинство возможностей можно увидеть на демо-странице (ох, только просьба не создавать хабраэффект) тут.

В остальном прошу задавать вопросы и пожелания, если надо чем-то дополнить статью.

Автор: landy

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js