Будучи еще студентом устроился работать в компанию по мониторингу, где меня и ознакомили с азами мониторинга. Все три выше перечисленных сервиса мониторинга имеют web интерфейс, легко настраиваются и пользоваться ими так-же очень легко.
Zabbix кстати был написан в Латвии. Мы используем Zabbix для мониторинга доступности подключений, а так-же можно видеть когда температура у устройства повышена. Еще можно глянуть траффик, тоже очень полезно. Zabbix гибко настраивается, у нас он шлет email и sms сообщения, если главные объекты становятся не досягаемыми.
Другой инструмент мониторинга — это швейцарский SmokePing. Он хорош тем, что не просто показывает, что объект упал, но еще и показывает время пингов и packetloss, что позволяет оперативно реагировать не только, когда объект упал, но и когда у него потеря пакетов. Так же как и Zabbix, SmokePing умеет чуть что случилось слать e-mail.
Cacti. Сacti отображает статистику по загрузке процессора, выделению оперативной памяти, количеству запущенных процессов, использованию входящего/исходящего трафика, ошибок на порту. Так-же него тоже можно встроить SmokePing. Но главное, что он показывает не просто трафик на устройстве, а на портах. Тоже самое и с ошибками. Как и оба выше упомянутых инструмента мониторинга, Cacti тоже умеет слать e-mail чуть что случись.
Еще используем The Dude. Он без web интерфейса, зато очень удобно можно видеть всю карту, и какой из объектов упал.
Автор: und