Приветствую!
Я продолжаю знакомить вас с продуктами IBM для контроля состояния IT-инфраструктуры.
В своей прошлой статье я рассказал об ITM – системе мониторинга серверов и приложений.
Сегодня речь пойдет об ITNO (IBM Tivoli Netcool/OMNIbus) – системе обработки событийной информации.
Мы рассмотрим архитектуру продукта и его основные возможности.
Если вам уже не терпится узнать про ITNO — добро пожаловать под хабракат.
Архитектура.
Предлагаю начать с обзора архитектуры решения.
Как я уже упомянул ITNO – это система обработки событийной информации, она обрабатывает и консолидирует данные от систем мониторинга и управления.
Архитектура IBM Tivoli Netcool/OMNIbus
Основным элементом ITNO является ObjectServer, который представляет собой базу данных, расположенную в оперативной памяти, за счет чего достигается высокая скорость работы системы. При аварийном завершении работы сервера, БД не пострадает благодаря механизму создания контрольных точек (сохранение БД и логов изменений на файловом уровне). ObjectServer является центральным хранилищем событийной информации и доступен через GUI, либо CLI. Все действия с ним можно выполнять посредством SQL.
Представление.
Работа с событиями возможна через desktop-версию клиента к ObjectServer, а также через веб-браузер с помощью сервера представлений Web GUI интегрированного в Tivoli Integrated Portal.
Список активных событий
Вид отображения настраивается с помощью фильтров, которые указывают какие события будут отображены и представлений, которые отвечают за вывод на дисплей выбранных столбцов из ObjectServer.
Интерфейс создания фильтров
Автоматизация.
Существует возможность выполнения автоматических реакций и обогащения событий с помощью средств ITNO. Эти функции реализованы с помощью триггеров, которые представляют собой программный код, выполняемый в трех случаях:
— поступление в систему нового события;
— срабатывание по таймеру;
— реакция на внутренний сигнал ObjectServer.
Триггеры играют важную роль в функционировании сервера обработки событийной информации. На них построена работа ITNO и реализованы такие основополагающие механизмы как дедупликация и корреляция.
Интерфейс работы с триггерами
Контроль над функционированием компонентов ITNO выполняется утилитой Process Agent (PA). С помощью PA можно запускать/останавливать компоненты ITNO как локально, так и удаленно.
Так же немаловажными компонентами архитектуры являются пробы и шлюзы, о которых речь пойдет дальше.
Интеграция.
Не сложно сделать вывод о том, для чего нужны пробы и шлюзы прочитав название раздела. Все верно, дальше речь пойдет об интеграции со сторонними системами.
Бо́льшая часть событийной информации поступает в ObjectServer от проб. Проба приводит информацию от источников данных к общему виду и передает в виде события в ITNO. На данный момент существует более трехсот типов проб, что позволяет интегрироваться с большинством систем. Важной особенностью проб является возможность обогащения события с помощью lookup-файлов. В качестве примера использования проб можно рассмотреть вариант интеграции системы мониторинга ITM с ITNO: при срабатывании ситуации в системе мониторинга данные передаются в EIF пробу, которая в свою очередь обрабатывает их и передает в ITNO.
Перейдем от рассмотрения проб к шлюзам. Их основной функцией является передача данных от ObjectServer в другие системы. В качестве наиболее актуального примера можно привести интеграцию с Service Desk. Еще одним распространенным вариантом использования является реализация отказоустойчивой архитектуры, в которой шлюзы используются для репликации событийной информации. С помощью шлюзов возможна как односторонняя (unidirectional gateway), так и двусторонняя (bidirectional gateway) интеграция.
Заключение.
В своей небольшой статье я постарался привести основную информацию об ITNO, не углубляясь в детали реализации всех функций. Данный материал поможет читателю понять принцип работы системы и сформировать свое представление о рассмотренном продукте IBM.
Подводя итог статьи, я хотел бы охарактеризовать ITNO как не самую дешевую, но в то же время максимально гибкую, расширяемую и быструю систему обработки событийной информации.
Автор: 100xkg