Герхард Лауссер — эксперт в области nagios-совместимых систем мониторинга, автор множества публикаций, разработчик широко используемых плагинов для мониторинга многих коммерческих систем (один из них — check_hpasm, мы даже подробно разбирали ранее). Интервью выполнено сотрудником компании WürthPhoenix, которая занимается производством систем мониторинга в виде aplliance под торговой маркой NetEye и опубликовано в блоге компании* в 2010 году. г-н Лауссер излагает взгляд на использование систем мониторинга для мониторинга масштаба предприятия.
*Это не реклама, изделия NetEye и продукция компании WürthPhoenix в РФ не поставляется.
В 2009 году, вы опубликовали книгу о Nagios, его свойствах и функциональных особенностях: что в ней было главного и каков ваш опыт, с учетом разработанных вами плагинов?
Целью моей книги не было еще одно переписывание официальной документации по Nagios. Я создавал её для системных администраторов, которые уже имеют достаточный опыт в запуске и работе с Nagios. Я хотел написать нечто вроде сборника рецептов, которая позволит сделать им следующий шаг. От проверки базовых функций до мониторинга, покрывающего потребности большой компании. Сегодня мало смотреть только лишь на связность сетевой инфраструктуры и использование дискового пространства. Больше недостаточно проверять отвечает ли ваша база данных или вебсервер на запросы. Бизнес критичен по времени, поэтому я описал как осуществлять глубокую проверку инфраструктуры. Моя книга уделяет внимание, в основном, использованию плагинов для мониторинга систем масштаба предприятия, таких как СУБД, вебсерверы, система SAP, логи. Некоторое время назад я начал разрабатывать плагины, которые как раз этим и занимаются, так что я использую мое «знание проблем изнутри», чтобы помочь пользователям получить максимум выгоды для их компаний.
Давайте посмотрим с точки зрения IT менеджера: каковы преимущества реализации мониторинга на основе Open Source – свободного ПО? Каков ваш профессиональный опыт в этом?
А здесь не надо думать как IT менеджер: реализация мониторинга на основе OpenSource дает вам тоже качество, но за меньшие деньги. За исключением ситуаций, когда у вас есть специальные требования, которые может выполнить только определенный проприетарный продукт, вы будете достаточно сумасшедшим, чтобы не использовать преимущества свободного ПО. Если ваш IT персонал достаточно квалифицирован, тогда все ваши инвестиции ограничиваются только их рабочим временем. Если у вас нет времени, то существуют компании, которые предоставляют соответствующие услуги и с удовольствием помогут вам реализовать и подогнать под ваши нужды решение на основе свободного ПО для мониторинга, а если вы не хотите отслеживать состояние вашей системы самостоятельно, специалисты компании сделают это для вас. У вас может быть полный пакет услуг с поддержкой и автоматическим обновлением ПО.
Вы можете спросить: А где здесь выгода? Ответ прост: вам не надо платить за лицензии на коммерческое ПО. Если посмотреть ежемесячную цену одного объекта мониторинга, то получится, что мы говорим о тысячах евро, а иногда и о сотнях тысяч. Из моего личного опыта могу сказать, что где бы мы не заменяли проприетарные системы мониторинга на решения на свободном ПО, основанных на Nagios, наши клиенты не могли поверить в то, какую глупость они совершали ранее и сколько потратили денег только лишь на программные лицензии. Решения на основе свободного мониторинга устраняют «из коробки» большинство ваших проблем, а оставшиеся можно решить, потратив на них небольшую часть из того, что вы тратили на лицензии.
В течение многих лет свободное ПО и большие компании представляли собой два несочетающихся мира, но сейчас кое-что меняется. Что вы думаете по поводу текущей ситуации и перспектив на будущее?
Я ранее работал в больших компаниях и там мне встречалось достаточно большое количество свободного ПО, но иногда это были «нелегальные» инсталляции. Администраторы всегда знали cвободное ПО и его возможности, а вот менеджмент не знал, как с ним обращаться. Сегодня эти админы сами стали менеджерами и большинство из тех, кто принимает решения, выросли на Linux, так что у них достаточно хорошее представление о том, что такое OpenSource. Коммерческим системам мониторинга будет сложно соперничать со своими бесплатными оппонентами, потому что даже для бесплатного ПО вы можете получить сервис и поддержку на самом высоком уровне.
Принимая это во внимание, некоторые из ваших плагинов задумывались для проверки серверов Oracle DB и SQLв сложных инфраструктурах. Какой у вас опыт в данной области?
Первым в семействе плагинов появился check_oracle_health. И написал я его не забавы ради — несколько лет назад, ко мне обратился один из клиентов, который искал замену ПО Oracle Enterprise Manager, использовавшегося для мониторинга всех его серверов с СУБД Oracle. Он хотел решить две задачи: сэкономить деньги, а во вторую очередь – стандартизовать ландшафт мониторинга. У него уже работал Nаgios, с помощью которого отслеживалось состояние сетевой инфраструктуры и состояние операционных систем и он не хотел иметь еще одну отдельную систему управления для присмотра за СУБД. Он попросил реализовать функционал Oracle Enterprise Manager в Nagios настолько, насколько это было возможно. Так появился плагин check_oracle_health. Сегодня я получаю почту от пользователей со всего мира, и похоже check_oracle_health становится стандартом де-факто в мониторинге серверов СУБД Oracle.
Это сподвигло меня на переработку кода и написание плагинов для мониторинга серверов MySQL, DB2 и MS SQL. Они также имели большой успех и множество специалистов использует их в своей работе. Особенно популярным стал check_mssql_health, так как он позволил построить мост между Nagios и промышленными СУБД Microsoft.
Что вы думаете о потенциале Nagios в сравнении с более «молодыми» решениями типа Icinga или Shinken?
Я считаю, что разработка ядра Nagios подошла к своему логическому концу. По крайней мере, я не ожидаю от него нового функционала. Общая концепция Nagios проверена и опробована в течение многих лет, и всё, чего в нем не хватало, было реализовано в дополнениях. Сейчас я вижу как ядро Nagios становится основой для нескольких коммерческих систем мониторинга, которые состоят из скомпилированных и помещенных в пакеты опенсорсных компонентов с опциональной поддержкой, подобно вашему NetEye или OP5. Здесь нет ничего неправильного, потому что клиенты не возражают против траты денег на комбинацию свободного ПО и его поддержки.
С другой стороны, есть другие, несовместимые с nagios системы мониторинга с открытым исходным кодом и их доля «рынка» растёт. Если экосистема Nagios хочет оставаться наверху списка, то должны появиться долгосрочные инновации. Чтобы потенциальные пользователи получили явный сигнал, новое должно появиться не только в дополнениях вокруг ядра — изменения должны произойти и в самом ядре.
Именно поэтому Icinga и Shinken вступили в игру. Icinga больше фокусируется на пакете в целом. Много труда вложено в их мощный интерфейс icinga-web. Shinken, с другой стороны, представляет собой совершенно новую систему мониторинга. Это Nagios, переписанный на современном языке программирования, целью которого является существенное облегчение дальнейшей разработки, а кроме того, выполнен редизайн приложения, что позволяет легко создавать на его основе распределенные, балансированные и сбоеустойчивые инсталляции.
Вне зависимости от используемых технологий, Shinken полностью совместим с Nagios, А это значит, что вам нет нужды вносить изменения в конфигурации и используемые плагины.
Все они – Nagios, Icinga и Shinken имеют свои преимущества, возможно они смогут сосуществовать, возможно они будут вдохновлять друг друга, или же, в конце концов, в живых останется только один. Сообщество ПО с открытым кодом само решит, что лучше.
Многие компании, ориентированные на свободное ПО, для установления прямых связей со своими клиентами, используют подход пользовательских групп по интересам (User Group). Что вы думаете о такой стратегии?
Быть открытыми и говорить с людьми, глядя в глаза – это единственный способ завоевать доверие для вас и вашего продукта. Клиенты умны, они не будут тратить деньги на обещания; они сравнивают, делают выводы и хотят чувствовать себя комфортно. Решение о покупке больше не принимаются на основе цветастых глянцевых брошюрок. Организация или участие пользователей в мероприятиях OpenSource, показывает всему сообществу, что ваша компания — не исчадие ада, алчущее только денег. Вместо этого у вас есть возможность ознакомиться с проблемами пользователей, а также их идеями и немедленно получить ответную реакцию. Обмениваясь знаниями и историями из собственного опыта, ваши пользователи знают, что у вас тоже не всё просто, тоже есть проблемы, но вы упорно работаете для их решения. Раньше компании были экспертами, а пользователи были несведущими новичками. Сегодня среди ваших клиентов есть высокопрофессиональные пользователи, которые не будут хорошо к вам относиться просто так, лишь за знания, но поскольку вы с ними общаетесь, они начинают вас уважать за то, что вы делаете жизнь ваших пользователей легче, выполняя работу, которую они могли бы сделать и сами, но на это у них нет времени.
Вы принимали участие в конференции Nagios в Bolzano и у вас была возможность ознакомиться с системой мониторинга NetEye. Каковы ваши впечатления и что вы думаете о данном решении?
Прежде всего, спасибо вам за организацию данного мероприятия. Мне понравилось приезжать в Больцано, я бываю здесь уже второй раз, и не только потому, что у вас здесь такая прекрасная, солнечная погода. Как я и говорил, Nagios всё чаще и чаще становится основой для коробочных систем мониторинга. NetEye, будучи одной из них, сохраняет администратору массу времени, связанного с инсталляцией, компиляцией, настройкой и поддержкой. Как пользователь NetEye, вы можете мониторить всё, начиная от состояния оборудования до уровня бизнес-процессов, при этом у вас есть отчёты, инвентаризация, трабл-тикеты и конфигурирование всего в одной коробке. И вас есть партнёр, который может помочь вам, если вам нужны некоторые специальные функции.
По моему мнению, именно так должны работать системы мониторинга сегодня.
Г-н Лауссер, спасибо вам за интервью
P.S.
Плагины для мониторинга СУБД можно взять здесь:
check_oracle_health — Oracle SQL Server
check_mssql_health — Microsoft SQL Server
check_mysql_health — MySQL Server
check_db2_health — IBM DB2 SQL Server
Автор: las68