Рубрика «shinken»

Предисловие

Страшная сказочка:

EDAC MC0: 1 CE read ECC error on CPU#0Channel#1_DIMM#0 (channel:1 slot:0)
EXT4-fs error: ext4_wait_block_bitmap:445: Cannot read block bitmap
Out of memory: Kill process 95 (sshd) score 31 or sacrifice child
CMCI storm detected: switching to poll mode
page allocation failure: order:1, mode:0x4020
invalid opcode: 0000 [#1] SMP

Неприятно выглядит, правда? Список может быть очень длинным очень длинный. В этой статье я расскажу как с этим жить и что мы с ним сделали.

Часть из этих сообщений в приерах выше заставит вас погрузиться в бездны современной архитектуры процессоров («CMCI storm», удачи в поиске дороги назад, из дебрей интернетов)… Cтранные вещи в ядре могут нарушать ожидания о том, как работают компьютеры, делая последующую отладку очень затруднённой. Отсутствие знания о том, что случилось может даже оставить с грустным ответом «какая-то неведомая фигня, ребутнули, вроде, прошло».Читать полностью »

«Вы, должно быть, сумасшедший, если не используете потенциал Open Source». Герхард Лауссер о системах мониторинга с открытым кодом и решениях масштаба предприятия
Герхард Лауссер — эксперт в области nagios-совместимых систем мониторинга, автор множества публикаций, разработчик широко используемых плагинов для мониторинга многих коммерческих систем (один из них — check_hpasm, мы даже подробно разбирали ранее). Интервью выполнено сотрудником компании WürthPhoenix, которая занимается производством систем мониторинга в виде aplliance под торговой маркой NetEye и опубликовано в блоге компании* в 2010 году. г-н Лауссер излагает взгляд на использование систем мониторинга для мониторинга масштаба предприятия.
*Это не реклама, изделия NetEye и продукция компании WürthPhoenix в РФ не поставляется.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js