Рубрика «prometheus» - 2

Мониторинг веб-приложения на Rust с использованием Prometheus и Grafana

2022-01-12 в 15:41, admin, рубрики: devops, Grafana, prometheus, Rust, визуализация данных, системное администрирование

В статье показано как настроить мониторинг веб-приложения на Rust. Приложение выставляет наружу Prometheus метрики, которые визуализируются с помощью Grafana. Мониторинг осуществляется для проекта mongodb-redis demo, детально рассмотренного здесь. В итоге получена следующая архитектура:

architecture

Читать полностью »

Мониторим основные сервисы в AWS с Prometheus и exporter’ами для CloudWatch

2021-02-12 в 10:14, admin, рубрики: Amazon Web Services, AWS, cloudwatch, devops, kubernetes, prometheus, Блог компании Флант, системное администрирование

Если вы используете в облачных провайдерах managed-инсталляции серверных служб вроде RDS или ElastiCache от AWS, то скорее всего уже задавались темой мониторинга инфраструктуры, а главное — оповещений по произошедшим инцидентам. При реализации возникают понятные вопросы:

Как можно настроить сбор данных с endpoint’ов в систему мониторинга?
Читать полностью »

KubeGraf — плагин для мониторинга Kubernetes в Grafana. Как создавался и почему стал востребованным

2021-02-11 в 12:12, admin, рубрики: devops, Grafana, ITSumma, kubergraf, kubernetes, prometheus, Блог компании ITSumma, Блог компании Southbridge, микросервисы, Слёрм

KubeGraf — плагин для мониторинга Kubernetes в Grafana. Как создавался и почему стал востребованным - 1

KubeGraf — это плагин для Grafana, который собирает данные с кластера Kubernetes и приложений внутри него, а затем показывает их на красивых и понятных графиках. В феврале этого года вышел релиз 1.5, и стало известно, что предыдущие версии скачали более 250 тысяч раз! Мы расспросили Сергея Спорышева, создателя плагина и директора направления DevOps-продуктов в ITSumma, об истории создания плагина, факапах и причинах популярности.

Читать полностью »

Пушим метрики Prometheus с помощью pushgateway

2020-12-06 в 0:13, admin, рубрики: devops, Faust, metrics, monitoring, prometheus, pushgateway, python

Всё тоже, только у pushgateway пламя голубенькое в favicon

Предисловие

Данная заметка в целом о пуше метрик в pushgateway, однако, предупрежу и признаюсь сразу, что в тексте будет пример — анти-паттерна пуша метрик, так как использование pushgateway рекомендуется в случае, когда сервис работает не постоянно (или у сервиса/запускаемого задания вообще нет никакого интерфейса), а значит и prometheus'у лучше в закрытые двери постоянно не стучать и не заниматься лишней работой.

Читать полностью »

Будущее Prometheus и экосистемы проекта (2020)

2020-08-04 в 7:02, admin, рубрики: cloud native, kubernetes, open source, prometheus, Блог компании Флант, сообщество

Прим. перев.: это перевод статьи, подготовленной по мотивам недавнего выступления Richard Hartmann — заметного представителя команды разработчиков Prometheus, директора по сообществам из Grafana Labs, основателя проекта OpenMetrics и председателя группы SIG Observability в CNCF. Автор подводит итоги последнего года в жизни Open Source-проекта (и сообщества) Prometheus, а также рассказывает об основных трудностях и ближайших перспективах.

Будущее Prometheus и экосистемы проекта (2020) - 1

Во время PromCon Online 2020 я выступил с докладом под названием «Будущее Prometheus и его экосистемы». И хочу поделиться с вами его ключевыми моментами.Читать полностью »

Представляем k8s-image-availability-exporter для обнаружения пропавших образов в Kubernetes

2020-05-28 в 6:26, admin, рубрики: devops, kubernetes, open source, prometheus, Блог компании Флант, системное администрирование, Флант

Представляем k8s-image-availability-exporter для обнаружения пропавших образов в Kubernetes - 1

Рады представить свой новый Open Source-проект. На этот раз мы сделали совсем небольшую, казалось бы, утилиту, но столь полезную буквально для любой инсталляции Kubernetes. В чем же её суть? K8s-image-availability-exporter — это Prometheus exporter, позволяющий проактивно предупредить пользователя об образах, которые прописаны в объектах Kubernetes (например, поле image в Deployment), но отсутствуют в реестре контейнеров (Docker Registry и т.п.). Читать полностью »

Как использовать Prometheus для обнаружения аномалий в GitLab

2020-05-01 в 8:07, admin, рубрики: Git, gitlab, Grafana, kubernetes, Mail.Ru Cloud Solutions, prometheus, Блог компании Mail.Ru Group, статистический анализ

Одной из базовых функций языка запросов Prometheus является агрегация временных рядов в режиме реального времени. Также язык запросов Prometheus можно использовать для обнаружения аномалий в данных временных рядов.

Команда Mail.ru Cloud Solutions перевела статью инженера команды инфраструктуры GitLab, где вы найдете примеры кода, которые сможете попробовать на своих системах.
Читать полностью »

Полезен ли Слёрм?

2020-04-01 в 7:12, admin, рубрики: helm, Istio, k8s, kubernetes, prometheus, service mesh, Блог компании Southbridge, борьба со скукой и паникой, Вечерняя школа Слёрма, интенсив, интервью, контейнеризация, конференции, мероприятие, нет гречке и туалетной бумаге, опрос, радио Пустошей, системное администрирование, Слёрм, что бы поделать

Слёрму полтора года. Шесть интенсивов только по базовому курсу Kubernetes, плюс Мега, DevOps, SRE и Agile — более тысячи участников.

7 апреля стартует «Вечерняя школа Слёрма: базовый курс по Kubernetes», рассчитанная на 4 месяца занятий по вечерам (бесплатные вебинары по теории и платная практика). В мае пройдет седьмой Слёрм по Kubernetes (онлайн-интенсив, «как офлайн, только онлайн»). Будет всё «по-оффлайновому»: с голосовым чатом, видеосвязью, «курилкой» в зуме, групповой работой, выделенными наставниками и техподдержкой.

Мы заявляем, что Слёрм открывает путь к проектам на Kubernetes и росту зарплаты. Так ли это на самом деле?

Мы задали этот вопрос выпускникам Слёрмов. Полтора года — достаточный срок, чтобы стали заметными изменения в карьере, зарплате, работе и сфере задач.

Что важно понимать про этот опрос? Тут есть «ошибка выжившего»: нам ответили те, кто следит за чатом своего Слёрма и готов общаться. Наверняка есть те, кому Слёрм оказался бесполезен, и они молчат об этом. Жизнь меняется: те, кто начал работать с Kubernetes год назад, были в другом положении, чем те, кто начинает сейчас. Это работает в обе стороны: стать архитектором решений сейчас куда сложнее, а найти место джуниора куда проще.

Тем не менее, ответы вполне показательны. По ним можно понять, ради чего стоит проходить Слёрмы.

Карантин — хороший повод поинтересоваться, как там дела в других бункерах на Пустошах, кто какие технологии использует вместе с Kubernetes, что собирается изучать ещё и в какую сторону двигается, не вставая с кресла. Quarantine. Quarantine Never Changes.

Полезен ли Слёрм? - 1

Читать полностью »

Слёрм SRE. Сплошной эксперимент c экспертами из Booking.com и Google.com

2020-02-06 в 9:43, admin, рубрики: capacity planning, Cascading Failures, ddos, devops, elastic, Error budget, gitlab, Grafana, kubernetes, prometheus, sla, sli, slo, sre, Блог компании Southbridge, интенсив, конференции, конференция, мероприятие, Слёрм, Управление продуктом, управление проектами

Наша команда любит эксперименты. Каждый Слёрм — это не статичное повторение предыдущих, а осмысление опыта и переход от хорошего к лучшему. Но со Слёрмом SRE мы решили применить абсолютно новый формат — дать участникам условия, максимально приближённые к «боевым».

Если кратко обрисовать, чем мы занимались на интенсиве: «Строим, ломаем, чиним,
изучаем». SRE мало чего стоит в голой теории — только практика, реальные решения, реальные проблемы.

Участники были поделены на команды, чтобы бодрый соревновательный дух не дал никому заснуть или запустить «Angry Birds» на iPhone по примеру Дмитрия Анатольевича.

Проблемы, глюки, баги и задачи обеспечивали участникам четыре ментора. Иван Круглов, Principal Developer в Booking.com (Нидерланды). Бен Тайлер, Principal Developer в Booking.com (США). Эдуард Медведев, CTO в Tungsten Labs (Германия). Евгений Варавва, разработчик широкого профиля в Google (Сан-Франциско).

Да ещё и участники поделены на команды — и соревнуются друг с другом. Интересно?

Слёрм SRE. Сплошной эксперимент c экспертами из Booking.com и Google.com - 1
Иван, Бен, Эдуард и Евгений с добрым ленинским прищуром смотрят на бедных участников Слёрм SRE перед началом соревнования.

Читать полностью »

Как облако Alibaba Cloud управляет десятками тысяч кластеров Kubernetes с помощью… Kubernetes

2020-01-09 в 6:28, admin, рубрики: alibaba, Alibaba Cloud, devops, Grafana, ITSumma, k8s, KoK, kube-on-kube, kubernetes, OpenKruise, prometheus, Terway, Блог компании ITSumma, высокая производительность, куб-на-кубе, облачные сервисы, планирование ресурсов

Куб-на-кубе, метакластеры, соты, распределение ресурсов

Как облако Alibaba Cloud управляет десятками тысяч кластеров Kubernetes с помощью… Kubernetes - 1

Рис. 1. Экосистема Kubernetes в облаке Alibaba Cloud

С 2015 года Alibaba Cloud Container Service for Kubernetes (ACK) является одним из самых быстрорастущих облачных сервисов в Alibaba Cloud. Он обслуживает многочисленных клиентов, а также поддерживает внутреннюю инфраструктуру Alibaba и другие облачные сервисы компании.

Как и в аналогичных контейнерных сервисах от облачных провайдеров мирового уровня, наши главные приоритеты — надёжность и доступность. Поэтому для десятков тысяч кластеров Kubernetes создана масштабируемая и глобально доступная платформа.

В этой статье мы поделимся опытом управления большим количеством кластеров Kubernetes на облачной инфраструктуре, а также архитектурой базовой платформы.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «prometheus» - 2

Мониторинг веб-приложения на Rust с использованием Prometheus и Grafana

Мониторим основные сервисы в AWS с Prometheus и exporter’ами для CloudWatch

KubeGraf — плагин для мониторинга Kubernetes в Grafana. Как создавался и почему стал востребованным

Пушим метрики Prometheus с помощью pushgateway

Предисловие

Будущее Prometheus и экосистемы проекта (2020)

Представляем k8s-image-availability-exporter для обнаружения пропавших образов в Kubernetes

Как использовать Prometheus для обнаружения аномалий в GitLab

Полезен ли Слёрм?

Слёрм SRE. Сплошной эксперимент c экспертами из Booking.com и Google.com

Как облако Alibaba Cloud управляет десятками тысяч кластеров Kubernetes с помощью… Kubernetes

Куб-на-кубе, метакластеры, соты, распределение ресурсов

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «prometheus» - 2

Предисловие

Куб-на-кубе, метакластеры, соты, распределение ресурсов

Новости

Актуальные темы

Архив