Распределенный мониторинг и диагностика / Netdata

Сегодня существует множество платных и бесплатных систем мониторинга серверов. Мы привыкли к тому, что мониторинг централизован. Есть сервер с графиками. Есть сервера, которые шлют на основной сервер свои метрики.

Такой подход не очень хорошо подходит, когда стоит задача диагностики в реальном времени. Задержка в поступлении метрик может составлять минуты. Поэтому мы открываем консоль, чтобы посмотреть на текущие показатели сервера.

Кроме этого, сам сервер мониторинга имеет ограниченную пропускную способность. И с ростом количества обслуживаемых серверов работает всех медленнее.

Netdata — это простая утилита для мониторинга сервера. Она укомплектована большим количеством плагинов (Mysql, Nginx и кучей других) и прекрасной системой визуализации:

Локальный сбор данных

Особенность системы Netdata в том, что сбор и визуализация данных происходят локально на сервере. Это обеспечивает два преимущества:

  • Задержка в визуализации данных составляет составляет максимум секунды. А значит, вы видите реальную текущую картинку на сервере.
  • Ее легко масштабировать на сотни и тысячи серверов, ведь она растет линейно вместе с их количеством.

Установка

Для установки на Линукс достаточно выполнить такую команду:

bash <(curl -Ss https://my-netdata.io/kickstart-static64.sh)

# Установка займет 10...15 секунд

После этого интерфейс станет доступен по адресу http://127.0.0.1:19999/. Смотрите пример на Хд — открытая статистика нашего сервера.

А что если серверов больше одного?

Эта система не предусматривает просмотр агрегированных метрик (типа "сумма всех запросов к Mysql") со всех серверов. После открытия интерфейса на новом сервере, он попадет в вашу личную историю браузера в меню "my-netdata".

А что если сервер поломался?

Использования внешних систем мониторинга не избежать. Проверка исправности сервера должна быть вынесена за пределы самого сервера. Но имея такую систему, требования к внешнему мониторингу значительно упрощаются.

Дополнительные возможности

Их целая куча. Тут есть система оповещений о проблемах, которую можно настраивать. Есть возможность отправлять собственные метрики (работает, как сервер statsd). Есть куча плагинов и прекрасная документация.

Удобной режим обновления графиков:

TL;DR

Попробуйте Netdata для real-time мониторинга сервера. Чтобы установить на Линуксе:

bash <(curl -Ss https://my-netdata.io/kickstart-static64.sh)

Подпишитесь на Хайлоад с помощью Google аккаунта
или закройте эту хрень