М:Мониторинг

Мониторинг. Продуктов для текущего мониторинга достаточно много, однако есть одно НО. Одно НО заключается в том, чего же мы хотим. Ряд продуктов достаточно узко заточен под сбор статистики и только. Другие продукты отлично работают искаропки (PRTG, Zabbix), но стоит чуть выйти за рамки привычного, могут начаться проблемы (не просто могут, но и начинаются). Идеального продукта "на все случаи жизни" нет. Тем не менее для начала, когда хостов и собираемых данных немного, я бы начал с двух широко известных продуктов: 3.1 Попроще и поудобнее на начальном этапе, особенно если не знаете про Linux почти ничего - бесплатная версия PRTG под Windows. 3.2 Посложнее, если не боитесь Linux и умеете читать - Zabbix. Плюсы PRTG. Есть бесплатная ограниченная версия. Ограничения в ней касаются только числа сенсоров (100 штук в бесплатной версии), остальной функционал в полном порядке. В комплекте модули для оповещения по электронной почте, и, если приложить немного рук и времени - для заблокированного в РФ %известного ПО%. Все достаточно просто и наглядно, есть очень удобная утилита для отладки SNMP (бесплатная, Paessler SNMP, есть отдельно). Минусы PRTG. Все же продукт платный, и под Windows, поэтому минус одна лицензия на Windows Server(если вы не купили лицензию DC, конечно) Zabbix. Весь бесплатный, но для первого запуска, и дальнейшего администрирования, придется много читать, править много шаблонов, и рано или поздно понять и пгостить ряд его проблем. Общая административная проблема мониторинга. У любого мониторинга есть одна проблема - попытка следить за всем сразу. Решите, за чем именно вы следите. Наиболее частая ошибка - попытка уследить за всем в режиме реального времени, на выходе - нечитаемая панель статусов, извещения "все хорошо" в почте идут сразу в папку "удаленные", и туда же рано или поздно попадают действительно важные сообщения.

И теперь список.

Cacti (устарел, есть ограничения, но пусть будет)

PRTG, Zabbix, Nagios, STOR2RRD(для SAN/СХД).

Из новых - Prometheus, и частично ELK (для сбора логов)

Из не очень публично популярных - SCOM плюс Managed Availability

Механизмы сбора - старый привычный SNMP, новые варианты типа Rest API и SMI-S / CIM

Last updated