1. Мониторинг работы оборудования
Работа оборудования контролируется при помощи встроенных датчиков, показания которых отображаются в интерфейсе управления BAUMSTORAGE. За мониторинг аппаратного обеспечения контроллеров отвечает сервис аппаратного мониторинга – HWmon.
2. Мониторинг производительности
Статистика производительности системы рассчитывается суммированием показателей всех томов. В текущей версии BAUMSTORAGE статистика производительности файловых систем не снимается и не учитывается в расчете суммарной производительности операций чтения-записи. Для отображения показаний производительности в интерфейсе управления системы требуется включить службу SNMP. За мониторинг производительности отвечает сервис мониторинга производительности – BestMon.
3. Отправка статистики работы СХД по протоколу SNMP v2
Передача показаний датчиков и статистики производительности на внешние системы мониторинга выполняется по протоколу SNMP v2. В BAUMSTORAGE для этой цели служит специальная служба – SNMP. MIB файл базы управляющей информации, описывающий OID, можно выгрузить из интерфейса управления системы.
Для BAUMSTORAGE был зарегистрированный номер в IANA (SNMP. Private Enterprise Number):
Private Enterprise Number 54350 зарегистрирован на NPO Baum JSC
iso.org.dod.internet.private.enterprise.npobaum = 1.3.6.1.4.1.54350
4. Логирование событий
Происходящие в системе события записываются в журналы. Имеется три журнала: журнал аудита, оперативный журнал и системный журнал.
Журнал аудита фиксирует события входа/выхода пользователя в интерфейс управления системы.
Оперативный журнал, предназначенный для администратора BAUMSTORAGE, собирает только сообщения, необходимые для понимания того, что происходит в системе. Это сделано, чтобы не загружать журнал служебными и отладочными сообщениями, которые нужны только разработчикам системы. Оперативный журнал хранится в базе данных конфигурации системы. Содержимое оперативного журнала доступно для просмотра из интерфейса управления СХД. Для просмотра журнала нужно зайти на вкладку меню «Система»-«События». В оперативном журнале фиксируются следующие типы событий.
События, инициированные администратором системы:
- создание/удаление/изменение ресурсов (пулы, тома/файловые системы, клиенты/группы, LUN/общие папки);
- создание/изменение прав доступа пользователя;
- включение/отключение интерфейсов, служб протоколов и т.п.;
- события, которые пользователь выполняет из Web-интерфейса или интерфейса командной строки.
События изменения логических сущностей:
- состояние пулов, томов/файловых систем;
- превышение порога занятого места на пуле.
События от оборудования:
- состояние дисков;
- состояние портов/линков;
- состояние датчиков;
- включение контроллера;
- статус работоспособности контроллера (готов/не готов).
События от сервисов:
- сервис изменил свой статус;
- миграция ресурсов.
Для поиска событий предназначены фильтры, позволяющие вывести список событий от заданных источников.
События оперативного журнала сохраняются в течении 14 дней, после чего самые старые события могут быть перезаписаны. При необходимости файлы логов, содержащие эти события, можно выгрузить из системного журнала в течении 30 дней.
Имеется возможность выгрузки событий оперативного журнала, для чего используется кнопка «Выгрузить журнал». События выгружаются в формате csv, который можно открыть в табличном редакторе.
Системный журнал предназначен для инженеров службы поддержки.
В системный журнал записываются все сообщения (и те, которые записываются в оперативный журнал), включая отладочные. Системный журнал хранится в виде нескольких файлов. В полночь файлы логов архивируются и сохраняются в системе, а для записи событий следующих суток создаются новые файлы. Архивные файлы логов сохраняются в системе 30 дней, после чего удаляются. Для просмотра файлов лога текущего дня нужно использовать команды операционной системы. Основной файл системного журнала – baum_manager.log – находится в папке /var/log/.
Кроме этого, отладочные сообщения записываются в файлы: Web_dbg.log, kern.log, syslog.
В интерфейсе управления системы предусмотрена возможность выгрузки журналов, которые формируются в виде архива за указанный промежуток времени.
Кроме этого, присутствует возможность выгрузки информации о работе системы (файл system_info.tar.gz), куда входят:
- ядерные логи;
- лог установки с нуля;
- информация по блочным устройствам;
- информация по scsi устройствам;
- arp-таблица;
- дампы памяти отказавших сервисов (если есть);
- дампы памяти трех сервисов – hb, rpc, ck;
- смарты всех дисков;
- параметры полок;
- параметры модуля ОС;
- параметры модуля scst;
- параметры модуля qla;
- параметры модуля spl;
- блок информации от утилиты ipmitool (сенсоры, логи, конфиг и т.д.);
- информация по системному рейду;
- информация по всем пулам и датасетам;
- конфиг scst;
- состояние зеркал;
- сессии и LUN протокола iscsi;
- бинарные файлы всех сервисов BAUMSTORAGE;
- сетевая конфигурация (mac, ip, route, rule, resolv.conf).
Системный журнал работает в двух режимах: в нормальном режиме и режиме отладки. В режиме отладки в системный журнал дополнительно записываются отладочные и диагностические сообщения. По умолчанию включен отладочный режим.
Отслеживать