< вернуться назад

Мониторинг и логирование

Мониторинг и логирование
5 минут

1. Мониторинг работы оборудования

Работа оборудования контролируется при помощи встроенных датчиков, показания которых отображаются в интерфейсе управления BAUMSTORAGE.  За мониторинг аппаратного обеспечения контроллеров отвечает сервис аппаратного мониторинга – HWmon.

 

2. Мониторинг производительности

Статистика производительности системы рассчитывается суммированием показателей всех томов. В текущей версии BAUMSTORAGE статистика производительности файловых систем не снимается и не учитывается в расчете суммарной производительности операций чтения-записи. Для отображения показаний производительности в интерфейсе управления системы требуется включить службу SNMP. За мониторинг производительности отвечает сервис мониторинга производительности – BestMon.

 

3. Отправка статистики работы СХД по протоколу SNMP v2

Передача показаний датчиков и статистики производительности на внешние системы мониторинга выполняется по протоколу SNMP v2. В BAUMSTORAGE для этой цели служит специальная служба – SNMP. MIB файл базы управляющей информации, описывающий OID, можно выгрузить из интерфейса управления системы.

Для BAUMSTORAGE был зарегистрированный номер в IANA (SNMP. Private Enterprise Number):

Private Enterprise Number 54350 зарегистрирован на NPO Baum JSC

iso.org.dod.internet.private.enterprise.npobaum = 1.3.6.1.4.1.54350

 

4. Логирование событий

Происходящие в системе события записываются в журналы. Имеется три журнала: журнал аудита, оперативный журнал и системный журнал.

Журнал аудита фиксирует события входа/выхода пользователя в интерфейс управления системы.

Оперативный журнал, предназначенный для администратора BAUMSTORAGE, собирает только сообщения, необходимые для понимания того, что происходит в системе. Это сделано, чтобы не загружать журнал служебными и отладочными сообщениями, которые нужны только разработчикам системы. Оперативный журнал хранится в базе данных конфигурации системы. Содержимое оперативного журнала доступно для просмотра из интерфейса управления СХД. Для просмотра журнала нужно зайти на вкладку меню «Система»-«События». В оперативном журнале фиксируются следующие типы событий.

События, инициированные администратором системы:

  • создание/удаление/изменение ресурсов (пулы, тома/файловые системы, клиенты/группы, LUN/общие папки);
  • создание/изменение прав доступа пользователя;
  • включение/отключение интерфейсов, служб протоколов и т.п.; 
  • события, которые пользователь выполняет из Web-интерфейса или интерфейса командной строки.

События изменения логических сущностей:

  • состояние пулов, томов/файловых систем;
  • превышение порога занятого места на пуле.

События от оборудования:

  • состояние дисков;
  • состояние портов/линков;
  • состояние датчиков;
  • включение контроллера;
  • статус работоспособности контроллера (готов/не готов).

События от сервисов:

  • сервис изменил свой статус;
  • миграция ресурсов. 

Для поиска событий предназначены фильтры, позволяющие вывести список событий от заданных источников. 

События оперативного журнала сохраняются в течении 14 дней, после чего самые старые события могут быть перезаписаны. При необходимости файлы логов, содержащие эти события, можно выгрузить из системного журнала в течении 30 дней.

Имеется возможность выгрузки событий оперативного журнала, для чего используется кнопка «Выгрузить журнал». События выгружаются в формате csv, который можно открыть в табличном редакторе.

Системный журнал предназначен для инженеров службы поддержки.

В системный журнал записываются все сообщения (и те, которые записываются в оперативный журнал), включая отладочные. Системный журнал хранится в виде нескольких файлов. В полночь файлы логов архивируются и сохраняются в системе, а для записи событий следующих суток создаются новые файлы. Архивные файлы логов сохраняются в системе 30 дней, после чего удаляются. Для просмотра файлов лога текущего дня нужно использовать команды операционной системы. Основной файл системного журнала – baum_manager.log – находится в папке /var/log/.

Кроме этого, отладочные сообщения записываются в файлы: Web_dbg.log, kern.log, syslog.

В интерфейсе управления системы предусмотрена возможность выгрузки журналов, которые формируются в виде архива за указанный промежуток времени.

Кроме этого, присутствует возможность выгрузки информации о работе системы (файл system_info.tar.gz), куда входят:

  • ядерные логи;
  • лог установки с нуля;
  • информация по блочным устройствам;
  • информация по scsi устройствам;
  • arp-таблица;
  • дампы памяти отказавших сервисов (если есть);
  • дампы памяти трех сервисов — hb, rpc, ck;
  • смарты всех дисков;
  • параметры полок;
  • параметры модуля ОС;
  • параметры модуля scst;
  • параметры модуля qla;
  • параметры модуля spl;
  • блок информации от утилиты ipmitool (сенсоры, логи, конфиг и т.д.);
  • информация по системному рейду;
  • информация по всем пулам и датасетам;
  • конфиг scst;
  • состояние зеркал;
  • сессии и LUN протокола iscsi;
  • бинарные файлы всех сервисов BAUMSTORAGE;
  • сетевая конфигурация (mac, ip, route, rule, resolv.conf).

Системный журнал работает в двух режимах: в нормальном режиме и режиме отладки. В режиме отладки в системный журнал дополнительно записываются отладочные и диагностические сообщения. По умолчанию включен отладочный режим.

 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *
Author
Посетитель сайта

Добавить комментарий

Комментариев пока нет

Другие статьи, которые могут быть полезными

T10 DIF/DIX: защита данных от тихой порчи Одна из самых неприятных категорий отказов в хранилищах - тихая порча данных (SDC, silent data corruption). Она случается редко, но когда случается, обнаруживается...
387
8
Масштабируемость увеличением количества дисков Масштабируемость системы по объему хранения выполняется за счет подключения дополнительных дисковых полок SAS либо NVMEoF. Максимальное количество дисков, до которого может быть расширена система, указано в...
2837
1
3668
51
Введение В исследовании Gartner Magic Quadrant for Distributed File Systems and Object Storage (Published 19 October 2022) [1] VAST Data позиционируется в качестве претендента в этом магическом квадранте, занимая 6-е...
3668
51