Моніторинг ДБЖ. Частина друга – автоматизуємо аналітику

Якийсь час тому я навів систему для оцінки життєздатності офісних UPS. Оцінка ґрунтується на довгостроковому моніторингу. За результатами використання систему допил і дізнався багато цікавого, про що і розповім - ласкаво просимо під кат.

Перша частина

Загалом задум виявився вірним. З разового запиту до UPS можна дізнатися хіба що життя – біль. Частина параметрів має відношення до реальності тільки без підключених 220 В, деякі за результатами аналізу виявляються відвертим маренням, якісь потрібно перераховувати руками, звіряючись із реальністю.

Забігаючи наперед, ці нюанси в систему я постарався додати. Ну не руками ж рахувати, справді, автоматизатори ми чи що.

Ось, наприклад, параметр «заряд батареї у відсотках«. Як одиночне значення він повідомляє нічого і зазвичай дорівнює 100. Що дійсно важливо: як швидко батарея розряджається, як швидко заряджається, скільки разів була розряджена до критичних значень. Дивно, але частина цієї роботи ДБЖ робить сама, проте за дуже дивними формулами; про це нижче.

Параметр «навантаження на ДБЖ» дуже хороший і корисний. Але якщо дивитися на нього в динаміці, виявляється, що іноді там марення, а іноді цікаві відомості про підключене обладнання.

«Вольтаж батареї«. Практично Грааль, якби не одне але: абсолютна більшість часу батарея знаходиться на заряді, і параметр відображається вольтаж заряду, а не батареї. Чекайте, а цим не повинна займатися процедура self-test?

«Самоперевірка«. Мабуть, лише її результати виводяться нікуди. При невдалому self-test ДБЖ відключиться і закричає як різаний, це єдиний доступний результат. Плюс не всі ДБЖ повідомляють про сам факт, що відбувся self-test.

І «nice try vendor» – найцікавіший параметр «час автономної роботи«. Він має передбачити, скільки протримається батарея при наявному навантаженні. Також на нього пов'язана внутрішня логіка поведінки ДБЖ. Фактично він показує рожеві мрії, особливо у стані повного заряду.

Знайшлися й нюанси організаційного характеру.

Наприклад, всі ДБЖ, що мені попалися, мають дані про дату батареї (аж два поля). При цьому записати ці дані (після заміни батареї, відповідно) мені вдалося тільки у виробі від APC, та й танцюючи з бубном. У Powercom ж ці відомості не впхнути ніяк, принаймні під Windows.
Той самий Powercom відзначився однаковими значеннями у полі «serial number». Запису воно також не підлягає.

Калькуляція «час автономної роботи«, схоже, включає значення з тих періодів, коли до ДБЖ підключені 220 В, і, відповідно, дані про батареї відверто невірні. За фактом battery runtime можна сміливо ділити на 2, а то й на 3. І при цьому все одно залишиться суто синтетичним значенням. Крім того, воно засноване на «battery load», за яким теж помічені дивацтва: на деяких екземплярах воно довго не скидається після високого навантаження, а на інших прагне до нуля.

Незважаючи на такий зоопарк, можна побачити, що всі параметри, як і раніше, піддаються певній алгоритмітизації. А значить, можна не просто дивитися на дані (і вже тим більше переглядати вручну всі записи), але відразу заганяти весь масив в аналізатор і будувати на їх підставі рекомендації. Що й було реалізовано у новій версії ПЗ.

Сторінка відомостей про ДБЖ видасть попередження та рекомендації:

  • зареєстровано хоча б один провал self-test (якщо ДБЖ надає такий функціонал)
  • необхідність замінити батарею
  • незвичайні значення навантаження на ДБЖ
  • відсутність даних про батарею
  • незвичайні значення вхідної напруги
  • рекомендації щодо використання даних та обслуговування ДБЖ

(Всі можливі варіанти можна знайти в ups_additional.php)
Необхідною умовою для коректної аналітики, звичайно, є максимально можливе збирання даних.

На головній сторінці можна відразу побачити максимальні та критичні значення та відкориговане передбачення часу роботи.

А ще:

  • тепер коректно вважається максимальний час втрати харчування
  • актуальна інформація з ДБЖ позначається зеленим кольором, застаріла – сірим, критична червоним та оранжевим
  • додано процедуру оптимізації бази даних (запускається вручну, з автоматичним створенням бекапу)
  • прибрано непотрібну інформацію з головного екрану та додано корисну 🙂

Моніторинг ДБЖ. Частина друга – автоматизуємо аналітику

Моніторинг ДБЖ. Частина друга – автоматизуємо аналітику

Відмова від відповідальності:
Звичайно, це зовсім не ентепрайз. Майже вся установка вручну. Тестів було замало, де-не-де вискакують помилки. Проте користуюся з користю і вам бажаю.
github.com/automatize-it/NUT_UPS_monitoring_webserver_for_Windows

Дякуємо за увагу!

Тільки зареєстровані користувачі можуть брати участь в опитуванні. Увійдіть, будь ласка.

Потрібно ще щось додавати в ПЗ?

  • допилюй до ентерпрайзу!

  • setup-и б непогано, щоб не руками ставити

  • ні, так норм

  • бензин, спали його

  • купу всього треба, напишу у коментарях

Проголосували 34 користувачів. Утрималися 13 користувачів.

Джерело: habr.com

Додати коментар або відгук