В человеке все должно быть прекрасно, а в современном дата-центре все должно работать, как швейцарские часы. Ни один компонент сложной архитектуры инженерных систем ЦОДа не должен оставаться без внимания службы эксплуатации. Именно этими соображениями руководствовались мы на площадке Linxdatacenter в Санкт-Петербурге, готовясь к сертификации Uptime Management & Operations в 2018 году и приводя все системы дата-центра в соответствие с лучшими мировыми стандартами.
Сегодня я расскажу, как и зачем мы внедряли систему удаленного контроля давления и «подпора» воздуха в серверных. Напомню, что в процессе подготовки к аудиту Uptime Institute одной из решаемых задач был вопрос чистоты. Наша команда работала по двум направлениям: клининг (ранее мой коллега
О чем речь
В любом серверном помещении есть система общеобменной вентиляции. Она устроена очень просто: одна вентиляционная машина работает на приток воздуха внутрь, вторая — на его вытяжку наружу. Оба двигателя управляются частотными регуляторами, — то есть, можно менять частоту их оборотов и тем самым регулировать объемы подаваемого/удаляемого воздуха.
Задач у этой системы две:
- Обеспечить требуемый воздухообмен для комфортного пребывания людей в серверной (количество людей задается исходя из специфики помещения),
- Обеспечить избыточное давление воздуха в серверной, чтобы не втягивать в помещение частицы пыли через открытые двери и поддерживать необходимую чистоту.
Приточная вентмашина должна подавать в серверную больше воздуха, чем выводится вытяжкой. Так обеспечивается избыточное давление в серверной по отношению к соседним помещениям — так называемый «подпор» воздуха. При такой системе воздух попадает в серверную только через фильтры приточной вентиляции, и поступление нефильтрованного воздуха в серверную исключено.
Если вдруг все происходит наоборот – вытяжная вентиляция удаляет больше воздуха, чем подает приточная, – то нефильтрованный воздух начинает поступать в серверную из смежных помещений, что часто является причиной наличия пыли на поверхностях и на оборудовании.
No control
Вроде бы все просто. Однако на момент начала работ по повышению качества клининга в ЦОДе у нас не было эффективного инструмента контроля за наличием подпора. Мы устанавливали частоту подачи больше, чем частоту вытяжки, и дальше производили донастройку «на глаз». Двери в серверную открываются с трудом (как будто притягиваются внутрь) – подпор отрицателен. Если наоборот – доводчик не справляется с закрытием – значит, подпор очень сильный. Нащупывая некий баланс между двумя этими состояниями, где-то посередине мы и останавливались.
Однако этот подход ненадежен, и мы посчитали невозможным далее полагаться на него.
Почему? Работая «на глаз», невозможно учитывать влияние состояния воздушных фильтров на мощность подающей вентиляции. Если фильтр чистый – мы увидим определенные показатели сопротивления и объема подаваемого воздуха, если же фильтр загрязнен, то эти показатели будут заметно отличаться. По динамике открытия-закрытия двери эти нюансы не отследишь.
Обычно замена фильтра происходит по штатному механическому дифференциальному манометру, который отключает вентиляцию на определенной стадии загрязнения фильтра (разница давлений до и после фильтра не должна превышать определенный показатель, соответствующий норме чистоты фильтра).
Получается, что есть длительный период жизни фильтра, пока он постепенно загрязняется, а штатный дифференциальный манометр вентиляции считает его пригодным к работе. Но мощность вентиляции и, следовательно, сила подпора меняются в зависимости от состояния фильтра.
Штатный диффманометр вентиляции.
В итоге мы пришли к выводу, что процесс настройки и контроля подпора при таком сценарии слишком сложен и опять же неэффективен для ЦОДа.
Решение
За ответом на вопрос «И как же нам поступить?» мы обратились к лучшим мировым практикам, в чем помогла поездка в Стокгольм с экскурсией по местным ЦОДам.
В одном из дата-центров мы увидели нужное нам решение – механический диффманометр был установлен на входе в серверную и показывал разницу давлений «серверная/коридор».
Что интересно, шведские коллеги используют диффманометры у входа в серверные и для контроля загрязненности вентиляционного фильтра: они меняют фильтры при снижении подпора, не дожидались сигнала от штатного диффманометра системы вентиляции. Показания маноментра визуально контролируют дежурные на обходах.
Вернувшись, мы стали искать подобное оборудование в России. Оказалось, что подобные диффманометры применяются у нас в так называемых «чистых помещениях», то есть в операционных, лабораториях и т.п. Из-за особого статуса помещений цены на это оборудование оказались заоблачными.
Кроме того, нам был нужен не аналоговый прибор, а цифровой, желательно с выходом 4-20мА, чтобы можно было подключить его к системе мониторинга ЦОДа. Это было важно для установки пороговых показателей для отправки оповещений, и для сбора и анализа статистики.
Кто ищет — тот всегда найдет
Нам повезло – вскоре после начала поисков удалось найти необходимый прибор: цифровой дифференциальный манометр с экраном и выходом для подключения к BMS при бюджете порядка 10 000 рублей за единицу.
Установили, настроили и удивляемся только одному – почему мы раньше до такого сами не догадались, и почему это решение не является стандартным в проектах ЦОД.
Выглядит это так:
Электронный диффманометр в коридоре снаружи серверного зала, трубка одного измерительного канала заведена в серверный зал, второй канал измеряет давление в коридоре.
А вот так устройство отображается в системе мониторинга ЦОДа:
Так выглядит статистика показаний манометра в системе мониторинга:
Согласно ГОСТу Р ИСО 14644-4-2002 «Чистые помещения и связанные с ними контролируемые среды», взятому нами за ориентир, «для беспрепятственного открывания дверей и исключения непредусмотренного встречного потока воздуха из-за турбулентности, как правило, перепад давления между чистыми помещениями или чистыми зонами с различными классами чистоты должен быть от 5 до 20 Па».
Именно этот диапазон взят нами в качестве нормы в ЦОДе. Как только происходит отклонение, это сразу регистрируется в системе, – как показано на графике ниже.
Резкое падение давления на графике – это открытая дверь в серверную.
Если показания датчика ниже уставки более 5 минут – значит что-то с фильтром, произошла какая-то авария, словом, что-то внештатное. Конкретно на этом графике причиной является длительное открытие двери для завоза оборудования в помещение.
Что мы получили
Во-первых, новый уровень контроля и прозрачности работы инженерных систем дата-центра.
Во-вторых, контроль за чистотой стал еще более эффективным: система позволяет предупреждать снижение подпора и заранее менять воздушные фильтры или устранять другие причины его снижения.
В-третьих, все эти процессы контролируются математически точными инструментами. Мы собираем историю наблюдений в динамике и имеем статистику по реальному сроку эксплуатации воздушных фильтров и всем нештатным ситуациям.
Пройденный аудит Management & Operations и наш недавний визит в европейские ЦОДы показал, что мы являемся пионерами в этом направлении не только в России, но и в ЕС – такие решения встречаются далеко не у каждого лидера рынка дата-центров в Европе.
Конечно, эта система не является ключевой для работы инженерных систем площадки. В то же время, это крайне полезное дополнение для службы эксплуатации и отличная иллюстрация соответствия нашего ЦОДа высоким стандартам. В нашей отрасли мелочей не бывает.
Источник: habr.com