Преглед Окерр хибридног система за надзор

Пре две године већ сам направио пост Једноставан прелазак на грешку за веб локацију про окерр. Сада постоји неки развој пројекта, а ја сам и објавио изворни код на страни сервера окерр под отворена лиценца, зато сам одлучио да напишем ову кратку рецензију на Хабру.

Преглед Окерр хибридног система за надзор
[ Фулл сизе ]

Коме може бити занимљиво

Ово може да вас занима ако радите у малом тиму или сами. Немате надзор и нисте сигурни да ли вам је заиста потребан. Или сте покушали са неким популарним озбиљним надзором „за велике дечаке“, али вам некако „није успео“, или ради у скоро подразумеваној конфигурацији и није много променио ваш живот. И такође - ако дефинитивно не планирате да доделите целог запосленог (или чак одељење) да надгледа надзорну таблу најмање неколико сати дневно или да је конфигуришете.

Зашто је окер необичан

Следеће ћу показати занимљиве карактеристике окерра које га разликују од неких других система за праћење.

Окерр је хибридни мониторинг

Током интерног надгледања, на надгледаним машинама ради „агент“ који преноси податке на сервер за надгледање (на пример, слободан простор на диску). Када је екстерни, сервер врши провере преко мреже (на пример, пинг или доступност веб локације). Сваки приступ има своја ограничења. Окерр користи обе опције. Провере унутар сервера обављају врло лагани (30Кб) агенти или ваше сопствене скрипте и апликације, а мрежне провере се обављају преко окер сензора у различитим земљама.

окерр није само софтвер, већ и услуга

Серверски део сваког надзора је велики и сложен, тешко га је инсталирати и конфигурисати и захтева ресурсе. Са окерр-ом можете инсталирати сопствени сервер за надгледање (бесплатан је и отвореног кода), или једноставно можете користити само клијентски део и користити услугу нашег сервера. Такође бесплатно.

Ако вам праћење омогућава да надокнадите и прикријете недостатак поузданости у серверима и апликацијама, онда се поставља филозофско питање - ко је чувар? Како ће нам праћење рећи о проблему ако је он сам из неког разлога „умро“, одвојено или заједно са вашим другим ресурсима (на пример, пао је канал до центра података)? Када користите екстерни сервис окерр - овај проблем је решен - добићете упозорење чак и ако је цео дата центар са вашим серверима без струје или је нападнут од стране зомбија.

Наравно, постоји ризик да сам окерр сервер буде недоступан, то је тачно (као што знате, 90% поузданости се увек добија једноставно и „бесплатно”, 99% уз минимум труда, а сваки следећих девет је експоненцијално теже). Али, прво, шансе да се то догоди су мање, а друго, проблем може остати непримећен само ако се поклопи са проблемима на нашим серверима. Ако имамо 99.9% поузданости, а ви имате 99.9% (не превисоке бројке), онда је шанса за неоткривени квар 0.1% од 0.1% = 0.0001%. Додавање три деветке вашој поузданости готово без напора и без трошкова је веома добро!

Још једна предност надгледања као услуге је то што хостинг провајдер или веб студио може да инсталира окер сервер и омогући приступ клијентима као плаћену или бесплатну додатну услугу. Ваши конкуренти имају само хостинг и веб странице, али ви имате поуздан хостинг са надзором.

Окерр се односи на индикаторе

Индикатор је "сијалица". Има два главна стања - зелено (ОК) или црвено (ЕРР). Пројекат садржи много груписаних (на пример, по серверу) индикатора. На главној страници пројекта одмах видите да је или све зелено (и можете га затворити), или нешто светли црвено и да треба да се исправи. Када прелазите између ових стања, шаље се упозорење. Једном дневно док га постављате, шаље се резиме пројекта.

Преглед Окерр хибридног система за надзор

Сваки окер индикатор има уграђене услове по којима мења стање (у Заббик-у се то зове окидач). На пример, просек оптерећења не би требало да буде већи од 2 (наравно, ово се може конфигурисати). И за сваку интерну проверу (учитавање просечно, диск слободан, ...) постоји чувар. Ако из неког разлога не добијемо успешну потврду у заказано време, грешка се евидентира и шаље се упозорење.

Наш уобичајени радни образац је да ујутру проверавамо мејлове и гледамо резиме између осталих писама (заказујемо га на почетку рада). Ако је у њему све у реду, радимо друге важне ствари (али да бисмо били сигурни, можемо брзо да погледамо контролну таблу окерра и уверимо се да је све зелено у овом тренутку). Ако стигне упозорење, реагујемо.

Наравно, могуће је једноставно задржати „информативне“ индикаторе (да бисте видели слику мреже са мониторинга), али све је урађено да се једноставно, лако и брзо креирају индикатори посебно за аутоматско праћење и слање упозорења.

Сврха за коју подешавате окерр је у упозорењима, тако да можете да направите индикатор за минут, могао би да "спава" годину дана, само прихвати ажурирања, а када годину дана касније нешто поквари, пали и шаље упозорење. Исплатио се тренутак који сте једном потрошили на креирање индикатора; сазнали сте за проблем одмах, пре било кога другог. Могуће је да су то поправили пре него што је ико приметио. Нешто што се брзо подигне не сматра се палим!

безбедност

Било би штета да подесите надгледање ради повећања поузданости, али као резултат, преко њега сте нападнути преко мреже, а постоји доста мрежних рањивости у различитим алатима за праћење (Заббик, Нагиос).

Агент (океррмод из пакета океррупдате) који ради на систему није мрежни сервер, већ клијент. Дакле, на надгледаном серверу нема додатних отворених портова, клијент лако ради иза заштитног зида или НАТ-а и веома га је тешко (рекао бих „немогуће“) за хаковање преко мреже, пошто у принципу не слуша мрежу соцкет.

Потпуна покривеност мониторингом

Сада је наше правило да о свим техничким проблемима сазнајемо од окерр-а. Ако се изненада правило прекрши (окерр није упозорио на његову непосредну појаву (ако је то могуће) или да се већ догодило) - додајемо провере у окер.

Екстерне провере

Сасвим типичан сет:

  • пинг
  • хттп статус
  • провера ваљаности и свежине ССЛ сертификата (упозориће ако ускоро истиче)
  • отворите ТЦП порт и банер на њему
  • хттп греп (страница [не сме] да садржи одређени текст)
  • сха1 хеш да би се ухватиле промене странице.
  • ДНС (ДНС запис мора имати одређену вредност)
  • ВХОИС (упозориће ако се домен поквари)
  • Антиспам ДНСБЛ (провера домаћина у односу на 50+ црних листа антиспама одједном)

Интерне провере

Такође, прилично стандардни сет (али лако проширив).

  • дф (слободан простор на диску)
  • просечно оптерећење
  • опентцп (отворите ТЦП утичнице за слушање - обавестиће ако је нешто почело или се срушило)
  • време рада - само време рада на серверу. Обавестиће ако се променио (тј. сервер је преоптерећен)
  • цлиент_ип
  • дирсизе - користимо га да пратимо када роотфови наше виртуелне машине премаше дозвољену величину, без увођења строгих ограничења и величине кућних директоријума корисника
  • празни и непразни - надгледајте датотеке које треба да буду празне (или не празне). На пример, дневник грешака самог окер сервера треба да буде празан, а ако у њему постоји чак и ред, добићу обавештење и проверићу га. Али маил.лог на серверу поште НЕ би требало да буде празан (Н минута након ротације). А понекад је био празан за нас након ажурирања система, када логротате није могао да поново покрене рсислог исправно.
  • линецоунт - број редова у датотеци (као вц -л). Користимо га као мекшу замену за празно, када евиденција грешака и даље може да расте, али само полако (на пример, Гооглебот погађа неке затворене странице). Постоји ограничење од 2 реда у 20 минута. Ако је већи, биће упозорење

Занимљиве интерне провере

Ако сте до сада читали „дијагонално“, сада ће бити занимљивије читати пажљивије.

резервне копије

Надгледа резервне копије у директоријуму. Наше резервне датотеке имају називе као што су „СерверНаме-20200530.тар.гз“. За сваки сервер у окерр-у се креира индикатор СерверНаме-ДАТЕ.тар.гз (стварни датум се мења у ред „ДАТЕ“). Прати се и само присуство свеже резервне копије и њена величина (на пример, она не може бити мања од 90% претходне резервне копије).

Шта треба да се уради да би нова резервна копија почела да се прати након што смо почели да је правимо и стављамо у овај директоријум? Ништа! Ово је веома згодан приступ када не морате да урадите „ништа“ јер:

  • Не радити „ништа“ је прилично брзо, штеди време
  • Тешко је заборавити да урадите „ништа“
  • Тешко је учинити „ништа“ погрешно, са грешком. Ништа није најпоузданији метод

Ако изненада свеже датотеке резервних копија престану да се појављују, појавиће се упозорење. Ако сте, на пример, онемогућили један од сервера, и не би требало да буде више резервних копија, мораћете да избришете индикатор (преко веб интерфејса или из љуске преко АПИ-ја).

макфилесз

Прати величину највећих датотека (обично: /вар/лог/*). Ово вам омогућава да ухватите непредвидиве проблеме, на пример, грубе лозинке или слање нежељене поште преко сервера.

рунстатус/рунлине

Ово су два важна прокси модула за покретање других програма на серверу. Рунстатус пријављује излазни код програма индикатору. На пример, окерр не (захтева) модул да провери да ли системски сервиси раде. Ово се ради преко статуса покретања (погледајте доле). Рунлине - јавља серверу линију коју програм производи. На пример, temp_RUN="cat /sys/class/thermal/thermal_zone0/temp" у Рунлине конфигурацији на нашем серверу креира индикатор сервернаме:темп са температуром процесора.

скл

Извршава нумерички упит за МиСКЛ и пријављује резултат индикатору. У једноставном случају, можете да урадите, на пример, „СЕЛЕЦТ 1“ - ово ће проверити да ли ДБМС у целини ради.

Али много интересантнија апликација је, на пример, праћење броја поруџбина у онлајн продавници. Ако знате да имате 100 или више поруџбина на сат, можете подесити минимално ограничење на 100 или 80. Онда ако вам продаја изненада падне, добићете упозорење и то можете да схватите.

Имајте на уму да није важно из ког непредвидивог разлога се ово догодило:

  • Сервер је једноставно недоступан (искључен или без мреже), а упозорење је стигло из чињенице да је индикатор „покварен“.
  • Сервер је преоптерећен нечим, ради споро или се губе пакети, незгодно је за кориснике и одлазе без куповине
  • Сервер је укључен у спам листе и пошта са њега се не прихвата, корисници не могу да се региструју
  • Буџет рекламне кампање је истекао, банери се не врте.

Разлога може бити много, а сви се не могу унапред предвидети, а технички их је тешко пратити. Али можете лако пратити коначан параметар (наредбе) и на основу њих утврдити да је ситуација сумњива и да заслужује да се позабави.

Логички показатељи

Омогућава употребу Булових израза (Питхон синтакса) преко модула евалидате(чланак о Хабреу). Подаци из пројекта и његови индикатори су доступни за изражавање. На пример, у горњем поглављу о СКЛ провери, можда сте приметили слабу тачку – дању можемо да имамо 100 продаја на сат, али ноћу – 20, и то је уобичајено, није проблем. Шта бих требао да урадим? Индикатор ће стално паничарити ноћу.

Можете креирати два индикатора, дан и ноћ. Учините оба „нечујна“ (неће слати упозорења). И направите логички индикатор који захтева да индикатор дана буде у реду пре 20:00, а после 20:00 довољно је да индикатор ноћи буде ОК.

Други пример коришћења логичког индикатора је ескалација. На пример, менаџер пројекта се одјављује од упозорења (он нема потребе да то ради, администратори треба да реагују на нормалне проблеме), али се претплаћује на логички индикатор који постаје црвен ако било који индикатор у пројекту није исправљен у предвиђеном времену.

Такође, могуће је подесити дозвољено време за рад, на пример, од 3 до 5 сати ујутро. Није нас брига да ли се сервери и сајтови кваре током овог времена. Али у 5:00 морају да раде. Ако не раде у било које друго време - узбуна. Логички индикатор вам такође омогућава да узмете у обзир редундантност сервера. Ако имате 5 веб сервера, онда администратори могу да искључе 1-2 сервера у било ком тренутку. Али ако има мање од 3 од 5 сервера у борби, биће упозорење.

Горе наведени примери нису окер функције, нису неке функције које треба активирати и конфигурисати. Окерра нема све ове функције, али постоји логички модул који вам омогућава да имплементирате ову функционалност (Приближно као у програмском језику - ако имамо аритметичке операторе, онда нам није потребна посебна функција за израчунавање 20% ПДВ-а из језика, увек можете сами да урадите то да одговара вашим потребама).

Логички индикатор је вероватно једна од ретких релативно сложених тема у окерр-у, али добра вест је да не морате да га савладате док не буде потребно. Али у исто време, они у великој мери проширују могућности, док сам систем одржавају прилично једноставним.

Додавање сопствених чекова

Заиста бих желео да пренесем идеју да окерр није скуп хиљада готових чекова за све прилике, већ напротив – пре свега – једноставан мотор са једноставном могућношћу креирања сопствених чекова. Прављење сопствених провера у окерр-у није задатак за хакере, системске ко-програмере или барем напредне кориснике окера, већ изводљив задатак за сваког администратора који је први пут инсталирао Линук пре месец дана.

Провере минималних зарада врше се кроз модул рунстатус:

Ова линија у конфигурацији рунстатус ће вас обавестити ако се /бин/труе изненада не покрене или врати нешто друго осим 0.

true_OK=/bin/true

Само један ред - и ево нас већ мало проширен функционалност окрр.

Чак и таква провера већ има своју вредност: ако се изненада ваш сервер сруши, одговарајући индикатор на серверу окерр неће бити ажуриран на време, а након истека времена појавиће се упозорење.

Ова провера ће обавестити да се апацхе2 сервер срушио (па, никад се не зна...):

apache_OK="systemctl is-active --quiet apache2"

Дакле, ако говорите било који програмски језик и барем можете да пишете схелл скрипте, онда већ можете да додате сопствене провере.

Још теже - можете написати (на било ком језику) сопствени модул за океррмод. У најједноставнијем случају то изгледа овако:

#!/usr/bin/python3

print("STATUS: OK")

Зар није јако тешко? Модул мора сам извршити проверу и послати резултате у СТДОУТ. Сложенији модул даје, на пример, ово:

$ okerrmod --dump df
NAME: pi:df-/
TAGS: df
METHOD: numerical|maxlim=90
DETAILS: 49.52%, 13.9G/28.2G used, 13.0G free
STATUS: 49.52

NAME: pi:df-/boot
TAGS: df
METHOD: numerical|maxlim=90
DETAILS: 84.32%, 53.1M/62.9M used, 9.9M free
STATUS: 84.32

Ажурира неколико индикатора одједном (одвојено празном линијом), креира их ако је потребно, указује на детаље верификације и ознаку помоћу које је лако пронаћи потребне индикаторе на контролној табли.

Telegram

Постоји Телеграм бот @ОкеррБот. Не морате да затрпате телефон засебним апликацијама (не свиђа ми се што за Пјатерочку треба једна апликација са мапом, за Ленту друга, за МТС трећа, и тако за све, све, све). Довољан је један телеграм. Преко телеграма можете одмах примати упозорења, проверити статус пројекта и дати команду за поновну проверу свих проблематичних индикатора. Изашли смо из позоришта/авиона, два сата нисмо држали прст на пулсу, укључили телефон, притиснули једно дугме у цхатботу и уверили се да је све у реду.

Статус Пагес

Данас су статусне странице готово незаобилазне за сваки бизнис који има ИТ, одговоран однос према поузданости и који се са поштовањем односи према својим клијентима/корисницима.

Замислите ситуацију - корисник жели нешто да уради, погледа информације или наручи, а нешто не ради. Не зна шта се дешава, на чијој је страни проблем и када ће се решити. Можда ваша компанија једноставно има нефункционалну веб страницу? Или се покварио пре шест месеци и биће поправљен за две године? Али сада треба да купите фрижидер, он је већ у колицима... А сасвим је друга ствар када човек види да са тобом нешто није у реду (барем је јасно да проблем није на његовој страни), да проблем је откривен, да већ радите на њему, а можда чак и записали оквирно време за исправку. Корисник може да се претплати и добије обавештење е-поштом када је проблем отклоњен и може да ради шта жели (купи фрижидер).

Преглед Окерр хибридног система за надзор

Проблеми и застоји се дешавају свима. Али корисници и партнери више верују онима који су транспарентнији и одговорнији у свом приступу овоме.

ovde је преглед 10 других пројеката који вам омогућавају да креирате статусне странице. Ево примера како изгледају ове странице пројекта Питон и Дропбок. окер статус паге.

Фаиловер

Да овај чланак не би био дужи, још једном ћу се осврнути на мој претходни чланак - Једноставан прелазак на грешку за веб локацију . Ако можете да направите дупликат сервера, онда помоћу преласка на грешку, у суштини нећете имати дуго застоје - чим се открије проблем, корисници ће аутоматски бити преусмерени на сервер резервне копије који ради. И чини ми се да је ово веома занимљива, светла карактеристика која је ретко игде доступна.

Ниски системски захтеви

За окер сервере користимо машине са РАМ меморијом од 2Гб. За мрежне сензоре је довољно чак 512Мб. Клијентски део је генерално скоро нула. (Пластична кеса океррупдате тежак је 26 Кб, али захтева Питхон3 и стандардне библиотеке). Клијент се покреће из црон скрипте, тако да нема сталну потрошњу меморије. Међу машинама које смо пратили имамо сензоре (супер јефтин ВПС са 512Мб РАМ-а) и Распберри Пи. Могуће је и без клијентског дела шаљите ажурирања преко цурл-а! (види доле)

Узимајући ово у обзир - окерр, вероватно најслободнији систем за праћење од доступних, јер чак и да бисте користили други бесплатни систем отвореног кода као што је Заббик или Нагиос, потребно је да му доделите ресурсе (сервер), а то је већ новац. Поред тога, и даље је потребно неко одржавање сервера. Са окерром, овај део се може уклонити. Или не морате да га уклоните и користите сопствени сервер, у зависности од тога шта вам се највише свиђа.

АПИ и интеграција у власнички софтвер

Једноставна и отворена архитектура. окер има прилично једноставан АПИ за, са којим је лако радити. Треба да креирате 1000 индикатора? Једна схелл скрипта од 3-4 реда ће то учинити. Треба да реконфигуришете 1000 индикатора? Такође је врло лако. На пример, желимо још једном да проверимо све наше ХТТПС сертификате са руског сензора:

#!/bin/sh

for indicator in `okerrclient --api-filter sslcert`
do
    echo set location for $indicator
    okerrclient --api-set location=ru retest=1 --name $indicator
done

Можете ажурирати индикатор помоћу нашег клијентског модула, чак и без њега, само преко цурл-а.

# short and nice (using okerrupdate and config file)
$ okerrupdate MyIndicator OK

# only curl is enough!
$ curl -d 'textid=MyProject&name=MyIndicator&secret=MySecret&status=OK' https://bravo.okerr.com/

Можете ажурирати индикаторе директно из свог програма. На пример, слање сигнала откуцаја срца тако да окерр зна да ради и подиже аларм ако се сруши или замрзне. Узгред, окерр компоненте раде управо то – окер надгледа себе, а проблеми у скоро сваком модулу ће бити откривени и генерисати упозорење о проблему. (А у случају овог „скоро“ - они се унакрсно проверавају са другог сервера)

Ево кода (поједностављеног) у нашем телеграм боту:

from okerrupdate import OkerrProject, OkerrExc

op = OkerrProject()
uptimei = op.indicator("{}:telebot_uptime".format(hostname))
...
uptimei.update('OK', 'pid: {} Uptime: {} cmds: {}'.format(
        os.getpid(), dhms(uptime), commands_cnt))

Постоји библиотека за ажурирање индикатора из Питхон програма океррупдате, за било које друге језике не постоје библиотеке, али можете или позвати океррупдате скрипту или направити ХТТП захтев за окерр сервер.

Како нам окер помаже

Окерр је променио наше животе. Заиста. Можда би други систем за праћење могао да уради исто, али рад са окерр-ом је лак и једноставан за нас и има све функције које су нам потребне (додали смо оно што није имао). Успут, ако недостају неке функције, питајте и ја ћу их додати (не обећавам, али желим да окерр буде најбољи систем за праћење за мале и средње пројекте). Или још боље, додајте га сами - лако је.

Успели смо да живимо по принципу „о свим проблемима сазнај од кере“. Ако се изненада појави проблем за који нисмо сазнали од окерр-а, додајемо проверу у окер. (у овом случају, под „ми“ мислим на нас као кориснике система, а не као ко-програмере). У почетку је то било уобичајено, али сада је постало веома ретко.

Праћење

Преко окерр-а пратимо величине дневника на свим серверима. Наравно, немогуће је пажљиво прочитати сваки ред дневника својим очима, али једноставно праћење стопе раста већ даје много. Кроз ово смо открили слање нежељене поште и бруте форце претраге лозинки, а када нека од апликација „полуде“, нешто им не полази за руком и они то понављају изнова и изнова (сваки пут додајући неколико редова у дневник ).

ССЛ сертификати. Скоро одмах након лансирања ЛетсЕнцрипт наш клијент је почео да пружа бесплатне ССЛ сертификате својим клијентима (њих око хиљаду). И испоставило се да је то био само пакао за администрацију! Чињеница је да су сајтови „живи“, клијенти повремено траже од њих да нешто ураде, програмери то раде. Они могу потпуно слободно да пренесу сајт на други ДоцументРоот, на пример. Или додајте безусловно Реврите у конфигурацију виртуелног хоста. Наравно, након овога долази до прекида аутоматског обнављања сертификата. Сада имамо све ССЛ хостове који су аутоматски додани у окер преко другог нашег корисног услужног програма из пакета а2цонф. Хајде само да покренемо a2okerr.py — и ако се на серверу појави неколико нових сајтова, они ће се аутоматски појавити у окерр-у. Ако се изненада из неког разлога сертификат не обнови, три недеље пре истека сертификата, ми смо у току, а ми ћемо схватити зашто није ажуриран, такав пас. a2certbot.py из истог пакета - доста помаже у овоме (одмах проверава највероватније проблеме - и напише шта је добро проверено, а где је највероватније проблем).

Пратимо датум истека свих наших домена. И сви наши сервери за пошту који шаљу пошту такође се проверавају у односу на 50+ различитих црних листа. (И понекад упадају у њих). Иначе, да ли сте знали да су и Гоогле сервери поште такође на црној листи? Само ради самотестирања, додали смо маил-вр1-ф54.гоогле.цом на надгледане сервере и још увек је на црној листи СОРБС-а! (Овде се ради о вредности „анти-спамера“)

Резервне копије - Већ сам писао изнад како их је лако пратити помоћу окера. Али пратимо и најновије резервне копије на нашем серверу и (користећи посебан услужни програм који користи окерр) резервне копије које отпремамо на Амазон Глациер. И, да, проблеми се дешавају с времена на време. Није ни чудо што су гледали.

Користимо индикатор ескалације. Приказује да ли неки проблем није решен дуже време. И сама, када решим неке проблеме, понекад могу да заборавим на њих. Ескалација је добар подсетник, чак и ако надгледате себе.

Све у свему, верујем да је квалитет нашег рада порастао за ред величине. Застоја готово да и нема (или клијент нема времена да то примети. Само пссст!), док је обим посла мањи, а услови рада мирнији. Са хитног рада са крпљењем рупа селотејпом прешли смо на миран и одмерен рад, када су многи проблеми унапред предвиђени и има времена да се спрече. Чак и проблеми који су се десили такође су постали лакши за отклањање: прво, сазнајемо за њих пре него што клијенти успаниче, а друго, често се дешава да је проблем везан за недавне послове (док сам радио једну ствар, покварио сам другу) - па је вруће. Лакше се трагови носе са тим.

Али био је још један случај...

Да ли сте знали да је у популарном Дебиан-у 9 (Стретцх) тако популаран пакет као што је пхпмиадмин још увек (већ много месеци!) у рањивом статусу? (ЦВЕ-КСНУМКС-КСНУМКС). Када се рањивост појавила, брзо смо је покрили на различите начине. Али сам подесио праћење странице за праћење безбедности у окерр-у да бих знао када ће изаћи „прелепо“ решење (преко СХА1 збира садржаја). Индикатор ми се неколико пута трзао, страница се мењала, али као што видите, и даље (од јануара 2019!) не указује да је проблем решен. Можда, узгред, неко зна у чему је проблем што је тако важан пакет и даље рањив више од годину дана?

Други пут у сличној ситуацији: након рањивости у ССХ-у, било је потребно ажурирати све сервере. А када поставите задатак, потребно је да контролишете извршење. (Подређени имају тенденцију да погрешно разумеју, забораве, збуне се и греше). Због тога смо прво додали проверу ССХ верзије у окер на свим серверима, а преко окерр-а смо се уверили да су ажурирања уведена на свим серверима. (Погодно! Изабрао сам ову врсту индикатора, и одмах можете видети који сервер има коју верзију). Када смо били сигурни да је задатак завршен на свим серверима, уклонили смо индикаторе.

Неколико пута се десила ситуација да се појави одређени проблем, а онда сам од себе нестане. (вероватно свима познато?). Док то приметите, док проверите – а нема шта да се провери – све је већ добро функционисало. Али онда се поново ломи. То нам се десило, на пример, са производима које смо отпремили на Амазон Маркетплаце (МВС). У неком тренутку, учитани инвентар је био нетачан (погрешне количине робе и погрешне цене). Схватили смо. Али да бисмо то схватили, било је важно одмах сазнати о проблему. Нажалост, МВС је, као и сви Амазон сервиси, мало спор, тако да је увек било кашњења, али ипак смо успели да бар приближно схватимо везу између проблема и скрипти које га узрокују (проверили смо, заглавили смо то окерр-у и проверио је одмах примивши упозорење).

Недавно је у колекцију додао један занимљив ковчег од великог и скупог европског хостера који користи наш купац. Одједном су СВИ наши сервери нестали са радара! Прво, сам купац (брже од окерра!) је приметио да се сајт са којим је радио не отвара и направио тикет о томе. Али није пала само једна локација, већ сви! (Наташа, све смо испустили!). Овде је Окер почео да шаље дугачке облоге за стопала са свим индикаторима који су му се упалили. Паника, паника, трчимо у круг (шта друго можемо?). Онда се све подигло. Испоставило се да је било рутинског одржавања у дата центру (једном у много година) и, наравно, требало је да будемо упозорени. Али десио им се неки проблем и нису нас упозорили. Па, више срчаних удара, мање срчаних удара. Али након што се све врати, морате све поново проверити! Не могу да замислим како бих то урадио својим рукама. Окер је све тестирао за неколико минута. Испоставило се да је већина сервера једноставно била привремено недоступна, али су радили. Неки су били преоптерећени, али и устали како треба. Од свих губитака, изгубили смо две резервне копије које је по круни требало да се креирају и учитају док траје ова пуна банана. Нисам се ни трудио да их креирам, само дан касније стигла су упозорења да је све у реду, појавиле су се резервне копије. Овај пример ми се јако допада јер се окер показао веома корисним у ситуацији о којој нисмо унапред ни размишљали, али то је сврха праћења – одупрети се непредвидивом.

За Окер сензоре користимо најјефтинији могући хостинг (где квалитет и поузданост нису важни, они се међусобно осигуравају). Дакле, недавно смо пронашли веома добар хостинг и супер јефтин, мерила су одлична. Али... понекад се испостави да су одлазне везе са виртуелне машине направљене са друге (суседне) ИП адресе. Чуда. Цлиент_ип модул са https://diagnostic.opendns.com/myip добија погрешан ИП. А из евиденције сервера индикатора јасно је да је ажурирање такође дошло са ове суседне ИП адресе. Хајде да се сада позабавимо подршком. Добро је да смо то приметили у мирнодопско време. Али, на пример, често се дешава да се приступ региструје према белој листи ИП адреса – и ако сервер понекад кратко трепће овако – можете покушавати да ухватите овај проблем веома дуго.

Па, још једна ствар – пошто говоримо о ВПС хостингу – увек користимо јефтине (хетзнер, овх, сцалеваи). Заиста ми се свиђа и у погледу мерила и стабилности. Такође користимо много скупљи Амазон ЕЦ2 за друге пројекте. Дакле, захваљујући окерр-у, имамо сопствено информисано мишљење. Обојица падају. И не бих рекао да су се током дугог периода наших посматрања јефтини хостинги попут хетзнера показали приметно мање стабилним од ЕЦ2. Стога, ако нисте везани за друге функције Амазона, зашто плаћати више? 🙂

Шта је следеће?

Ако вас у овој фази још нисам уплашио од Окера, покушајте! Можете ићи директно на ову везу окерр демо налог (Кликните сада!) Али имајте на уму да постоји само један демо налог за све, тако да ако нешто урадите, неко други на истом налогу може да вас омета у исто време. Или (боље) региструјте се преко линка до оффсите окерр - све је једноставно, без СМС-а. Ако не волите да користите своју праву е-пошту, можете користити једну за једнократну употребу, као што је маилинатор (препоручујем гетнада.цом). Такви налози могу бити избрисани током времена, али ће бити у реду за тестирање.

Након регистрације, од вас ће бити затражено да прођете обуку (извршите неколико не баш тешких задатака обуке). Почетни лимити су веома мали, али за обуку или један сервер су довољни. По завршетку обуке, границе (на пример, максималан број индикатора) ће бити повећане.

Из документације – пре свега ВИКИ на страни сервера и на клијенту (океррупдате вики). Али ако нешто није јасно, пишите подршци (на) окерр.цом или оставите карту - покушаћемо да све брзо решимо.

Ако га озбиљно користите и ови повећани лимити нису довољни, пишите подршци и ми ћемо их повећати (бесплатно).

Да ли желите да инсталирате окер сервер на свој сервер? Ево окерр-дев спремиште. Препоручујемо да инсталирате на чисту виртуелну машину, а онда то можете једноставно да урадите помоћу инсталационе скрипте. На вашој виртуелној машини - нема ограничења :-). Па, опет, ако се нешто деси, увек ћемо се трудити да помогнемо.

Желимо да овај пројекат крене, како би свет захваљујући нама постао поузданији. Захваљујући бесплатном софтверу и услугама, свет је постао пријатељскији и динамичнији се развија. Извори се могу чувати у бесплатном гитхуб-у, а за пошту можете користити бесплатни гмаил. Користимо бесплатно фресхворкс за подршку. За било шта од овога, не морате да плаћате за сервере, не морате да преузимате и конфигуришете, и не морате да решавате разне оперативне проблеме. Сваки нови пројекат, сваки тим одмах има пошту, спремишта и ЦРМ. И све ово је веома квалитетно и бесплатно и одмах. Желимо да тако буде и за праћење - мале компаније и пројекти могу бесплатно да користе окерр и чак у фази рођења и раста имају поузданост озбиљних пројеката за одрасле.

Извор: ввв.хабр.цом