Контролна листа спремности производње

Превод чланка је припремљен посебно за студенте курса „ДевОпс праксе и алати“, који почиње данас!

Контролна листа спремности производње

Да ли сте икада пустили нову услугу у производњу? Или сте можда били укључени у подршку таквим услугама? Ако јесте, шта вас је мотивисало? Шта је добро за производњу, а шта лоше? Како обучавате нове чланове тима о издањима или одржавању постојећих услуга.

Већина компанија на крају усваја приступе „Дивљег запада“ када су у питању индустријске операције. Сваки тим одлучује о сопственим алатима и најбољим праксама путем покушаја и грешака. Али то често утиче не само на успех пројеката, већ и на инжењере.

Проба и грешка стварају окружење у којем су упирање прстом и пребацивање кривице уобичајени. Оваквим понашањем постаје све теже учити из грешака и не поновити их.

Успешне организације:

  • схватити потребу за смерницама за производњу,
  • проучавати најбоље праксе,
  • започети дискусије о питањима спремности производње приликом развоја нових система или компоненти,
  • обезбеди поштовање правила припреме за производњу.

Припрема за производњу укључује процес „прегледа“. Преглед може бити у облику контролне листе или скупа питања. Прегледи се могу вршити ручно, аутоматски или обоје. Уместо статичних листа захтева, можете направити шаблоне контролне листе који се могу прилагодити специфичним потребама. На овај начин, инжењерима се може дати начин да наследе знање и довољно флексибилности када је то потребно.

Када проверити спремност сервиса за производњу?

Корисно је извршити проверу спремности производње не само непосредно пре пуштања у рад, већ и приликом преношења на други оперативни тим или новог запосленог.

Проверите када:

  • Пуштате у производњу нову услугу.
  • Пребацујете рад производне услуге на други тим, као што је СРЕ.
  • Операцију производне службе преносите на нове запослене.
  • Организујте техничку подршку.

Контролна листа спремности производње

Пре неког времена, као пример, И опубликовала контролна листа за испитивање спремности за производњу. Иако је ова листа настала од купаца Гоогле Цлоуд-а, биће корисна и применљива ван Гоогле Цлоуд-а.

Дизајн и развој

  • Развијте поновљив процес изградње који не захтева приступ спољним услугама и не зависи од квара спољних система.
  • Током периода дизајна и развоја, дефинишите и поставите СЛО за своје услуге.
  • Документујте очекивања о доступности спољних услуга од којих зависите.
  • Избегните једну тачку неуспеха уклањањем зависности од једног глобалног ресурса. Реплицирајте ресурс или користите резервни када је ресурс недоступан (на пример, чврсто кодирана вредност).

Управљање конфигурацијом

  • Статичка, мала и нетајна конфигурација се може пренети преко параметара командне линије. За све остало користите услуге складиштења конфигурације.
  • Динамичка конфигурација мора имати резервна подешавања у случају да услуга конфигурације није доступна.
  • Конфигурација развојног окружења не би требало да буде повезана са конфигурацијом производње. У супротном, ово може довести до приступа из развојног окружења продукцијским услугама, што може изазвати проблеме са приватношћу и цурење података.
  • Документујте шта се може динамички конфигурисати и опишите резервно понашање ако систем испоруке конфигурације није доступан.

Управљање издањима

  • Детаљно документујте процес издавања. Опишите како издања утичу на СЛО (на пример, привремена повећања латенције због промашаја кеша).
  • Документујте издања канаринца.
  • Развијте план анализе ослобађања канаринца и, ако је могуће, механизме аутоматског враћања.
  • Уверите се да враћање може да користи исте процесе као и имплементације.

Опсервабилити

  • Уверите се да је скуп метрика потребних за СЛО прикупљен.
  • Уверите се да можете да разликујете податке о клијенту и серверу. Ово је важно за проналажење узрока кварова.
  • Подесите упозорења да бисте смањили трошкове рада. На пример, уклоните упозорења изазвана рутинским операцијама.
  • Ако користите Стацкдривер, укључите метрику ГЦП платформе у своје контролне табле. Подесите упозорења за ГЦП зависности.
  • Увек пропагирајте долазне трагове. Чак и ако нисте укључени у праћење, ово ће омогућити услугама нижег нивоа да отклоне проблеме у производњи.

Заштита и сигурност

  • Уверите се да су све спољне везе шифроване.
  • Уверите се да ваши производни пројекти имају исправну ИАМ подешавање.
  • Користите мреже да изолујете групе инстанци виртуелне машине.
  • Користите ВПН за безбедно повезивање са удаљеним мрежама.
  • Документујте и надгледајте приступ корисника подацима. Уверите се да је сав кориснички приступ подацима ревидиран и евидентиран.
  • Уверите се да су крајње тачке за отклањање грешака ограничене АЦЛ-овима.
  • Дезинфикујте унос корисника. Конфигуришите ограничења величине корисног оптерећења за кориснички унос.
  • Уверите се да ваша услуга може селективно да блокира долазни саобраћај за појединачне кориснике. Ово ће блокирати кршења без утицаја на друге кориснике.
  • Избегавајте спољне крајње тачке које покрећу много интерних операција.

Планирање капацитета

  • Документујте како се ваша услуга повећава. На пример: број корисника, величина долазног терета, број долазних порука.
  • Документујте захтеве за ресурсима за вашу услугу. На пример: број наменских инстанци виртуелне машине, број Спаннер инстанци, специјализовани хардвер као што је ГПУ или ТПУ.
  • Ограничења ресурса документа: тип ресурса, регион итд.
  • Ограничења квоте документа за креирање нових ресурса. На пример, ограничавање броја ГЦЕ АПИ захтева ако користите АПИ за креирање нових инстанци.
  • Размислите о покретању тестова оптерећења да бисте анализирали деградацију перформанси.

То је све. Видимо се у класи!

Извор: ввв.хабр.цом

Додај коментар