Lista di cuntrollu di a preparazione di a produzzione

A traduzzione di l'articulu hè stata preparata apposta per i studienti di u corsu "Pratiche è strumenti DevOps", chì principia oghje !

Lista di cuntrollu di a preparazione di a produzzione

Avete mai liberatu un novu serviziu in pruduzzione? O forse avete participatu à sustene tali servizii? Sì sì, chì vi hà motivatu? Ciò chì hè bonu per a produzzione è chì hè male? Cumu furmà novi membri di a squadra nantu à e versioni o mantenimentu di servizii esistenti.

A maiò parte di l'imprese finiscinu per aduttà approcci "Wild West" quandu si tratta di pratiche di operazione industriale. Ogni squadra decide nantu à e so propiu arnesi è e migliori pratiche per prucessu è errore. Ma questu spessu affetta micca solu u successu di i prughjetti, ma ancu l'ingegneri.

A prova è l'errore creanu un ambiente induve l'indicazione di u dito è u cambiamentu di culpa sò cumuni. Cù stu cumpurtamentu, diventa sempre più difficiuli d'amparà da i sbagli è micca ripetiri.

Organizzazioni di successu:

  • capisce a necessità di linee guida per a produzzione,
  • studià e migliori pratiche,
  • inizià discussioni nantu à prublemi di prontezza di produzzione quandu si sviluppanu novi sistemi o cumpunenti,
  • assicurà u rispettu di e regule di preparazione per a produzzione.

A preparazione per a produzzione include un prucessu di "revisione". A rivista pò esse in forma di una lista di verificazione o una serie di dumande. Reviews pò esse fattu manually, automaticamente, o tramindui. Invece di liste statiche di esigenze, pudete fà mudelli di lista di cuntrollu chì ponu esse adattati à bisogni specifichi. In questu modu, l'ingegneri ponu esse datu un modu per eredite a cunniscenza è abbastanza flessibilità quandu hè necessariu.

Quandu verificate un serviziu per a preparazione per a produzzione?

Hè utile per fà un cuntrollu di prontezza di a produzzione micca solu immediatamente prima di liberazione, ma ancu quandu si trasfiriu à un altru squadra di operazioni o un novu impiigatu.

Verificate quandu:

  • Avete liberatu un novu serviziu in pruduzzione.
  • Trasferite u funziunamentu di u serviziu di produzzione à un altru squadra, cum'è SRE.
  • Trasferite u funziunamentu di u serviziu di produzzione à novi impiegati.
  • Organizà u sustegnu tecnicu.

Lista di cuntrollu di a preparazione di a produzzione

Qualchì tempu fà, per esempiu, I publicatu Lista di cuntrollu per pruvà a preparazione per a produzzione. Ancu s'è sta lista hè urigginata cù i clienti di Google Cloud, serà utile è applicabile fora di Google Cloud.

Disegnu è sviluppu

  • Sviluppà un prucessu di custruzzione ripetibile chì ùn deve micca accessu à i servizii esterni è ùn hè micca dipendente da u fallimentu di i sistemi esterni.
  • Durante u periodu di cuncepimentu è sviluppu, definisce è stabilisce SLO per i vostri servizii.
  • Attese di documenti per a dispunibilità di servizii esterni da quale dipende.
  • Evite un puntu unicu di fallimentu eliminendu dipendenze nantu à una sola risorsa glubale. Replicate a risorsa o utilizate un fallback quandu a risorsa ùn hè micca dispunibile (per esempiu, un valore codificatu).

Gestione di a cunfigurazione

  • A cunfigurazione statica, chjuca è micca sicreta pò esse passata via paràmetri di linea di cummanda. Per tuttu u restu, utilizate servizii di almacenamiento di cunfigurazione.
  • Una cunfigurazione dinamica deve avè paràmetri di fallback in casu chì u serviziu di cunfigurazione ùn hè micca dispunibule.
  • A cunfigurazione di l'ambiente di sviluppu ùn deve esse ligata à a cunfigurazione di produzzione. Altrimenti, questu pò purtà à l'accessu da l'ambiente di sviluppu à i servizii di produzzione, chì ponu causà prublemi di privacy è fuga di dati.
  • Documentate ciò chì pò esse cunfiguratu dinamicamente è descrive u cumportamentu di fallback se u sistema di consegna di cunfigurazione ùn hè micca dispunibule.

Gestione di liberazione

  • Documentate u prucessu di liberazione in dettaglio. Descrivite cumu e versioni affettanu SLO (per esempiu, aumenti temporanei di latenza per via di cache miss).
  • Documenti di liberazione di canari.
  • Sviluppà un pianu di rivisione di liberazione canaria è, se pussibule, meccanismi di rollback automaticu.
  • Assicuratevi chì i rollbacks ponu utilizà i stessi prucessi cum'è implementazioni.

Osservabilità

  • Assicuratevi chì l'inseme di metriche necessarii per u SLO hè recullatu.
  • Assicuratevi di pudè diferenze trà e dati di u cliente è di u servitore. Questu hè impurtante per truvà e cause di malfunctions.
  • Configurate alerti per riduce i costi di u travagliu. Per esempiu, sguassate alerti causati da operazioni di rutina.
  • Sè aduprate Stackdriver, allora include metrica di a piattaforma GCP in i vostri dashboards. Configurate alerti per e dipendenze di GCP.
  • Sempre propagate tracce in entrata. Ancu s'è ùn site micca implicatu in traccia, questu permetterà servizii di livellu più bassu per debug issues in a produzzione.

Prutezzione è sicurità

  • Assicuratevi chì tutte e cunnessione esterne sò criptate.
  • Assicuratevi chì i vostri prughjetti di produzzione anu a cunfigurazione IAM curretta.
  • Aduprate e rete per isolà gruppi di istanze di macchina virtuale.
  • Aduprate una VPN per cunnette in modu sicuru à e rete remote.
  • Documentate è monitorate l'accessu di l'utilizatori à e dati. Assicuratevi chì tutti l'accessu di l'utilizatori à e dati sò verificati è registrati.
  • Assicuratevi chì i punti finali di debugging sò limitati da ACL.
  • Sanitize input di l'utilizatori. Configurate i limiti di dimensione di carichi utili per l'input di l'utilizatori.
  • Assicuratevi chì u vostru serviziu pò bluccà selettivamente u trafficu entrante per l'utilizatori individuali. Questu hà da bluccà e violazioni senza affettà altri utilizatori.
  • Evite endpoint esterni chì inizianu assai operazioni internu.

Pianificazione di capacità

  • Documentate cumu scala u vostru serviziu. Per esempiu: u numeru di utilizatori, a dimensione di a carica pagata, u numeru di missaghji ricevuti.
  • Documentate i bisogni di risorse per u vostru serviziu. Per esempiu: numeru di istanze di macchina virtuale dedicata, numeru di istanze di Spanner, hardware specializatu cum'è GPU o TPU.
  • Limitazioni di risorse di documentu: tipu di risorsa, regione, etc.
  • Restrizioni di quota di documenti per creà novi risorse. Per esempiu, limità u nùmeru di dumande API GCE se utilizate l'API per creà novi istanze.
  • Cunsiderate l'esecuzione di teste di carica per analizà a degradazione di u rendiment.

Eccu tuttu. Ci si vede in classe !

Source: www.habr.com

Add a comment