Priksa kesiapan produksi

Terjemahan artikel disiapake khusus kanggo siswa kursus kasebut "Praktik lan alat DevOps", sing diwiwiti dina iki!

Priksa kesiapan produksi

Apa sampeyan wis ngrilis layanan anyar menyang produksi? Utawa mungkin sampeyan melu ndhukung layanan kasebut? Yen ya, apa motivasi sampeyan? Apa sing apik kanggo produksi lan apa sing ala? Kepiye sampeyan nglatih anggota tim anyar babagan rilis utawa pangopènan layanan sing wis ana.

Umume perusahaan pungkasane nggunakake pendekatan "Wild West" nalika nerangake praktik operasi industri. Saben tim mutusake alat lan praktik paling apik dhewe liwat nyoba lan kesalahan. Nanging iki asring mengaruhi ora mung sukses proyek, nanging uga engineers.

Nyoba lan kesalahan nggawe lingkungan ing ngendi driji-pointing lan nyalahke-shifting sing umum. Kanthi prilaku iki, dadi saya angel sinau saka kesalahan lan ora mbaleni maneh.

Organisasi sing sukses:

  • nyadari kabutuhan kanggo pedoman produksi,
  • sinau praktik paling apik,
  • miwiti diskusi babagan masalah kesiapan produksi nalika ngembangake sistem utawa komponen anyar,
  • mesthekake selaras karo aturan preparation kanggo produksi.

Preparation kanggo produksi kalebu proses "review". Nyemak bisa awujud checklist utawa sakumpulan pitakonan. Review bisa rampung kanthi manual, otomatis, utawa loro-lorone. Tinimbang dhaptar syarat statis, sampeyan bisa nggawe template dhaptar sing bisa dicocogake kanggo kabutuhan tartamtu. Kanthi cara iki, insinyur bisa diwenehi cara kanggo entuk kawruh lan keluwesan sing cukup yen dibutuhake.

Nalika mriksa layanan kanggo kesiapan kanggo produksi?

Iku migunani kanggo nindakake mriksa kesiapan produksi ora mung sakcepete sadurunge release, nanging uga nalika nransfer menyang tim operasi liyane utawa karyawan anyar.

Priksa nalika:

  • Sampeyan ngeculake layanan anyar menyang produksi.
  • Sampeyan nransfer operasi layanan produksi menyang tim liyane, kayata SRE.
  • Sampeyan nransfer operasi layanan produksi menyang karyawan anyar.
  • Ngatur dhukungan teknis.

Daftar priksa kesiapan produksi

Sawetara wektu kepungkur, minangka conto, aku diterbitake dhaftar mriksa kanggo testing kesiapan kanggo produksi. Sanajan dhaptar iki asale saka pelanggan Google Cloud, nanging bakal migunani lan bisa ditrapake ing njaba Google Cloud.

Desain lan pangembangan

  • Gawe proses mbangun sing bisa diulang sing ora mbutuhake akses menyang layanan eksternal lan ora gumantung marang kegagalan sistem eksternal.
  • Sajrone periode desain lan pangembangan, nemtokake lan nyetel SLO kanggo layanan sampeyan.
  • Dokumen pangarepan kanggo kasedhiyan layanan njaba sing sampeyan gumantung.
  • Ngindhari siji titik kegagalan kanthi mbusak dependensi ing sumber daya global siji. Tiron sumber utawa gunakake mundur nalika sumber daya ora kasedhiya (contone, nilai hard-coded).

Manajemen konfigurasi

  • Konfigurasi statis, cilik, lan ora rahasia bisa dilewati liwat paramΓ¨ter baris perintah. Kanggo kabeh liyane, gunakake layanan panyimpenan konfigurasi.
  • Konfigurasi dinamis kudu duwe setelan mundur yen layanan konfigurasi ora kasedhiya.
  • Konfigurasi lingkungan pangembangan kudu ora ana gandhengane karo konfigurasi produksi. Yen ora, iki bisa nyebabake akses saka lingkungan pangembangan menyang layanan produksi, sing bisa nyebabake masalah privasi lan kebocoran data.
  • Dokumentasi apa sing bisa dikonfigurasi kanthi dinamis lan jelasake prilaku mundur yen sistem pangiriman konfigurasi ora kasedhiya.

Manajemen release

  • Dokumentasi proses rilis kanthi rinci. NjlΓ¨ntrΓ¨hakΓ© cara rilis mengaruhi SLOs (contone, mundhak sauntara latensi amarga cache luput).
  • Dokumen rilis kenari.
  • Ngembangake rencana review release kenari lan, yen bisa, mekanisme rollback otomatis.
  • Priksa manawa rollback bisa nggunakake proses sing padha karo penyebaran.

Observability

  • Priksa manawa set metrik sing dibutuhake kanggo SLO diklumpukake.
  • Priksa manawa sampeyan bisa mbedakake antarane data klien lan server. Iki penting kanggo nemokake sabab saka malfunctions.
  • Nggawe tandha kanggo nyuda biaya tenaga kerja. Contone, mbusak tandha sing disebabake operasi rutin.
  • Yen sampeyan nggunakake Stackdriver, banjur lebokake metrik platform GCP ing dashboard sampeyan. Setel tandha kanggo dependensi GCP.
  • Tansah propagate ngambah mlebu. Sanajan sampeyan ora melu nglacak, iki bakal ngidini layanan tingkat ngisor kanggo debug masalah ing produksi.

Proteksi lan safety

  • Priksa manawa kabeh sambungan eksternal dienkripsi.
  • Priksa manawa proyek produksi sampeyan duwe persiyapan IAM sing bener.
  • Gunakake jaringan kanggo ngisolasi klompok mesin virtual.
  • Gunakake VPN kanggo nyambungake menyang jaringan remot kanthi aman.
  • Dokumen lan ngawasi akses pangguna menyang data. Priksa manawa kabeh akses pangguna menyang data wis diaudit lan mlebu log.
  • Priksa manawa titik pungkasan debugging diwatesi dening ACL.
  • Sanitize input pangguna. Ngatur watesan ukuran muatan kanggo input pangguna.
  • Priksa manawa layanan sampeyan bisa selektif mblokir lalu lintas mlebu kanggo pangguna individu. Iki bakal ngalangi pelanggaran tanpa mengaruhi pangguna liyane.
  • Ngindhari titik pungkasan eksternal sing miwiti akeh operasi internal.

Perencanaan kapasitas

  • Dokumen carane skala layanan sampeyan. Contone: jumlah pangguna, ukuran muatan sing mlebu, jumlah pesen sing mlebu.
  • Dokumentasi syarat sumber daya kanggo layanan sampeyan. Contone: nomer mesin virtual khusus, nomer Spanner, hardware khusus kayata GPU utawa TPU.
  • Watesan sumber daya dokumen: jinis sumber daya, wilayah, lsp.
  • Dokumen watesan kuota kanggo nggawe sumber daya anyar. Contone, matesi jumlah panjalukan GCE API yen sampeyan nggunakake API kanggo nggawe kedadean anyar.
  • Coba tes beban kanggo nganalisa degradasi kinerja.

Mekaten. Sampai jumpa di kelas!

Source: www.habr.com

Add a comment