SRE online intensif: kami akan menghancurkan semuanya, lalu kami akan memperbaikinya, kami akan memecahkannya beberapa kali lagi, dan kemudian kami akan membangunnya lagi

Mari kita hancurkan sesuatu, ya? Kalau tidak, kita membangun dan membangun, memperbaiki dan memperbaiki. Kebosanan yang mematikan.

Mari kita hancurkan agar tidak terjadi apa-apa pada kita - kita tidak hanya akan dipuji karena aib ini. Dan kemudian kami akan membangun semuanya lagi - sedemikian rupa sehingga menjadi lebih baik, lebih toleran terhadap kesalahan, dan lebih cepat.

Dan kita akan memecahkannya lagi.

Apakah menurut Anda ini adalah kompetisi untuk menggunakan instrumen paling rahasia dari seluruh kosmonotika kita - Palu Luar Angkasa Besar Rusia?

Tidak, ini adalah SRE intensif online. Kebetulan setiap kursus Slurm SRE tidak pernah dan tidak pernah seperti sebelumnya. Hanya karena Anda tidak pernah menebak bahwa dalam sistem yang sangat kompleks, yang terhubung dengan ribuan pengguna setiap detik, dan audiensnya sendiri berjumlah beberapa juta, sistem tersebut dapat jatuh, rusak, menjadi kusam, bermasalah, dan dalam ratusan cara lainnya merusak. suasana peralihan tugas para insinyur SRE.

Pada bulan Desember kami akan mengadakan yang lain SRE intensif.

SRE online intensif: kami akan menghancurkan semuanya, lalu kami akan memperbaikinya, kami akan memecahkannya beberapa kali lagi, dan kemudian kami akan membangunnya lagi

Mari kita melakukan sedikit retrospeksi. Ingat bagaimana beberapa tahun yang lalu HR berlomba untuk melihat siapa yang dapat mempekerjakan sebagian besar insinyur DevOps ke dalam perusahaan mereka. Hadiahnya telah berubah. Sekarang, seperti sistem pelacakan Pantsir-S1, mereka memeriksa ruang di sekitarnya dan mencari insinyur SRE. Saya berbicara di artikel β€œEvgeniy Varavva, pengembang di Google. Bagaimana mendeskripsikan Google dalam 5 kataβ€œSeperti apa kehidupan seorang insinyur SRE di Google, dan bagaimana perusahaan semacam itu pun mengalami kekurangan spesialis SRE.

Pada intensif online Slurm SRE pada bulan Desember, dalam tiga hari, mulai pukul 10:00 hingga 19:00, Anda akan belajar bagaimana memastikan kecepatan, toleransi kesalahan dan ketersediaan situs web dalam kondisi sumber daya terbatas, menghilangkan insiden TI dan melakukan pembekalan agar masalah tidak terulang kembali.

Pembicara kursus:

Ivan Kruglov. Staf Insinyur Perangkat Lunak di Databricks. Memiliki pengalaman di perusahaan enterprise dalam pengiriman dan pemrosesan pesan terdistribusi, BigData dan web-stack, pencarian, membangun cloud internal, mesh layanan.

Pavel Selivanov. Insinyur DevOps Senior di Mail.ru Cloud Solutions. Saya memiliki lusinan infrastruktur yang dibangun dan ratusan pipeline CI/CD tertulis. Administrator Kubernetes Bersertifikat. Penulis beberapa kursus tentang Kubernetes dan DevOps. Pembicara reguler di konferensi TI Rusia dan internasional.

Semuanya akan sulit, tidak dapat diprediksi, dan dalam praktiknya. Anda akan membangun, menghancurkan, dan memperbaiki - dan terkadang dalam urutan yang sangat berbeda.

Membangun: Anda harus merumuskan indikator SLO, SLI, SLA untuk situs yang terdiri dari beberapa layanan mikro; mengembangkan arsitektur dan infrastruktur yang mendukungnya; merakit, menguji, dan menyebarkan situs; mengatur pemantauan dan peringatan.

Merusak: Anda akan mempertimbangkan faktor internal dan eksternal yang memperburuk SLO: kesalahan pengembang, kegagalan infrastruktur, masuknya pengunjung, serangan DoS. Belajar memahami ketahanan, anggaran kesalahan, praktik pengujian, manajemen interupsi, dan beban kerja operasional.

Memperbaiki: Anda akan dilatih untuk mengatur kerja tim dengan cepat dan efektif untuk menghilangkan kecelakaan dalam waktu sesingkat mungkin: melibatkan rekan kerja, memberi tahu pemangku kepentingan, dan menetapkan prioritas.

Belajar: Anda akan dapat menganalisis pendekatan situs dari sudut pandang SRE. Analisis insiden. Tentukan cara untuk menghindarinya di masa depan: meningkatkan pemantauan, mengubah arsitektur, pendekatan terhadap pengembangan dan pengoperasian, serta peraturan. Mengotomatiskan proses.

SRE Intensif Online mensimulasikan kondisi nyata - waktu untuk memulihkan layanan akan sangat terbatas. Sama seperti dalam kehidupan nyata, seperti dalam situasi kerja nyata.

Ketentuan kursus SRE, serta mempelajari program selengkapnya dapat Anda ketahui di link.

Intensif daring direncanakan pada Desember 2020. Bagi yang membayar keikutsertaannya terlebih dahulu, kami telah menyiapkan diskon.

Apakah Anda siap untuk pelatihan intensif, tugas non-standar, dan kecelakaan mendadak?

Itu tidak akan terjadi. Akan ada pertumbuhan profesional.

Sumber: www.habr.com

Tambah komentar