Kemalangan besar di pusat data: sebab dan akibat

Pusat data moden boleh dipercayai, tetapi sebarang peralatan rosak dari semasa ke semasa. Dalam artikel pendek ini kami telah mengumpulkan insiden paling penting pada tahun 2018.

Kemalangan besar di pusat data: sebab dan akibat

Pengaruh teknologi digital terhadap ekonomi semakin berkembang, jumlah maklumat yang diproses semakin meningkat, kemudahan baharu sedang dibina, dan ini bagus selagi semuanya berfungsi. Malangnya, kesan ekonomi kegagalan pusat data juga telah meningkat sejak orang ramai mula menganjurkan infrastruktur IT kritikal perniagaan sebagai akibat pendigitalan yang tidak dapat dielakkan. Kami sedang menerbitkan pilihan kecil kemalangan paling ketara yang berlaku di negara yang berbeza tahun lepas.

Amerika Syarikat

Negara ini adalah peneraju yang diiktiraf dalam bidang pembinaan pusat data. Amerika Syarikat mempunyai bilangan terbesar pusat data komersial dan korporat yang menyediakan perkhidmatan global, jadi akibat daripada insiden di sana adalah paling ketara. Pada awal Mac, empat kemudahan Equinix mengalami gangguan bekalan elektrik akibat taufan yang kuat. Ruang itu digunakan untuk peralatan Perkhidmatan Web Amazon (AWS); kemalangan itu menyebabkan ketiadaan banyak perkhidmatan popular: GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio dan mCapital One, serta pembantu maya Amazon Alexa, telah terjejas.

Pada bulan September, anomali cuaca melanda pusat data Microsoft yang terletak di Texas. Kemudian, disebabkan ribut petir, sistem bekalan kuasa seluruh rantau telah terganggu, dan di pusat data yang bertukar kepada kuasa daripada set penjana diesel, tidak diketahui sebabnya penyejukan dimatikan. Ia mengambil masa beberapa hari untuk menghapuskan akibat kemalangan itu, dan walaupun, terima kasih kepada pengimbangan beban, kegagalan ini tidak menjadi kritikal, sedikit kelembapan dalam operasi perkhidmatan awan Microsoft telah diperhatikan oleh pengguna di seluruh dunia.

Rusia

Kemalangan paling serius berlaku pada 20 Ogos di salah satu pusat data Rostelecom. Disebabkan itu, pelayan Daftar Harta Tanah Bersepadu berhenti selama 66 jam, dan oleh itu mereka terpaksa dipindahkan ke tapak sandaran. Rosreestr dapat memulihkan pemprosesan permohonan yang diterima melalui semua saluran hanya pada 3 September - organisasi kerajaan cuba mendapatkan semula sejumlah besar daripada Rostelecom kerana melanggar perjanjian tahap perkhidmatan.

Pada 16 Februari, disebabkan masalah dalam rangkaian Lenenergo, sistem bekalan kuasa sandaran di pusat data Xelnet (St. Petersburg) telah dihidupkan. Gangguan jangka pendek gelombang sinus menyebabkan gangguan dalam operasi banyak perkhidmatan: khususnya, penyedia awan besar 1cloud telah terjejas, tetapi masalah yang paling ketara bagi penonton Internet Rusia ialah ketidakupayaan untuk mengakses laman rangkaian sosial VKontakte . Perkara yang paling menarik ialah ia mengambil masa kira-kira 12 jam untuk menghapuskan sepenuhnya akibat kegagalan kuasa jangka pendek.

Kesatuan Eropah

Beberapa insiden serius telah direkodkan di EU pada 2018. Pada bulan Mac, terdapat kegagalan di pusat data syarikat penerbangan KLM: bekalan kuasa terputus selama 10 minit, dan kuasa set penjana diesel tidak mencukupi untuk mengendalikan peralatan. Beberapa pelayan terputus, dan syarikat penerbangan itu terpaksa membatalkan atau menjadualkan semula beberapa dozen penerbangan.

Ini bukan satu-satunya insiden yang berkaitan dengan perjalanan udara - sudah pada bulan April, kegagalan berlaku dalam sistem bekalan kuasa pusat data Eurocontrol. Organisasi itu mengawal pergerakan pesawat di Kesatuan Eropah, dan sementara pakar menghabiskan 5 jam untuk menghapuskan akibat kemalangan itu, penumpang sekali lagi terpaksa menanggung kelewatan dan penerbangan yang dijadualkan semula.

Masalah yang sangat serius timbul akibat kemalangan di pusat data yang melayani sektor kewangan. Kos gangguan dalam urus niaga di sini biasanya tinggi, dan tahap kebolehpercayaan kemudahan adalah sesuai, tetapi ini tidak menghalang insiden. Pada 18 April, bursa saham Nordic NASDAQ (Helsinki, Finland) tidak dapat berdagang di seluruh Eropah Utara pada siang hari disebabkan pengaktifan tanpa kebenaran sistem pemadam api gas di pusat data komersial DigiPlex, yang tiba-tiba dinyahtenagakan.

Pada 7 Jun, gangguan pusat data memaksa Bursa Saham London (LSE) menangguhkan permulaan dagangan selama sejam. Di samping itu, pada bulan Jun, di Eropah, disebabkan kegagalan dalam pusat data, perkhidmatan sistem pembayaran antarabangsa VISA telah dilumpuhkan sepanjang hari, dan butiran kejadian tidak pernah didedahkan.

Jepun

Pada musim panas 2018, kebakaran berlaku di aras bawah tanah pusat data Amazon yang sedang dalam pembinaan di pinggir bandar Tokyo, membunuh 5 pekerja dan mencederakan sekurang-kurangnya 50. Kebakaran itu merosakkan kira-kira 5000 m2 kemudahan itu. Siasatan menunjukkan bahawa punca kebakaran adalah kesilapan manusia: disebabkan oleh pengendalian obor asetilena yang cuai, penebat dinyalakan.

Punca kegagalan

Senarai insiden di atas masih jauh dari lengkap; disebabkan oleh kemalangan di pusat data, pelanggan bank dan pengendali telekomunikasi menderita, perkhidmatan penyedia awan pergi ke luar talian, malah kerja perkhidmatan kecemasan terganggu. Gangguan perkhidmatan yang kecil boleh menyebabkan kerugian besar, dan majoriti gangguan (39%) adalah berkaitan dengan sistem elektrik, menurut Institut Uptime. Di tempat kedua (24%) ialah faktor manusia, dan di tempat ketiga (15%) ialah sistem penghawa dingin. Hanya 12% daripada kemalangan di pusat data boleh dikaitkan dengan fenomena semula jadi, dan hanya 10% daripadanya berlaku atas sebab selain daripada yang disenaraikan.

Walaupun kebolehpercayaan dan piawaian keselamatan yang ketat, tiada kemudahan yang kebal daripada insiden. Kebanyakannya berlaku kerana kegagalan kuasa atau kesilapan manusia. Pemilik pusat data dan bilik pelayan harus terlebih dahulu memberi perhatian kepada kedua-dua faktor ini, dan pelanggan harus memahami: walaupun pemimpin pasaran tidak dapat menjamin kebolehpercayaan mutlak. Jika peralatan atau perkhidmatan awan menyediakan proses kritikal perniagaan, anda harus memikirkan tentang tapak sandaran.

Sumber foto: telecombloger.ru

Sumber: www.habr.com

Tambah komen