Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Topik kacilakaan utama di puseur data modern raises patarosan nu teu diwaler dina artikel munggaran - urang mutuskeun pikeun ngembangkeun éta.

Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Numutkeun statistik ti Uptime Institute, seuseueurna kajadian di pusat data aya hubunganana sareng gagalna sistem catu daya - aranjeunna nyababkeun 39% tina kajadian. Éta dituturkeun ku faktor manusa, anu nyababkeun 24% tina kacilakaan. Alesan katilu pangpentingna (15%) nyaéta gagalna sistem AC, sareng di tempat kaopat (12%) mangrupikeun bencana alam. The total babagi tina troubles séjén ngan 10%. Tanpa naroskeun data organisasi anu terhormat, urang bakal nyorot hal anu umum dina kacilakaan anu béda sareng nyobian ngartos naha éta tiasa dihindari. Spoiler: mungkin dina kalolobaan kasus.

Élmu Kontak

Sacara basajan, ngan aya dua masalah sareng catu daya: boh henteu aya kontak dimana kedahna, atanapi aya kontak anu henteu kedah aya kontak. Anjeun tiasa ngobrol lila ngeunaan reliabiliti sistem catu daya uninterruptible modern, tapi maranéhna teu salawasna nyalametkeun anjeun. Candak kasus profil luhur pusat data anu dianggo ku British Airways, anu dipiboga ku perusahaan induk International Airlines Group. Aya dua sipat sapertos anu lokasina caket Bandara Heathrow - Boadicea House sareng Comet House. Anu mimiti, dina 27 Mei 2017, pareum listrik teu kahaja, anu nyababkeun kaleuleuwihan sareng kagagalan sistem UPS. Hasilna, sababaraha alat IT ruksak sacara fisik, sareng musibah panganyarna nyandak tilu dinten kanggo ngabéréskeun.

Maskapai penerbangan kedah ngabatalkeun atanapi ngajadwalkeun deui langkung ti sarébu penerbangan, sakitar 75 rébu panumpang henteu tiasa ngapung dina waktosna - $ 128 juta diséépkeun pikeun mayar kompensasi, henteu kaétang biaya anu diperyogikeun pikeun mulangkeun pungsionalitas pusat data. Sajarah alesan pikeun blackout teu jelas. Upami anjeun yakin kana hasil panyilidikan internal anu diumumkeun ku CEO International Airlines Group Willie Walsh, éta kusabab kasalahan ku insinyur. Nanging, sistem catu daya anu teu tiasa diganggu kedah tahan pareum sapertos kitu - naha éta dipasang. Puseur data diurus ku spesialis ti parusahaan outsourcing CBRE Managed Services, jadi British Airways diusahakeun cageur jumlah karuksakan ngaliwatan pangadilan London.

Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Pareum listrik lumangsung dina skenario anu sami: mimiti aya pemadaman kusabab lepat tina supplier listrik, sakapeung kusabab cuaca goréng atanapi masalah internal (kalebet kasalahan manusa), teras sistem catu daya anu teu tiasa diganggu teu tiasa ngatasi beban atanapi pondok. -istilah gangguan gelombang sinus ngabalukarkeun gagalna loba jasa, ngabalukarkeun restorasi nu butuh loba waktu jeung duit. Naha mungkin pikeun nyingkahan kacilakaan sapertos kitu? Teu diragukeun. Upami anjeun mendesain sistem kalayan leres, bahkan panyipta pusat data ageung henteu kebal tina kasalahan.

Faktor manusa

Nalika panyabab langsung kajadian nyaéta lampah salah sahiji personel pusat data, masalah anu paling sering (tapi henteu salawasna) mangaruhan bagian parangkat lunak infrastruktur IT. Kacilakaan sapertos kitu lumangsung bahkan di korporasi ageung. Dina bulan Pebruari 2017, kusabab anggota tim anu direkrut salah tina grup operasi téknis salah sahiji pusat data, bagian tina server Layanan Web Amazon ditumpurkeun. Kasalahan lumangsung nalika nga-debug prosés tagihan pikeun palanggan panyimpen awan Amazon Simple Storage Service (S3). Hiji pagawe nyoba mupus sababaraha server maya dipaké ku sistem tagihan, tapi pencét klaster gedé.

Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Salaku hasil tina kasalahan insinyur, server ngajalankeun modul software gudang awan Amazon penting dihapus. Anu mimiti kapangaruhan nyaéta subsistem indéks, anu ngandung émbaran ngeunaan metadata sareng lokasi sadaya objék S3 di daérah Amérika AS-EAST-1. Kajadian éta ogé mangaruhan subsistem anu dianggo pikeun nga-host data sareng ngatur rohangan anu sayogi pikeun neundeun. Saatos ngahapus mesin virtual, dua subsistem ieu peryogi balikan deui lengkep, teras insinyur Amazon kaget - kanggo waktos anu lami, panyimpen awan umum henteu tiasa ngalayanan pamundut palanggan.

Dampakna nyebar, sabab seueur sumber daya ageung nganggo Amazon S3. The outages kapangaruhan Trello, Coursera, IFTTT na, paling unpleasantly, jasa tina mitra Amazon utama tina daptar S & P 500. Karuksakan dina kasus sapertos hese ngitung, tapi éta di wewengkon ratusan juta dollar AS. Sakumaha anjeun tiasa tingali, hiji paréntah salah cukup pikeun nganonaktipkeun layanan tina platform awan pangbadagna. Ieu sanés kasus anu terpencil; dina 16 Mei 2019, nalika damel pangropéa, jasa Yandex.Cloud dipupus mesin virtual pamaké dina zona ru-central1-c anu aya dina status TANGGUH sahenteuna sakali. Data klien parantos dirusak di dieu, sababaraha di antarana leungit teu tiasa pulih. Tangtosna, jalma-jalma henteu sampurna, tapi sistem kaamanan inpormasi modéren parantos lami tiasa ngawas tindakan pangguna anu ngagaduhan hak istimewa sateuacan ngalaksanakeun paréntah anu aranjeunna lebetkeun. Upami solusi sapertos kitu dilaksanakeun dina Yandex atanapi Amazon, kajadian sapertos kitu tiasa dihindari.

Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Cooling beku

Dina Januari 2017, kacilakaan utama lumangsung di puseur data Dmitrov pausahaan Megafon. Lajeng hawa di wewengkon Moscow turun ka -35 °C, nu ngakibatkeun gagalna sistem cooling fasilitas urang. Ladenan pers operator henteu khususna nyarioskeun alesan pikeun kajadian éta - perusahaan Rusia horéam pisan pikeun nyarioskeun kacilakaan di fasilitas anu dipiboga; dina hal publisitas, urang jauh ti Kulon. Aya versi beredar dina jaringan sosial ngeunaan katirisan coolant dina pipa diteundeun sapanjang jalan jeung leakage of étiléna glikol. Nurutkeun manéhna, layanan operasi éta teu bisa gancang ménta 30 ton coolant alatan libur panjang tur kaluar ngagunakeun sarana improvised, pangatur improvised cooling bébas dina palanggaran aturan pikeun operasi sistem. Tiis parah parah masalah - dina Januari, usum tiris dumadakan pencét Rusia, sanaos teu aya anu ngarepkeunana. Hasilna, staf kapaksa mareuman kakuatan ka bagian tina rak server, naha sababaraha layanan operator teu sadia pikeun dua poé.

Anu ngabalukarkeun utama kacilakaan di puseur data nyaéta gasket antara komputer jeung korsi

Panginten, urang tiasa nyarioskeun ngeunaan anomali cuaca di dieu, tapi frosts sapertos kitu sanés hal anu biasa pikeun daérah ibukota. Suhu dina usum tiris di daérah Moskow tiasa turun ka tingkat anu langkung handap, janten pusat data diwangun kalayan harepan operasi stabil dina −42°C. Paling sering, sistem cooling gagal dina cuaca tiis alatan konsentrasi insufficiently luhur glikol jeung kaleuwihan cai dina leyuran coolant. Aya ogé masalah sareng pamasangan pipa atanapi sareng salah perhitungan dina rarancang sareng uji sistem, utamina dikaitkeun sareng kahayang pikeun ngahémat artos. Hasilna, kacilakaan serius lumangsung kaluar tina biru, nu bisa geus dicegah.

Musibah alam

Paling sering, guludug jeung/atawa badai ngaganggu infrastruktur rékayasa hiji puseur data, ngabalukarkeun interruptions layanan jeung/atawa ruksakna fisik alat. Kajadian anu disababkeun ku cuaca goréng lumangsung rada sering. Dina 2012, Hurricane Sandy nyapu peuntas Basisir Kulon Amérika Serikat kalayan curah hujan badag. Tempatna di gedong luhur di Lower Manhattan, pusat data Peer 1 leungit catu daya éksternal, sanggeus cai laut asin banjir basements. Generators darurat fasilitas ieu lokasina di lantai 18, sarta suplai suluh maranéhanana diwatesan - aturan diwanohkeun di New York sanggeus 9/11 serangan teroris nyaram nyimpen jumlah badag suluh di lanté luhur.

Pompa bahan bakar ogé gagal, ku kituna staf nyéépkeun sababaraha dinten pikeun ngangkut solar ka generator ku leungeun. Kepahlawanan tim nyalametkeun pusat data tina kacilakaan anu parah, tapi naha éta leres-leres diperyogikeun? Urang hirup di planét nu atmosfir nitrogén-oksigén jeung loba cai. Badai petir sareng angin topan umum di dieu (utamana di daérah basisir). Désainer sigana bakal hadé mertimbangkeun résiko sareng ngawangun sistem catu daya anu teu tiasa diganggu. Atanapi sahenteuna milih lokasi anu langkung cocog pikeun pusat data tibatan tempat anu luhur di hiji pulo.

Sagalana sejenna

Uptime Institute ngidentipikasi rupa-rupa kajadian dina kategori ieu, diantarana sesah milih anu biasa. Maling kabel tambaga, mobil nabrak pusat data, kabel listrik sareng gardu trafo, kahuruan, operator excavator ngarusak optik, rodénsia (beurit, kelenci sareng bahkan wombat, anu saleresna marsupial), ogé jalma anu resep latihan shooting. kawat - menu nu geus éksténsif. Gagalna listrik malah tiasa nyababkeun maok listrik perkebunan ganja ilegal. Dina kalolobaan kasus, jalma husus jadi culprits tina kajadian, ie urang deui kaayaan faktor manusa, nalika masalah boga ngaran jeung surname. Malah lamun dina glance kahiji kacilakaan pakait sareng gangguan teknis atanapi bencana alam, éta bisa dihindari lamun fasilitas ieu dirancang leres tur dioperasikeun leres. Hiji-hijina pangecualian nyaéta kasus karusakan kritis kana infrastruktur pusat data atanapi karusakan gedong sareng struktur kusabab bencana alam. Ieu sabenerna kaayaan force majeure, sarta sakabeh masalah sejenna disababkeun ku gasket antara komputer jeung korsi - sugan ieu téh bagian paling teu bisa dipercaya tina sagala sistem kompléks.

sumber: www.habr.com

Tambahkeun komentar