Aksidentet e mëdha në qendrat e të dhënave: shkaqet dhe pasojat

Qendrat moderne të të dhënave janë të besueshme, por çdo pajisje prishet herë pas here. Në këtë artikull të shkurtër kemi mbledhur incidentet më të rëndësishme të vitit 2018.

Aksidentet e mëdha në qendrat e të dhënave: shkaqet dhe pasojat

Ndikimi i teknologjive dixhitale në ekonomi po rritet, volumi i informacionit të përpunuar po rritet, objekte të reja po ndërtohen dhe kjo është mirë për sa kohë që gjithçka funksionon. Fatkeqësisht, ndikimi ekonomik i dështimeve të qendrave të të dhënave është rritur gjithashtu që kur njerëzit filluan të strehojnë infrastrukturën e TI-së kritike për biznesin, si pasojë e pashmangshme e dixhitalizimit. Po publikojmë një përzgjedhje të vogël të aksidenteve më të dukshme që kanë ndodhur në vende të ndryshme vitin e kaluar.

SHBA

Ky vend është një lider i njohur në fushën e ndërtimit të qendrave të të dhënave. Shtetet e Bashkuara kanë numrin më të madh të qendrave të të dhënave të mëdha tregtare dhe të korporatave që shërbejnë shërbime globale, kështu që pasojat e incidenteve atje janë më të rëndësishmet. Në fillim të marsit, katër objekte të Equinix pësuan ndërprerje të energjisë për shkak të një cikloni të fuqishëm. Hapësira u përdor për pajisjet e Amazon Web Services (AWS); aksidenti çoi në mosdisponueshmërinë e shumë shërbimeve të njohura: GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio dhe mCapital One, si dhe asistentin virtual Amazon Alexa. ishin prekur.

Në shtator, anomalitë e motit goditën qendrat e të dhënave të Microsoft-it të vendosura në Teksas. Më pas, për shkak të një stuhie, sistemi i furnizimit me energji elektrike në të gjithë rajonin u ndërpre dhe në qendrën e të dhënave që kaloi në energji nga grupi i gjeneratorëve me naftë, nuk dihet pse ftohja fiket. U deshën disa ditë për të eliminuar pasojat e aksidentit dhe megjithëse, falë balancimit të ngarkesës, ky dështim nuk u bë kritik, një ngadalësim i lehtë i funksionimit të shërbimeve cloud të Microsoft u vu re nga përdoruesit në mbarë botën.

Rusi

Aksidenti më i rëndë ndodhi më 20 gusht në një nga qendrat e të dhënave të Rostelecom. Për shkak të saj, serverët e Regjistrit të Unifikuar Shtetëror të Pasurive të Paluajtshme u ndalën për 66 orë, dhe për këtë arsye ata duhej të transferoheshin në një faqe rezervë. Rosreestr ishte në gjendje të rivendoste përpunimin e aplikacioneve të marra përmes të gjitha kanaleve vetëm më 3 shtator - organizata qeveritare po përpiqet të rikuperojë një sasi të madhe nga Rostelecom për shkeljen e marrëveshjes së nivelit të shërbimit.

Më 16 shkurt, për shkak të problemeve në rrjetet e Lenenergo, sistemi rezervë i furnizimit me energji elektrike në qendrën e të dhënave të Xelnet (Shën Petersburg) u ndez. Një ndërprerje afatshkurtër e valës së sinusit çoi në ndërprerje në funksionimin e shumë shërbimeve: në veçanti, u prek ofruesi i madh i cloud 1cloud, por problemi më i dukshëm për audiencën ruse të Internetit ishte pamundësia për të hyrë në faqen e rrjeteve sociale VKontakte . Gjëja më interesante është se u deshën rreth 12 orë për të eliminuar plotësisht pasojat e një ndërprerjeje afatshkurtër të energjisë.

Bashkimi Evropian

Disa incidente të rënda janë regjistruar në BE në vitin 2018. Në mars, pati një dështim në qendrën e të dhënave të linjës ajrore KLM: furnizimi me energji u ndërpre për 10 minuta dhe fuqia e grupeve të gjeneratorëve me naftë ishte e pamjaftueshme për të funksionuar pajisjet. Disa serverë u shkatërruan dhe linja ajrore duhej të anulonte ose riplanifikonte disa dhjetëra fluturime.

Ky nuk është incidenti i vetëm që lidhet me udhëtimin ajror - tashmë në prill, ndodhi një dështim në sistemin e furnizimit me energji elektrike të qendrës së të dhënave Eurocontrol. Organizata kontrollon lëvizjen e avionëve në Bashkimin Evropian dhe ndërsa specialistët shpenzuan 5 orë për të eliminuar pasojat e aksidentit, pasagjerëve iu desh sërish të duronin vonesat dhe fluturimet e riplanifikuara.

Probleme shumë serioze lindin për shkak të aksidenteve në qendrat e të dhënave që i shërbejnë sektorit financiar. Kostoja e ndërprerjeve në transaksione këtu është zakonisht e lartë, dhe niveli i besueshmërisë së objekteve është i përshtatshëm, por kjo nuk parandalon incidentet. Më 18 prill, bursa nordike NASDAQ (Helsinki, Finlandë) nuk ishte në gjendje të tregtonte në të gjithë Evropën Veriore gjatë ditës për shkak të aktivizimit të paautorizuar të një sistemi fikjeje zjarri me gaz në qendrën tregtare të të dhënave DigiPlex, i cili papritmas u çaktivizua.

Më 7 qershor, ndërprerjet e qendrave të të dhënave detyruan Bursën e Londrës (LSE) të shtyjë fillimin e tregtimit për një orë. Përveç kësaj, në qershor, në Evropë, për shkak të një dështimi në një qendër të dhënash, shërbimet e sistemit të pagesave ndërkombëtare VISA u çaktivizuan për tërë ditën dhe detajet e incidentit nuk u zbuluan kurrë.

Japoni

Në verën e vitit 2018, një zjarr ndodhi në nivelet nëntokësore të një qendre të dhënash të Amazon në ndërtim në një periferi të Tokios, duke vrarë 5 punëtorë dhe duke plagosur të paktën 50. Zjarri dëmtoi rreth 5000 m2 të objektit. Nga hetimet rezultoi se shkaku i zjarrit ishte gabimi njerëzor: për shkak të trajtimit të pakujdesshëm të pishtarëve të acetilenit, izolimi u ndez.

Arsyet e dështimeve

Lista e mësipërme e incidenteve nuk është ende e plotë; për shkak të aksidenteve në qendrat e të dhënave, klientët e bankave dhe operatorët e telekomit vuajnë, shërbimet e ofruesve të cloud kalojnë jashtë linje, madje edhe puna e shërbimeve të urgjencës është ndërprerë. Një ndërprerje e vogël e shërbimit mund të çojë në humbje të mëdha dhe shumica e ndërprerjeve (39%) lidhen me sistemin elektrik, sipas Institutit Uptime. Në vend të dytë (24%) është faktori njeri, dhe në të tretin (15%) sistemi i ajrit të kondicionuar. Vetëm 12% e aksidenteve në qendrat e të dhënave mund t'i atribuohen fenomeneve natyrore dhe vetëm 10% e tyre ndodhin për arsye të tjera nga ato të listuara.

Pavarësisht standardeve strikte të besueshmërisë dhe sigurisë, asnjë objekt nuk është i imunizuar nga incidentet. Shumica e tyre ndodhin për shkak të ndërprerjeve të energjisë ose gabimeve njerëzore. Pronarët e qendrave të të dhënave dhe dhomave të serverëve duhet para së gjithash t'u kushtojnë vëmendje këtyre dy faktorëve dhe klientët duhet të kuptojnë: edhe drejtuesit e tregut nuk mund të garantojnë besueshmëri absolute. Nëse pajisjet ose një shërbim cloud shërben për procese kritike për biznesin, duhet të mendoni për një faqe rezervë.

Burimi i fotos: telecombloger.ru

Burimi: www.habr.com

Shto një koment