Lieli negadījumi datu centros: cēloņi un sekas

Mūsdienu datu centri ir uzticami, taču jebkura iekārta laiku pa laikam sabojājas. Šajā īsajā rakstā esam apkopojuši nozīmīgākos 2018. gada incidentus.

Lieli negadījumi datu centros: cēloņi un sekas

Pieaug digitālo tehnoloģiju ietekme uz ekonomiku, pieaug apstrādātās informācijas apjoms, tiek būvēti jauni objekti, un tas ir labi, kamēr viss darbojas. Diemžēl datu centru kļūmju ekonomiskā ietekme ir pieaugusi arī kopš brīža, kad cilvēki sāka mitināt biznesam kritisko IT infrastruktūru kā neizbēgamas digitalizācijas sekas. Publicējam nelielu izlasi no ievērojamākajiem negadījumiem, kas pagājušajā gadā notikuši dažādās valstīs.

ASV

Šī valsts ir atzīta līdere datu centru būvniecības jomā. Amerikas Savienotajās Valstīs ir vislielākais lielu komerciālo un korporatīvo datu centru skaits, kas apkalpo globālos pakalpojumus, tāpēc tur notikušo incidentu sekas ir visnozīmīgākās. Marta sākumā četrās Equinix objektos spēcīga ciklona dēļ tika pārtraukta elektroenerģijas padeve. Vieta tika izmantota Amazon Web Services (AWS) aprīkojumam; negadījuma rezultātā kļuva nepieejami daudzi populāri pakalpojumi: GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio un mCapital One, kā arī Amazon Alexa virtuālais palīgs, tika ietekmēti.

Septembrī laikapstākļu anomālijas skāra Microsoft datu centrus, kas atrodas Teksasā, tad pērkona negaisa dēļ tika traucēta visa reģiona elektroapgādes sistēma, un datu centrā, kas pārgāja uz strāvu no dīzeļa ģeneratora bloka, nav zināms, kāpēc dzesēšana tika izslēgta. Avārijas seku likvidēšana prasīja vairākas dienas, un, lai gan, pateicoties slodzes balansēšanai, šī kļūme nekļuva kritiska, nelielu Microsoft mākoņpakalpojumu darbības palēnināšanos pamanīja lietotāji visā pasaulē.

Krievija

Smagākā avārija notika 20. augustā vienā no Rostelecom datu centriem. Tā dēļ uz 66 stundām apstājās Vienotā valsts nekustamo īpašumu reģistra serveri, un tāpēc tie bija jāpārnes uz rezerves vietni. Rosreestr pa visiem kanāliem saņemto pieteikumu apstrādi izdevās atjaunot tikai 3.septembrī - valdības organizācija cenšas no Rostelecom piedzīt lielu summu par pakalpojumu līmeņa līguma pārkāpšanu.

16.februārī "Lenenergo" tīklu problēmu dēļ Xelnet (Sanktpēterburga) datu centrā tika ieslēgta rezerves barošanas sistēma. Īslaicīgs sinusoidālā viļņa pārtraukums izraisīja traucējumus daudzu pakalpojumu darbībā: jo īpaši tika ietekmēts lielais mākoņpakalpojumu sniedzējs 1cloud, bet Krievijas interneta auditorijas pamanāmākā problēma bija nespēja piekļūt sociālā tīkla vietnei VKontakte. . Interesantākais ir tas, ka, lai pilnībā likvidētu īslaicīgas strāvas padeves pārtraukuma sekas, bija nepieciešamas aptuveni 12 stundas.

Eiropas Savienība

2018. gadā ES tika reģistrēti vairāki nopietni incidenti. Martā aviokompānijas KLM datu centrā notikusi kļūme: uz 10 minūtēm tika atslēgta elektrības padeve, un iekārtu darbināšanai nepietika dīzeļģeneratoru agregātu jaudas. Daži serveri nedarbojās, un aviokompānijai bija jāatceļ vai jāpārplāno vairāki desmiti lidojumu.

Šis nav vienīgais incidents, kas saistīts ar gaisa satiksmi - jau aprīlī atteice notika Eirokontroles datu centra elektroapgādes sistēmā. Organizācija kontrolē lidmašīnu kustību Eiropas Savienībā, un, kamēr speciālisti avārijas seku likvidēšanai pavadīja 5 stundas, pasažieriem atkal nācās paciest kavēšanos un pārceltus lidojumus.

Ļoti nopietnas problēmas rodas negadījumu dēļ datu centros, kas apkalpo finanšu sektoru. Darījumu pārtraukumu izmaksas šeit parasti ir augstas, un iekārtu uzticamības līmenis ir atbilstošs, taču tas nenovērš incidentus. 18. aprīlī Ziemeļvalstu biržā NASDAQ (Helsinki, Somija) dienas laikā nebija iespējams veikt darījumus visā Ziemeļeiropā, jo DigiPlex komercdatu centrā tika nesankcionēti aktivizēta gāzes ugunsdzēšanas sistēma, kas pēkšņi tika atslēgta no sprieguma.

7. jūnijā datu centru pārtraukumi lika Londonas fondu biržai (LSE) par stundu atlikt tirdzniecības sākumu. Turklāt jūnijā Eiropā datu centra kļūmes dēļ uz visu dienu tika atslēgti starptautiskās maksājumu sistēmas VISA pakalpojumi, un incidenta detaļas nekad netika izpaustas.

Japāna

2018. gada vasarā Tokijas priekšpilsētas Amazon datu centra pazemes līmeņos notika ugunsgrēks, kurā gāja bojā 5 darbinieki un tika ievainoti vismaz 50. Ugunsgrēkā tika bojāti aptuveni 5000 m2 objekta. Izmeklēšanā noskaidrots, ka ugunsgrēka cēlonis bija cilvēka kļūda: neuzmanīgas apiešanās ar acetilēna lāpām dēļ aizdegās izolācija.

Neveiksmju cēloņi

Iepriekš minētais incidentu saraksts nebūt nav pilnīgs, negadījumu dēļ datu centros cieš banku un telekomunikāciju operatoru klienti, mākoņpakalpojumu sniedzēju pakalpojumi pāriet bezsaistē un pat tiek traucēts neatliekamās palīdzības dienestu darbs. Neliels pakalpojuma pārtraukums var radīt lielus zaudējumus, un lielākā daļa atslēgumu (39%) ir saistīti ar elektrisko sistēmu, norāda Uptime Institute. Otrajā vietā (24%) ir cilvēciskais faktors, bet trešajā (15%) ir gaisa kondicionēšanas sistēma. Tikai 12% negadījumu datu centros var saistīt ar dabas parādībām, un tikai 10% no tiem notiek citu iemeslu dēļ, kas nav uzskaitīti.

Neskatoties uz stingriem uzticamības un drošības standartiem, neviena iekārta nav pasargāta no negadījumiem. Lielākā daļa no tām rodas strāvas padeves pārtraukumu vai cilvēku kļūdu dēļ. Datu centru un serveru telpu īpašniekiem vispirms jāpievērš uzmanība šiem diviem faktoriem, un klientiem jāsaprot: pat tirgus līderi nevar garantēt absolūtu uzticamību. Ja aprīkojums vai mākoņpakalpojums apkalpo biznesam svarīgus procesus, jums vajadzētu padomāt par rezerves vietni.

Foto avots: telecombloger.ru

Avots: www.habr.com

Pievieno komentāru