Velike nesreće u podatkovnim centrima: uzroci i posljedice

Moderni data centri su pouzdani, ali svaka oprema se s vremena na vrijeme pokvari. U kratkoj napomeni sakupili smo najznačajnije incidente u 2018.

Velike nesreće u podatkovnim centrima: uzroci i posljedice

Raste uticaj digitalnih tehnologija na privredu, povećava se obim obrađenih informacija, grade se novi objekti, a to je dobro dok sve funkcioniše. Nažalost, utjecaj kvarova podatkovnih centara na ekonomiju također se povećava otkako su ljudi počeli u njih postavljati poslovno kritičnu IT infrastrukturu – to je neizbježna posljedica digitalizacije. Objavljujemo mali izbor najzapaženijih nesreća koje su se dogodile u različitim zemljama u protekloj godini.

США

Ova zemlja je priznati lider u oblasti izgradnje data centara. Sjedinjene Američke Države imaju najveći broj komercijalnih i korporativnih data centara koji opslužuju globalne usluge, pa su posljedice incidenata u njima najznačajnije. Početkom marta, zbog snažnog ciklona, ​​četiri objekta Equinixa doživjela su nestanak struje. Područje je korišteno za opremu Amazon Web Services (AWS), nesreća je dovela do nedostupnosti mnogih popularnih servisa: pogođeni su GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio i mCapital One, kao i virtualni Amazon Alexa asistent.

U septembru su vremenske anomalije pogodile Microsoftove data centre koji se nalaze u Teksasu, tada je zbog grmljavine poremećen sistem napajanja čitavog regiona, a hlađenje je isključeno u data centru koji je prešao na napajanje sa dizel agregata. Bilo je potrebno nekoliko dana da se otklone posljedice nesreće, a iako kvar nije postao kritičan zahvaljujući balansiranju opterećenja, korisnici širom svijeta primijetili su usporavanje Microsoft cloud servisa.

Rusija

Najteža nesreća dogodila se 20. avgusta u jednom od Rostelekomovih data centara. Zbog toga su serveri Jedinstvenog državnog registra nekretnina stali na 66 sati, pa su morali biti prebačeni na rezervnu stranicu. Rosreestr je uspeo da obnovi obradu prijava primljenih putem svih kanala tek 3. septembra - državna organizacija pokušava da povrati veliki iznos od Rostelekoma zbog kršenja ugovora o nivou usluge.

16. februara, zbog problema u mrežama Lenenerga, uključen je rezervni sistem napajanja u data centru kompanije Xelnet (Sankt Peterburg). Kratkotrajni prekid sinusoida doveo je do poremećaja u radu mnogih usluga: posebno je patio veliki provajder oblaka 1cloud, ali najuočljiviji problem za rusku internet publiku bila je nemogućnost pristupa društvenoj mreži VKontakte. Najzanimljivije je da je bilo potrebno oko 12 sati da se u potpunosti otklone posljedice kratkotrajnog nestanka struje.

Evropska unija

U EU je tokom 2018. zabilježeno nekoliko ozbiljnih incidenata. U martu je došlo do kvara u podatkovnom centru avioprijevoznika KLM: napajanje je isključeno na 10 minuta, a snaga dizel agregata nije bila dovoljna za rad opreme. Dio servera se pokvario, a aviokompanija je morala otkazati ili pomjeriti nekoliko desetina letova.

Ovo nije jedini incident vezan za vazdušni saobraćaj – već u aprilu došlo je do kvara na sistemu za napajanje data centra Eurocontrol. Organizacija upravlja kretanjem aviona u Evropskoj uniji, a dok su stručnjaci otklanjali posledice nesreće 5 sati, putnici su ponovo morali da trpe kašnjenja i transfere letova.

Veoma ozbiljni problemi nastaju zbog nezgoda u data centrima koji opslužuju finansijski sektor. Troškovi prekida u transakcijama su ovdje obično visoki, a nivo pouzdanosti objekata je odgovarajući, ali to vas ne spašava od incidenata. Nordijska NASDAQ berza (Helsinki, Finska) 18. aprila nije mogla trgovati širom Sjeverne Evrope tokom dana zbog neovlaštenog pokretanja gasnog sistema za gašenje požara u DigiPlex komercijalnom data centru, koji je bio u zamračenju.

Dana 7. juna, prekidi u data centru primorali su Londonsku berzu (LSE) da odgodi početak trgovanja za sat vremena. Osim toga, u junu su u Evropi, zbog kvara u data centru, usluge međunarodnog platnog sistema VISA bile onemogućene za cijeli dan, a detalji incidenta nisu objavljeni.

Япония

U ljeto 2018. godine izbio je požar u podzemnim nivoima Amazonovog data centra u izgradnji u predgrađu Tokija, u kojem je poginulo 5 radnika, a povrijeđeno najmanje 50. Vatra je oštetila oko 5000 m2 prostorija kompanije. objekat. Istraga je pokazala da je uzrok požara ljudski faktor: zbog neopreznog rukovanja acetilenskim bakljama došlo je do zapaljenja izolacije.

Razlozi za neuspjehe

Navedena lista incidenata je daleko od potpune, zbog nesreća u data centrima, trpe klijenti banaka i telekom operatera, provajderi u oblaku se gase, pa čak i hitne službe su u prekidu. Mali prekid usluge može rezultirati značajnim gubicima, pri čemu se većina kvarova (39%) odnosi na sistem napajanja, prema Uptime Institutu. Na drugom mjestu (24%) je ljudski faktor, a na trećem (15%) je sistem klimatizacije. Samo 12% nesreća u data centrima može se pripisati prirodnim pojavama, a samo 10% njih se dešava iz drugih razloga od navedenih.

Uprkos strogim standardima pouzdanosti i sigurnosti, nijedan objekat nije osiguran od incidenata. Većina njih nastaje zbog nestanka struje ili ljudskih grešaka. Na ova dva faktora prije svega treba obratiti pažnju vlasnici data centara i server soba, a kupci treba da shvate da čak ni lideri na tržištu ne mogu garantirati apsolutnu pouzdanost. Ako oprema ili usluga u oblaku služe procesima kritičnim za poslovanje, trebali biste razmisliti o web-mjestu za sigurnosnu kopiju.

Izvor fotografije: telecombloger.ru

izvor: www.habr.com

Dodajte komentar