Súlyos balesetek az adatközpontokban: okok és következmények

A modern adatközpontok megbízhatóak, de minden berendezés időnként meghibásodik. Ebben a rövid cikkben összegyűjtöttük 2018 legjelentősebb eseményeit.

Súlyos balesetek az adatközpontokban: okok és következmények

Növekszik a digitális technológiák gazdaságra gyakorolt ​​hatása, nő a feldolgozott információ mennyisége, új létesítmények épülnek, és ez addig jó, amíg minden működik. Sajnos az adatközpontok meghibásodásának gazdasági hatása is nőtt, mióta a digitalizáció elkerülhetetlen következményeként az emberek elkezdték kezelni az üzleti szempontból kritikus IT infrastruktúrát. Egy kis válogatást teszünk közzé a tavalyi év különböző országokban történt legjelentősebb baleseteiből.

USA

Ez az ország elismert vezető szerepet tölt be az adatközpont-építés területén. Az Egyesült Államokban található a legtöbb globális szolgáltatásokat kiszolgáló nagy kereskedelmi és vállalati adatközpont, így az incidensek következményei ott a legjelentősebbek. Március elején négy Equinix létesítményben áramkimaradás történt egy erős ciklon miatt. A helyet az Amazon Web Services (AWS) berendezései használták, a baleset következtében számos népszerű szolgáltatás nem elérhető: GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio és mCapital One, valamint az Amazon Alexa virtuális asszisztens. érintettek voltak.

Szeptemberben időjárási anomáliák sújtották a texasi Microsoft adatközpontokat, majd egy zivatar miatt az egész régió áramellátása megszakadt, a dízel generátorról áramra kapcsolt adatközpontban pedig nem tudni, miért a hűtés kikapcsolt. A baleset következményeinek felszámolása több napot vett igénybe, és bár a terheléselosztásnak köszönhetően ez a hiba nem vált kritikussá, a Microsoft felhőszolgáltatásainak működésében némi lassulást észleltek a felhasználók világszerte.

Oroszország

A legsúlyosabb baleset augusztus 20-án történt a Rostelecom egyik adatközpontjában. Emiatt az Egységes Állami Ingatlannyilvántartás szerverei 66 órára leálltak, ezért át kellett őket helyezni egy tartalék oldalra. A Rosreestr csak szeptember 3-án tudta visszaállítani az összes csatornán beérkezett kérelmek feldolgozását - a kormányzati szervezet nagy összeget próbál behajtani a Rostelecomtól a szolgáltatási szintre vonatkozó megállapodás megsértése miatt.

Február 16-án a Lenenergo hálózataiban fellépő problémák miatt bekapcsolták a tartalék áramellátó rendszert a Xelnet (Szentpétervár) adatközpontjában. A szinuszhullám rövid távú megszakadása számos szolgáltatás működésében zavarokat okozott: különösen a nagy felhőszolgáltatót, az 1cloud-ot érintette, de az orosz internetes közönség számára a legszembetűnőbb probléma a VKontakte közösségi oldal elérhetetlensége volt. . A legérdekesebb az, hogy körülbelül 12 órába telt a rövid távú áramszünet következményeinek teljes megszüntetése.

Az Európai Unió

2018-ban több súlyos incidenst is feljegyeztek az EU-ban. Márciusban meghibásodás történt a KLM légitársaság adatközpontjában: 10 percre megszakadt az áramellátás, a dízel generátorok teljesítménye nem volt elegendő a berendezés működtetéséhez. Néhány szerver leállt, és a légitársaságnak több tucat járatot kellett törölnie vagy átütemeznie.

Nem ez az egyetlen légi közlekedéssel kapcsolatos incidens – már áprilisban meghibásodás történt az Eurocontrol adatközpont áramellátó rendszerében. A szervezet irányítja a repülőgépek mozgását az Európai Unióban, és miközben a szakemberek 5 órát töltöttek a baleset következményeinek felszámolásával, az utasoknak ismét késéseket és átrendezett járatok kellett elviselniük.

Nagyon komoly problémák merülnek fel a pénzügyi szektort kiszolgáló adatközpontokban történt balesetek miatt. A tranzakciók megszakításának költsége itt általában magas, a létesítmények megbízhatósága megfelelő, de ez nem akadályozza meg az incidenseket. Április 18-án a skandináv NASDAQ tőzsdén (Helsinki, Finnország) a nap folyamán nem lehetett kereskedni egész Észak-Európában, mert a hirtelen áramtalanított DigiPlex kereskedelmi adatközpontban illetéktelenül aktiválódott a gázzal oltó rendszer.

Június 7-én adatközpont-kimaradások miatt a Londoni Értéktőzsde (LSE) egy órával elhalasztotta a kereskedés megkezdését. Ráadásul Európában júniusban egy adatközpont meghibásodása miatt a VISA nemzetközi fizetési rendszer szolgáltatásait egész napra letiltották, az incidens részleteit soha nem hozták nyilvánosságra.

Japán

2018 nyarán tűz ütött ki egy épülő Amazon adatközpont földalatti szintjein Tokió egyik külvárosában, amelyben 5 munkás meghalt, és legalább 50 megsérült. A tűz mintegy 5000 m2-en megrongálta a létesítményt. A vizsgálat kimutatta, hogy a tüzet emberi mulasztás okozta: az acetilén fáklyák hanyag kezelése miatt a szigetelés meggyulladt.

A kudarcok okai

A fenti incidenslista még korántsem teljes, az adatközponti balesetek miatt a bankok és a távközlési szolgáltatók ügyfelei szenvednek, a felhőszolgáltatók szolgáltatásai offline állapotba kerülnek, sőt a segélyszolgálatok munkája is akadozik. Az Uptime Institute szerint egy kisebb szolgáltatáskiesés komoly veszteségekhez vezethet, a kimaradások többsége (39%) pedig az elektromos rendszerhez kapcsolódik. A második helyen (24%) az emberi tényező, a harmadikon (15%) a klímarendszer áll. Az adatközpontokban bekövetkezett balesetek mindössze 12%-a tudható be természeti jelenségekre, és ezeknek mindössze 10%-a következik be a felsoroltakon kívüli okokból.

A szigorú megbízhatóság és biztonsági szabványok ellenére egyetlen létesítmény sem mentes az eseményektől. Legtöbbjük áramkimaradás vagy emberi hiba miatt következik be. Az adatközpontok és szervertermek tulajdonosainak mindenekelőtt erre a két tényezőre kell figyelniük, és az ügyfeleknek meg kell érteniük: még a piacvezetők sem tudják garantálni az abszolút megbízhatóságot. Ha egy berendezés vagy egy felhőszolgáltatás üzleti szempontból kritikus folyamatokat szolgál ki, akkor érdemes tartalék webhelyre gondolni.

A kép forrása: telecombloger.ru

Forrás: will.com

Hozzászólás