Veri merkezlerindeki büyük kazalar: nedenleri ve sonuçları

Modern veri merkezleri güvenilirdir ancak herhangi bir ekipman zaman zaman bozulabilir. Bu kısa yazıda 2018'in en önemli olaylarını topladık.

Veri merkezlerindeki büyük kazalar: nedenleri ve sonuçları

Dijital teknolojilerin ekonomi üzerindeki etkisi artıyor, işlenen bilgi hacmi artıyor, yeni tesisler inşa ediliyor ve her şey çalıştığı sürece bu iyi. Ne yazık ki, dijitalleşmenin kaçınılmaz bir sonucu olarak insanların iş açısından kritik BT altyapısını barındırmaya başlamasından bu yana veri merkezi arızalarının ekonomik etkisi de artıyor. Geçen yıl farklı ülkelerde meydana gelen en dikkat çekici kazaların küçük bir seçkisini yayınlıyoruz.

Birleşik Devletler

Bu ülke veri merkezi inşaatı alanında tanınmış bir liderdir. Amerika Birleşik Devletleri, küresel hizmetlere hizmet veren en fazla sayıda büyük ticari ve kurumsal veri merkezine sahiptir, dolayısıyla oradaki olayların sonuçları çok önemlidir. Mart ayı başlarında dört Equinix tesisinde güçlü bir kasırga nedeniyle elektrik kesintileri yaşandı. Alan Amazon Web Services (AWS) ekipmanı için kullanıldı; kaza birçok popüler hizmetin kullanılamamasına yol açtı: GitHub, MongoDB, NewVoiceMedia, Slack, Zillow, Atlassian, Twilio ve mCapital One'ın yanı sıra Amazon Alexa sanal asistanı, etkilendiler.

Eylül ayında hava durumu anormallikleri Teksas'ta bulunan Microsoft veri merkezlerini vurdu, ardından fırtına nedeniyle tüm bölgenin güç kaynağı sistemi kesintiye uğradı ve dizel jeneratör setinden elektriğe geçiş yapan veri merkezinde bunun nedeni bilinmiyor. soğutma kapatıldı. Kazanın sonuçlarının ortadan kaldırılması birkaç gün sürdü ve yük dengeleme sayesinde bu arıza kritik hale gelmese de, Microsoft bulut hizmetlerinin işleyişinde hafif bir yavaşlama dünya çapındaki kullanıcılar tarafından fark edildi.

Rusya

En ciddi kaza 20 Ağustos'ta Rostelecom'un veri merkezlerinden birinde meydana geldi. Bu nedenle Birleşik Devlet Emlak Sicili sunucuları 66 saat süreyle durduruldu ve bu nedenle bir yedek siteye aktarılmaları gerekti. Rosreestr, tüm kanallardan alınan başvuruların işlenmesini yalnızca 3 Eylül'de geri yükleyebildi - hükümet kuruluşu, hizmet düzeyi anlaşmasını ihlal ettiği için Rostelecom'dan büyük miktarda para almaya çalışıyor.

16 Şubat'ta Lenenergo'nun ağlarındaki sorunlar nedeniyle Xelnet'in (St. Petersburg) veri merkezindeki yedek güç kaynağı sistemi açıldı. Sinüs dalgasının kısa süreli kesintisi, birçok hizmetin işleyişinde aksamalara yol açtı: özellikle büyük bulut sağlayıcısı 1cloud etkilendi, ancak Rus İnternet izleyicileri için en dikkat çekici sorun, VKontakte sosyal ağ sitesine erişememekti. . En ilginç olanı ise kısa süreli elektrik kesintisinin sonuçlarını tamamen ortadan kaldırmak yaklaşık 12 saat sürdü.

AB

2018 yılında AB'de çok sayıda ciddi olay kaydedildi. Mart ayında KLM havayolunun veri merkezinde bir arıza yaşandı: Güç kaynağı 10 dakika süreyle kesildi ve dizel jeneratör setlerinin gücü ekipmanı çalıştırmak için yetersizdi. Bazı sunucular çöktü ve havayolu şirketi birkaç düzine uçuşu iptal etmek veya yeniden planlamak zorunda kaldı.

Hava yolculuğuyla ilgili tek olay bu değil; zaten Nisan ayında Eurocontrol veri merkezinin güç kaynağı sisteminde bir arıza meydana geldi. Kuruluş, Avrupa Birliği'ndeki uçak hareketlerini kontrol ediyor ve uzmanlar kazanın sonuçlarını ortadan kaldırmak için 5 saat harcarken, yolcular yine gecikmelere ve yeniden planlanan uçuşlara katlanmak zorunda kaldı.

Finans sektörüne hizmet veren veri merkezlerinde yaşanan kazalar nedeniyle çok ciddi sorunlar ortaya çıkıyor. Burada işlemlerdeki kesintilerin maliyeti genellikle yüksek, tesislerin güvenilirlik düzeyi de uygun ancak bu durum olayların önüne geçmiyor. 18 Nisan'da Nordic NASDAQ borsası (Helsinki, Finlandiya), aniden enerjisi kesilen DigiPlex ticari veri merkezindeki gazlı yangın söndürme sisteminin izinsiz etkinleştirilmesi nedeniyle gün içinde Kuzey Avrupa'da işlem yapamadı.

7 Haziran'da veri merkezi kesintileri, Londra Menkul Kıymetler Borsası'nı (LSE) ticaretin başlamasını bir saat ertelemeye zorladı. Ayrıca Haziran ayında Avrupa'da bir veri merkezindeki arıza nedeniyle uluslararası ödeme sistemi VISA'nın hizmetleri tüm gün boyunca devre dışı bırakıldı ve olayın ayrıntıları hiçbir zaman açıklanmadı.

Japonya

2018 yazında, Tokyo'nun bir banliyösünde inşaat halindeki Amazon veri merkezinin yeraltı katlarında çıkan yangında 5 işçi öldü ve en az 50 kişi yaralandı. Yangın, tesisin yaklaşık 5000 m2'sine zarar verdi. Soruşturma, yangının nedeninin insan hatası olduğunu gösterdi: asetilen fenerlerinin dikkatsiz kullanımı nedeniyle izolasyon alev aldı.

Arıza nedenleri

Yukarıdaki olaylar listesi tam olmaktan uzaktır; veri merkezlerindeki kazalar nedeniyle bankaların ve telekom operatörlerinin müşterileri zarar görür, bulut sağlayıcılarının hizmetleri çevrimdışı olur ve hatta acil durum hizmetlerinin çalışmaları bile kesintiye uğrar. Uptime Institute'a göre küçük bir hizmet kesintisi büyük kayıplara yol açabilir ve kesintilerin çoğunluğu (%39) elektrik sistemiyle ilgilidir. İkinci sırada (%24) insan faktörü, üçüncü sırada (%15) ise iklimlendirme sistemi yer alıyor. Veri merkezlerinde meydana gelen kazaların yalnızca %12'si doğal olaylara atfedilebilir ve bunların yalnızca %10'u listelenenlerin dışındaki nedenlerden dolayı meydana gelir.

Sıkı güvenilirlik ve güvenlik standartlarına rağmen hiçbir tesis kazalardan muaf değildir. Bunların çoğu elektrik kesintileri veya insan hatalarından kaynaklanmaktadır. Veri merkezleri ve sunucu odalarının sahipleri öncelikle bu iki faktöre dikkat etmelidir ve müşteriler şunu anlamalıdır: pazar liderleri bile mutlak güvenilirliği garanti edemez. Ekipman veya bulut hizmeti iş açısından kritik süreçlere hizmet ediyorsa bir yedekleme sitesi düşünmelisiniz.

Fotoğraf kaynağı: telecombloger.ru

Kaynak: habr.com

Yorum ekle