Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

Yaya za ku ji idan wata rana mai kyau ta bazara cibiyar bayanai tare da kayan aikinku ta yi kama da wannan?

Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

Sannu duka! Sunana Dmitry Samsonov, Ina aiki a matsayin babban mai kula da tsarin a "'Yan aji" Hoton ya nuna ɗaya daga cikin cibiyoyin bayanai guda huɗu inda aka shigar da kayan aikin da muke aiki. Bayan wadannan ganuwar akwai kusan guda dubu 4 na kayan aiki: sabobin, tsarin adana bayanai, kayan aikin cibiyar sadarwa, da sauransu. - kusan ⅓ na duk kayan aikin mu.
Yawancin sabobin Linux ne. Har ila yau, akwai dozin da yawa a kan Windows (MS SQL) - gadonmu, wanda muka yi watsi da shi tsawon shekaru da yawa.
Don haka, a ranar 5 ga Yuni, 2019 da ƙarfe 14:35, injiniyoyi a ɗaya daga cikin cibiyoyin bayananmu sun ba da rahoton ƙararrawar wuta.

Rashin damuwa

14:45. Ƙananan abubuwan hayaki a cikin cibiyoyin bayanai sun fi kowa fiye da yadda kuke zato. Alamun da ke cikin dakunan sun kasance na al'ada, don haka halayenmu na farko ya kasance mai kwantar da hankali: sun gabatar da dokar hana aiki tare da samarwa, wato, akan kowane canje-canje na tsari, akan fitar da sababbin sigogi, da dai sauransu, sai dai aikin da ya shafi gyara wani abu.

Fushi

Shin kun taɓa yin ƙoƙarin ganowa daga ma'aikatan kashe gobara a daidai inda gobarar ta tashi a kan rufin, ko don ku hau rufin da ke cin wuta don tantance halin da ake ciki? Yaya girman amincin bayanan da aka samu ta hanyar mutane biyar zai kasance?

14: 50. An samu labarin cewa gobarar na gabatowa tsarin sanyaya. Amma zai zo? Mai kula da tsarin da ke aiki yana cire zirga-zirgar waje daga gaban wannan cibiyar bayanai.

A halin yanzu, gaban duk ayyukanmu ana kwafi su a cikin cibiyoyin bayanai guda uku, ana amfani da daidaitawa a matakin DNS, wanda ke ba mu damar cire adiresoshin cibiyar bayanai ɗaya daga DNS, ta haka ne ke kare masu amfani daga matsaloli masu yuwuwar samun damar yin amfani da sabis. . Idan matsaloli sun riga sun faru a cibiyar bayanai, yana barin juyawa ta atomatik. Kuna iya karanta ƙarin anan: Load daidaitawa da rashin haƙuri a Odnoklassniki.

Gobarar ba ta shafe mu ba tukuna - ba a lalata masu amfani da su ko kayan aiki ba. Wannan hatsari ne? Sashe na farko na daftarin aiki "Shirin Ayyukan Hatsari" ya bayyana manufar "Hatsari", kuma sashin ya ƙare kamar haka:
«Idan akwai kokwanto ko an yi hatsari ko babu, to hatsari ne!»

14:53. An nada kodineta na gaggawa.

Mai gudanarwa shine mutumin da ke sarrafa sadarwa tsakanin dukkan mahalarta, tantance girman hadarin, yin amfani da Tsarin Ayyukan gaggawa, jawo hankalin ma'aikatan da suka dace, kula da kammala gyare-gyare, kuma mafi mahimmanci, ba da izini ga kowane aiki. A wasu kalmomi, wannan shi ne mutumin da ke kula da dukan tsarin mayar da martani na gaggawa.

Ciniki

15:01. Mun fara kashe sabobin da ba su da alaƙa da samarwa.
15:03. Muna kashe duk sabis ɗin da aka tanada daidai.
Wannan ya haɗa da ba kawai gaba ba (wanda ta wannan batu masu amfani ba sa samun dama) da sabis na taimako (hanyoyin kasuwanci, caches, da dai sauransu), amma har ma daban-daban bayanai tare da maimaita factor 2 ko fiye (Cassandra, binary data ajiya, ajiya mai sanyi, NewSQL da sauransu).
15: 06. An samu labarin cewa gobara na barazana ga daya daga cikin rumfunan da ake tattara bayanai. Ba mu da kayan aiki a cikin wannan ɗakin, amma gaskiyar cewa wuta na iya yaduwa daga rufin zuwa ɗakin taro yana canza hoton abin da ke faruwa.
(Daga baya ya zama babu wata barazana ta jiki ga zauren, tun da an rufe shi ta hanyar hermetically daga rufin. Barazanar ta kasance ne kawai ga tsarin sanyaya na wannan zauren.)
15:07. Muna ba da izinin aiwatar da umarni akan sabobin a cikin hanzari ba tare da ƙarin bincike ba (ba tare da fi so kalkuleta).
15:08. Yanayin zafin jiki a cikin zauren yana cikin iyakokin al'ada.
15: 12. An yi rikodin karuwar zafin jiki a cikin zauren.
15:13. Fiye da rabin sabar da ke cikin cibiyar bayanai an kashe su. Mu ci gaba.
15:16. An yanke shawarar kashe duk kayan aiki.
15:21. Mun fara kashe wuta zuwa sabobin marasa jiha ba tare da rufe aikace-aikace da tsarin aiki daidai ba.
15:23. An ware ƙungiyar mutane da ke da alhakin MS SQL (akwai kaɗan daga cikinsu, dogaro da sabis a kansu ba shi da kyau, amma hanyar maido da aiki yana ɗaukar lokaci mai tsawo kuma ya fi rikitarwa fiye da, misali, Cassandra).

Dama

15: 25. An samu bayanai game da kashe wutar lantarki a dakuna hudu daga cikin 16 (Lamba 6, 7, 8, 9). Kayan aikin mu yana cikin zaure 7 da 8. Babu bayani game da zaurenmu guda biyu (Lamba 1 da 3).
Yawancin lokaci, a lokacin gobara, ana kashe wutar lantarki nan da nan, amma a wannan yanayin, godiya ga aikin haɗin gwiwar ma'aikatan kashe gobara da ma'aikatan fasaha na cibiyar bayanai, ba a kashe a ko'ina ba kuma ba nan da nan ba, amma kamar yadda ya cancanta.
(Daga baya an gano cewa ba a kashe wutar a zauruka na 8 da 9 ba.)
15:28. Mun fara tura MS SQL databases daga madadin a wasu cibiyoyin bayanai.
Ze dau wani irin lokaci? Shin akwai isassun ƙarfin hanyar sadarwa don duka hanyar?
15: 37. An yi rikodin kashe wasu sassan cibiyar sadarwa.
Gudanarwa da kuma samar da cibiyar sadarwa sun keɓe ta jiki daga juna. Idan cibiyar sadarwar samarwa tana samuwa, to, zaku iya zuwa uwar garken, dakatar da aikace-aikacen kuma kashe OS. Idan babu shi, to zaku iya shiga ta hanyar IPMI, dakatar da aikace-aikacen kuma kashe OS. Idan babu ɗayan cibiyoyin sadarwa, to ba za ku iya yin komai ba. "Na gode, Cap!", za ku yi tunani.
"Kuma gabaɗaya, akwai tashin hankali," kuma kuna iya tunani.
Abinda shine sabobin, ko da ba tare da wuta ba, suna haifar da zafi mai yawa. Mafi daidai, lokacin da akwai sanyi, suna haifar da zafi, kuma lokacin da babu sanyi, suna haifar da mummunar wuta, wanda, mafi kyau, zai narke wani ɓangare na kayan aiki kuma ya kashe wani sashi, kuma a mafi munin ... haifar da wani. wuta a cikin zauren, wanda kusan tabbas zai lalata komai.

Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

15:39. Muna gyara matsaloli tare da bayanan conf.

Database conf shine madaidaicin sabis na suna iri ɗaya, wanda duk aikace-aikacen samarwa ke amfani dashi don canza saituna da sauri. Idan ba tare da wannan tushe ba, ba za mu iya sarrafa aikin tashar ba, amma tashar da kanta zata iya aiki.

15:41. Na'urori masu auna zafin jiki akan kayan aikin cibiyar sadarwa na Core suna rikodin karatuttukan kusa da iyakar da aka halatta. Wannan akwati ne wanda ya mamaye gaba dayan rakiyar kuma yana tabbatar da aikin duk hanyoyin sadarwa a cikin cibiyar bayanai.

Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

15:42. Ba su da mai sa ido da wiki, canza zuwa jiran aiki.
Wannan ba samarwa ba ne, amma idan akwai haɗari, samun kowane tushe na ilimi na iya zama mahimmanci.
15:50. Ɗayan tsarin sa ido ya kashe.
Akwai da yawa daga cikinsu, kuma suna da alhakin bangarori daban-daban na ayyukan. Wasu daga cikinsu an tsara su ne don yin aiki da kansu a cikin kowace cibiyar bayanai (wato, suna kula da cibiyar bayanan kansu kawai), wasu kuma sun ƙunshi abubuwan rarrabawa waɗanda ke tsira daga asarar kowace cibiyar bayanai.
A wannan yanayin ya daina aiki kasuwanci dabaru Manuniya Anomaly gano tsarin, wanda ke aiki a yanayin jiran aiki. An canza zuwa jiran aiki.

Yaron tallafi

15:51. Duk sabobin banda MS SQL an kashe su ta hanyar IPMI ba tare da rufewa daidai ba.
Shin kuna shirye don babban gudanarwar uwar garken ta hanyar IPMI idan ya cancanta?

A daidai lokacin da aka kammala aikin ceto kayan aiki a cibiyar bayanai a wannan mataki. An yi duk abin da za a iya yi. Wasu abokan aiki na iya hutawa.
16: 13. An samu bayanai cewa bututun freon daga na'urorin sanyaya iska sun fashe a rufin - wannan zai jinkirta kaddamar da cibiyar bayanai bayan an kashe wutar.
16:19. Bisa ga bayanan da aka samu daga ma'aikatan fasaha na cibiyar bayanai, karuwar zafin jiki a cikin zauren ya tsaya.
17:10. An dawo da bayanan conf. Yanzu za mu iya canza saitunan aikace-aikacen.
Me yasa wannan yake da mahimmanci idan duk abin da ke da laifi-haƙuri kuma yana aiki ko da ba tare da cibiyar bayanai ɗaya ba?
Na farko, ba duk abin da ke da laifi-haƙuri. Akwai hidimomin sakandare daban-daban waɗanda har yanzu ba su tsira daga gazawar cibiyar bayanai da kyau ba, kuma akwai ma'ajin bayanai a cikin yanayin jiran aiki. Ikon sarrafa saituna yana ba ku damar yin duk abin da ya dace don rage tasirin sakamakon haɗari akan masu amfani har ma a cikin yanayi mai wahala.
Na biyu, ya bayyana cewa ba za a dawo da aikin cibiyar bayanai gaba daya cikin sa'o'i masu zuwa ba, don haka ya zama dole a dauki matakan tabbatar da cewa rashin samun kwafi na dogon lokaci bai haifar da karin matsaloli kamar cikakken diski a ciki ba. sauran cibiyoyin bayanai.
17:29. Pizza lokaci! Muna daukar mutane aiki, ba robobi ba.

Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

Gyarawa

18:02. A cikin dakuna No. 8 (namu), 9, 10 da 11 zafin jiki ya daidaita. Ɗaya daga cikin waɗanda suka rage a layi (No. 7) yana da kayan aikin mu, kuma zafin jiki yana ci gaba da tashi.
18:31. Sun ba da izinin fara kayan aiki a zaure na 1 da 3 - waɗannan zaurukan ba su da tasiri a kan gobarar.

A halin yanzu, ana ƙaddamar da sabobin a cikin zaure na 1, 3, 8, farawa da mafi mahimmanci. Ana duba daidai aikin duk ayyukan da ke gudana. Har yanzu akwai matsaloli da zauren mai lamba 7.

18:44. Ma'aikatan fasaha na cibiyar bayanai sun gano cewa a cikin dakin No. 7 (inda kayan aikinmu kawai suke) yawancin sabobin ba a kashe su ba. Dangane da bayananmu, sabobin 26 sun kasance kan layi a can. Bayan dubawa na biyu, mun sami sabobin 58.
20:18. Masu fasahar cibiyar bayanai suna hura iska ta cikin wani daki mara kwandishan ta bututun tafi da gidanka da ke bi ta cikin harabar gidan.
23:08. An tura admin na farko gida. Wani yana buƙatar barci da dare don ci gaba da aiki gobe. Bayan haka, za mu sake sakin wasu ƙarin admins da masu haɓakawa.
02:56. Mun kaddamar da duk abin da za a iya kaddamarwa. Muna yin bincike da yawa na duk ayyuka ta amfani da gwaje-gwaje na atomatik.

Shin yakamata a kashe sabobin idan gwajin hayaki na cibiyar bayanai ya kama wuta?

03:02. Na'urar sanyaya iska a karshe, an gyara zauren na 7.
03:36. Mun kawo gaba a cikin cibiyar bayanai zuwa juyawa a cikin DNS. Daga wannan lokacin zirga-zirgar mai amfani ta fara zuwa.
Muna aika yawancin ƙungiyar gudanarwa gida. Amma mun bar mutane kaɗan a baya.

Ƙananan FAQ:
Tambaya: Me ya faru daga 18:31 zuwa 02:56?
A: Bayan "Shirin Ayyukan Bala'i", muna ƙaddamar da duk ayyuka, farawa da mafi mahimmanci. A wannan yanayin, mai gudanarwa a cikin hira yana ba da sabis ga mai gudanarwa kyauta, wanda ke bincika ko OS da aikace-aikacen sun fara, ko akwai wasu kurakurai, kuma ko alamun sun kasance na al'ada. Bayan an gama ƙaddamarwa, sai ya ba da rahoto ga tattaunawar cewa yana da kyauta kuma ya karɓi sabon sabis daga mai gudanarwa.
Tsarin yana ƙara rage gudu ta gazawar kayan aikin. Ko da dakatar da OS da rufe sabobin sun tafi daidai, wasu sabar ba sa dawowa saboda gazawar fayafai, ƙwaƙwalwar ajiya, da chassis kwatsam. Lokacin da aka rasa wutar lantarki, ƙimar gazawar ta karu.
Tambaya: Me ya sa ba za ku iya gudanar da komai a lokaci ɗaya ba, sannan ku gyara abin da ke faruwa a cikin saka idanu?
A: Dole ne a yi komai a hankali, saboda akwai dogaro tsakanin sabis. Kuma duk abin da ya kamata a duba nan da nan, ba tare da jiran saka idanu ba - saboda yana da kyau a magance matsalolin nan da nan, ba tare da jira su kara tsananta ba.

7:40. Admin na karshe (coordinator) ya kwanta. An gama aikin ranar farko.
8:09. Masu haɓakawa na farko, injiniyoyin cibiyar bayanai da masu gudanarwa (ciki har da sabon mai gudanarwa) sun fara aikin maidowa.
09:37. Mun fara tada zaure mai lamba 7 (na karshe).
A lokaci guda kuma, muna ci gaba da mayar da abin da ba a gyara ba a cikin wasu ɗakuna: maye gurbin faifai / ƙwaƙwalwar ajiya / sabobin, gyara duk abin da ke "ƙone" a cikin saka idanu, canza matsayi a cikin tsarin tsarin jiran aiki da sauran ƙananan abubuwa, wanda akwai su. duk da haka quite mai yawa.
17:08. Muna ba da izinin duk aikin yau da kullun tare da samarwa.
21:45. An kammala aikin kwana na biyu.
09:45. Yau Juma'a. Har yanzu akwai ƴan ƙananan matsaloli wajen sa ido. Karshen mako yana gaba, kowa yana son shakatawa. Muna ci gaba da gyara duk abin da za mu iya. Ayyukan gudanarwa na yau da kullun waɗanda za a iya jinkirta su an jinkirta su. Mai gudanarwa sabuwa ne.
15:40. Nan da nan rabin jigon kayan aikin cibiyar sadarwa na Core a WATA cibiyar bayanai ya sake farawa. An cire gaba daga juyawa don rage haɗari. Babu wani tasiri ga masu amfani. Daga baya ya juya cewa chassis ne mara kyau. Ko’odinetan yana aikin gyara hadurra guda biyu a lokaci daya.
17:17. An dawo da aikin hanyar sadarwa a wata cibiyar bayanai, an duba komai. Ana saka cibiyar bayanai cikin juyawa.
18:29. Aiki na rana ta uku kuma, a gaba ɗaya, maidowa bayan an gama haɗari.

Bayanword

04.04.2013 a ranar kuskure 404, "Yan ajin" ya tsira daga hatsari mafi girma -har tsawon kwanaki uku tashar ta kasance gaba ɗaya ko kaɗan babu. A duk tsawon wannan lokacin, fiye da mutane 100 daga garuruwa daban-daban, daga kamfanoni daban-daban (yawan godiya kuma!), A nesa da kai tsaye a cikin cibiyoyin bayanai, da hannu da ta atomatik, sun gyara dubban sabobin.
Mun yanke hukunci. Don hana faruwar haka, mun gudanar da ayyuka masu yawa har zuwa yau.

Menene babban bambance-bambance tsakanin hadarin na yanzu da 404?

  • Muna da "Shirin Ayyukan Hatsari". Sau ɗaya a cikin kwata, muna gudanar da atisaye - muna yin rawar-wasa yanayin gaggawa, wanda ƙungiyar masu gudanarwa (duka bi da bi) dole ne su kawar da su ta amfani da "Shirin Ayyukan Gaggawa". Manyan masu gudanar da tsarin suna taka rawa a matsayin mai gudanarwa.
  • Kwata-kwata, a yanayin gwaji, muna keɓance cibiyoyin bayanai (duka bi da bi) ta hanyoyin sadarwar LAN da WAN, wanda ke ba mu damar gano bakin ciki da sauri.
  • Ƙananan fayafai masu fashe, saboda mun ƙarfafa ƙa'idodi: ƙarancin sa'o'in aiki, tsauraran matakan SMART,
  • Mun yi watsi da BerkeleyDB gaba ɗaya, tsohuwar kuma maras ƙarfi bayanai wanda ke buƙatar lokaci mai yawa don murmurewa bayan sabar ta sake farawa.
  • Mun rage adadin sabobin tare da MS SQL kuma mun rage dogaro ga sauran.
  • Muna da namu girgije - daya-girgije, inda muke rayayye yin ƙaura duk ayyuka na shekaru biyu yanzu. Gajimaren yana sauƙaƙa duk tsarin aiki tare da aikace-aikacen, kuma idan wani haɗari ya faru yana samar da kayan aiki na musamman kamar:
    • daidai tasha duk aikace-aikace a danna daya;
    • sauƙi ƙaura na aikace-aikace daga gazawar sabobin;
    • Matsayi ta atomatik (domin fifikon sabis) ƙaddamar da cibiyar bayanai gabaɗaya.

Hadarin da aka kwatanta a wannan labarin shine mafi girma tun kwanaki 404. Tabbas, ba komai ya tafi daidai ba. Misali, yayin da babu wata cibiyar bayanai da gobara ta lalata a wata cibiyar bayanai, faifan daya daga cikin sabobin ya gaza, wato daya ne kawai daga cikin kwafi ukun da ke cikin gungu na Cassandra, wanda shine dalilin da ya sa kashi 4,2% na wayar hannu masu amfani da aikace-aikacen sun kasa shiga . A lokaci guda, masu amfani da aka haɗa sun ci gaba da aiki. A cikin duka, sakamakon hadarin, an gano matsalolin fiye da 30 - daga banal kwari zuwa gazawar a cikin gine-ginen sabis.

Amma mafi mahimmancin bambanci tsakanin hadarin na yanzu da na 404 shine cewa yayin da muke kawar da sakamakon gobarar, masu amfani suna ci gaba da yin saƙo da yin kiran bidiyo zuwa Daidai, buga wasanni, sauraron kiɗa, ba wa juna kyaututtuka, kallon bidiyo, jerin talabijin da tashoshin TV a ciki OK, da kuma yawo a ciki Yayi Rai.

Yaya hadurran naku suke tafiya?

source: www.habr.com

Add a comment