Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Հե՜յ Հաբր։

Ամանորյա տոներից հետո մենք վերագործարկեցինք աղետներից պաշտպանված ամպը, որը հիմնված էր երկու կայքերի վրա: Այսօր մենք ձեզ կպատմենք, թե ինչպես է այն աշխատում և ցույց կտանք, թե ինչ է տեղի ունենում հաճախորդի վիրտուալ մեքենաների հետ, երբ կլաստերի առանձին տարրերը ձախողվում են, և ամբողջ կայքը խափանում է (սպոյլեր – նրանց մոտ ամեն ինչ կարգին է):

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում
Աղետներին դիմացկուն ամպային պահեստավորման համակարգ OST կայքում:

Whats ներսում

Կափարիչի տակ կլաստերը ունի Cisco UCS սերվերներ VMware ESXi հիպերվիզորով, երկու INFINIDAT InfiniBox F2240 պահեստավորման համակարգեր, Cisco Nexus ցանցային սարքավորումներ, ինչպես նաև Brocade SAN անջատիչներ: Կլաստերը բաժանված է երկու կայքի՝ OST և NORD, այսինքն՝ յուրաքանչյուր տվյալների կենտրոն ունի սարքավորումների նույնական հավաքածու: Իրականում հենց դա է դարձնում այն ​​աղետից պաշտպանված:

Մեկ կայքի ներսում հիմնական տարրերը նույնպես կրկնօրինակվում են (հոսթներ, SAN անջատիչներ, ցանցեր):
Երկու տեղամասերը միացված են հատուկ օպտիկամանրաթելային երթուղիներով, որոնք նույնպես վերապահված են:

Մի քանի խոսք պահեստավորման համակարգերի մասին. Մենք NetApp-ում կառուցեցինք աղետներից պաշտպանված ամպի առաջին տարբերակը: Այստեղ մենք ընտրեցինք INFINIDAT-ը, և ահա թե ինչու.

  • Ակտիվ-Ակտիվ կրկնօրինակման տարբերակ: Այն թույլ է տալիս վիրտուալ մեքենային աշխատել, նույնիսկ եթե պահեստավորման համակարգերից մեկն ամբողջությամբ ձախողվի: Ես ձեզ ավելի ուշ կասեմ կրկնօրինակման մասին:
  • Երեք սկավառակի կարգավորիչներ՝ համակարգի սխալների հանդուրժողականությունը բարձրացնելու համար: Սովորաբար երկուսն են.
  • Պատրաստ լուծում. Մենք ստացանք նախապես հավաքված դարակ, որը պարզապես անհրաժեշտ է միացնել ցանցին և կարգավորել:
  • Ուշադիր տեխնիկական աջակցություն: INFINIDAT-ի ինժեներները մշտապես վերլուծում են պահեստավորման համակարգի տեղեկամատյանները և իրադարձությունները, տեղադրում են որոնվածի նոր տարբերակներ և օգնում կազմաձևման հարցում:

Ահա մի քանի լուսանկարներ փաթեթավորումից.

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Ինչպես է այն աշխատում

Ամպն իր ներսում արդեն իսկ անսխալական է: Այն պաշտպանում է հաճախորդին առանձին ապարատային և ծրագրային ապահովման ձախողումներից: Աղետներին դիմակայելը կօգնի պաշտպանվել մեկ կայքի ներսում զանգվածային խափանումներից. օրինակ՝ պահեստավորման համակարգի խափանում (կամ SDS կլաստերի, որը շատ հաճախ է պատահում 🙂), պահեստային ցանցի զանգվածային սխալներից և այլն: Դե, և ամենակարևորը. նման ամպը խնայում է, երբ մի ամբողջ կայք դառնում է անհասանելի հրդեհի, անջատման, ռեյդերների կողմից գրավման կամ այլմոլորակայինների վայրէջքի պատճառով:

Այս բոլոր դեպքերում հաճախորդի վիրտուալ մեքենաները շարունակում են աշխատել, և ահա թե ինչու:

Կլաստերի ձևավորումը նախագծված է այնպես, որ հաճախորդի վիրտուալ մեքենաներով ցանկացած ESXi հոսթ կարողանա մուտք գործել պահեստավորման երկու համակարգերից որևէ մեկը: Եթե ​​OST-ի կայքում պահեստավորման համակարգը ձախողվի, վիրտուալ մեքենաները կշարունակեն աշխատել. հոսթերը, որոնց վրա նրանք աշխատում են, մուտք կունենան NORD-ի պահեստավորման համակարգ տվյալների համար:

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում
Ահա թե ինչ տեսք ունի կլաստերի միացման դիագրամը:

Սա հնարավոր է շնորհիվ այն փաստի, որ երկու կայքերի SAN գործվածքների միջև կազմաձևված է Inter-Switch Link. Fabric A OST SAN անջատիչը միացված է Fabric A NORD SAN անջատիչին, և նմանապես Fabric B SAN անջատիչների համար:

Դե, որպեսզի SAN գործարանների այս բոլոր բարդությունները իմաստ ունենան, Active-Active կրկնօրինակումը կազմաձևված է երկու պահեստավորման համակարգերի միջև. տեղեկատվությունը գրեթե միաժամանակ գրվում է տեղական և հեռավոր պահեստավորման համակարգերում, RPO = 0: Պարզվում է, որ սկզբնական տվյալները պահվում են մի պահեստավորման համակարգում, իսկ դրա կրկնօրինակը՝ մյուսում։ Տվյալները կրկնօրինակվում են պահեստավորման ծավալների մակարդակով, և VM-ի տվյալները (դրա սկավառակները, կազմաձևման ֆայլը, փոխանակման ֆայլը և այլն) պահվում են դրանց վրա:

ESXi հյուրընկալողը տեսնում է հիմնական ծավալը և դրա կրկնօրինակը որպես մեկ սկավառակի սարք (Պահպանման սարք): ESXi հոսթից դեպի յուրաքանչյուր սկավառակի սարք կա 24 ուղի.

12 ուղիները միացնում են այն տեղական պահեստավորման համակարգին (օպտիմալ ուղիներ), իսկ մնացած 12-ը՝ հեռավոր պահեստավորման համակարգին (ոչ օպտիմալ ուղիներ): Նորմալ իրավիճակում ESXi-ն մուտք է գործում տեղական պահեստային համակարգի տվյալների՝ օգտագործելով «օպտիմալ» ուղիներ: Երբ այս պահեստավորման համակարգը ձախողվում է, ESXi-ն կորցնում է օպտիմալ ուղիները և անցնում «ոչ օպտիմալների»: Ահա թե ինչ տեսք ունի գծապատկերում.

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում
Աղետներից պաշտպանված կլաստերի սխեման:

Հաճախորդների բոլոր ցանցերը միացված են երկու կայքերին ընդհանուր ցանցային հյուսվածքի միջոցով: Յուրաքանչյուր կայք գործարկում է Մատակարարի եզր (PE), որի վրա հաճախորդի ցանցերն ավարտված են: PE-ները միավորված են ընդհանուր կլաստերի մեջ: Եթե ​​PE-ն ձախողվում է մեկ կայքում, ամբողջ տրաֆիկը վերահղվում է դեպի երկրորդ կայք: Դրա շնորհիվ առանց PE-ի մնացած կայքի վիրտուալ մեքենաները ցանցի միջոցով հասանելի են մնում հաճախորդին:

Հիմա տեսնենք, թե ինչ կլինի հաճախորդի վիրտուալ մեքենաների հետ տարբեր խափանումների ժամանակ: Սկսենք ամենաթեթև տարբերակներից և ավարտենք ամենալուրջով` ամբողջ կայքի ձախողմամբ: Օրինակներում հիմնական հարթակը կլինի OST-ը, իսկ պահեստային հարթակը տվյալների կրկնօրինակներով՝ NORD-ը։

Ի՞նչ է պատահում հաճախորդի վիրտուալ մեքենայի հետ, եթե...

Replication Link-ը ձախողվում է: Երկու տեղամասերի պահեստավորման համակարգերի միջև կրկնօրինակումը դադարում է:
ESXi-ն կաշխատի միայն տեղական սկավառակային սարքերի հետ (օպտիմալ ուղիներով):
Վիրտուալ մեքենաները շարունակում են աշխատել.

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

ISL-ը (Inter-Switch Link) խախտում է: Դեպքը քիչ հավանական է։ Եթե ​​ինչ-որ խելագար էքսկավատոր միանգամից մի քանի օպտիկական երթուղի չի փորում, որոնք աշխատում են անկախ երթուղիներով և տարբեր մուտքերի միջոցով բերվում տեղամասեր: Բայց ամեն դեպքում. Այս դեպքում, ESXi հոսթորդները կորցնում են ուղիների կեսը և կարող են մուտք գործել միայն իրենց տեղական պահեստավորման համակարգերը: Կրկնօրինակները հավաքվում են, բայց հյուրընկալողները չեն կարողանա մուտք գործել դրանք:

Վիրտուալ մեքենաները նորմալ աշխատում են։

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

SAN անջատիչը ձախողվում է կայքերից մեկում: ESXi հոսթորդները կորցնում են պահեստավորման համակարգի որոշ ուղիներ: Այս դեպքում հոսթները այն վայրում, որտեղ անջատիչը ձախողվեց, կաշխատի միայն իրենց HBA-ներից մեկի միջոցով:

Վիրտուալ մեքենաները շարունակում են նորմալ աշխատել։

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Կայքերից մեկի բոլոր SAN անջատիչները ձախողվում են: Ենթադրենք, նման աղետ է տեղի ունեցել ՕՍՏ կայքում։ Այս դեպքում, այս կայքի ESXi հոսթերը կկորցնեն իրենց սկավառակի սարքերի բոլոր ուղիները: Գործում է ստանդարտ VMware vSphere HA մեխանիզմը. այն կվերագործարկի OST կայքի բոլոր վիրտուալ մեքենաները NORD-ում առավելագույնը 140 վայրկյանում:

Վիրտուալ մեքենաները, որոնք աշխատում են NORD կայքի հոսթերում, նորմալ աշխատում են:

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

ESXi հոսթինգը ձախողվում է մեկ կայքում: Այստեղ vSphere HA մեխանիզմը կրկին աշխատում է. ձախողված հոսթից վիրտուալ մեքենաները վերագործարկվում են այլ հոսթների վրա՝ նույն կամ հեռավոր կայքում: Վիրտուալ մեքենայի վերագործարկման ժամանակը մինչև 1 րոպե է:

Եթե ​​OST-ի կայքի բոլոր ESXi հոսթերը ձախողվեն, տարբերակներ չկան. VM-ները վերագործարկվում են մեկ ուրիշի վրա: Վերագործարկման ժամանակը նույնն է:

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Պահպանման համակարգը ձախողվում է մեկ վայրում: Ենթադրենք, պահպանման համակարգը ձախողվում է OST-ի կայքում: Այնուհետև OST կայքի ESXi հոսթերն անցնում են NORD-ում պահեստավորման կրկնօրինակների հետ աշխատելուն: Այն բանից հետո, երբ ձախողված պահեստային համակարգը կվերադառնա ծառայության, տեղի կունենա հարկադիր վերարտադրություն, և ESXi OST հոսթորդները նորից կսկսեն մուտք գործել տեղական պահեստավորման համակարգ:

Վիրտուալ մեքենաներն այս ամբողջ ընթացքում նորմալ աշխատում էին։

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Կայքերից մեկը ձախողվում է: Այս դեպքում բոլոր վիրտուալ մեքենաները կվերագործարկվեն պահուստային կայքում՝ vSphere HA մեխանիզմի միջոցով: VM-ի վերագործարկման ժամանակը 140 վայրկյան է: Այս դեպքում վիրտուալ մեքենայի բոլոր ցանցային կարգավորումները կպահպանվեն, և այն հասանելի կլինի հաճախորդի համար ցանցի միջոցով:

Ապահովելու համար, որ պահեստային կայքում մեքենաների վերագործարկումը սահուն է ընթանում, յուրաքանչյուր կայք լցված է միայն կիսով չափ: Երկրորդ կեսը ռեզերվ է այն դեպքում, եթե բոլոր վիրտուալ մեքենաները տեղափոխվեն երկրորդ, վնասված կայքից:

Աղետների դիմացկուն ամպ. ինչպես է այն աշխատում

Աղետներին դիմացկուն ամպը, որը հիմնված է տվյալների երկու կենտրոնների վրա, պաշտպանում է նման խափանումներից:

Այս հաճույքը էժան չէ, քանի որ, բացի հիմնական ռեսուրսներից, երկրորդ տեղում պահուստ է անհրաժեշտ։ Հետևաբար, բիզնեսի համար կարևոր ծառայությունները տեղադրվում են այնպիսի ամպի մեջ, որի երկարաժամկետ աշխատանքը հանգեցնում է մեծ ֆինանսական և հեղինակության կորուստների, կամ եթե տեղեկատվական համակարգը ենթակա է աղետներին դիմակայելու պահանջներին կարգավորող մարմիններից կամ ընկերության ներքին կանոնակարգերից:

Աղբյուրները

  1. www.infinidat.com/sites/default/files/resource-pdfs/DS-INFBOX-190331-US_0.pdf
  2. support.infinidat.com/hc/en-us/articles/207057109-InfiniBox-best-practices-guides

Source: www.habr.com

Добавить комментарий