ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

හෙලෝ, හබ්ර්!

අලුත් අවුරුදු නිවාඩුවෙන් පසු, අපි අඩවි දෙකක් මත පදනම්ව ආපදා-ප්‍රතිරෝධී වලාකුළක් නැවත දියත් කළෙමු. අද අපි ඔබට එය ක්‍රියා කරන ආකාරය පවසන අතර පොකුරේ තනි මූලද්‍රව්‍ය අසමත් වූ විට සහ මුළු වෙබ් අඩවියම කඩා වැටෙන විට සේවාදායක අථත්‍ය යන්ත්‍රවලට කුමක් සිදුවේද යන්න පෙන්වමු (ස්පොයිලර් - ඒවා සමඟ සියල්ල හොඳයි).

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය
OST අඩවියේ ආපදා-ප්‍රතිරෝධී වලාකුළු ගබඩා පද්ධතිය.

ඇතුළත ඇති දේ

ආවරණය යටතේ, පොකුරේ VMware ESXi හයිපර්වයිසර් සහිත Cisco UCS සේවාදායකයන්, INFINIDAT InfiniBox F2240 ගබඩා පද්ධති දෙකක්, Cisco Nexus ජාල උපකරණ මෙන්ම Brocade SAN ස්විචයන් ඇත. පොකුර අඩවි දෙකකට බෙදා ඇත - OST සහ NORD, එනම් සෑම දත්ත මධ්‍යස්ථානයකම සමාන උපකරණ කට්ටලයක් ඇත. ඇත්ත වශයෙන්ම, එය ආපදා-ප්‍රතිරෝධී වන්නේ මෙයයි.

එක් වෙබ් අඩවියක් තුළ, ප්රධාන මූලද්රව්ය ද අනුපිටපත් කර ඇත (ධාරක, SAN ස්විච, ජාලකරණය).
අඩවි දෙක වෙන් කර ඇති ෆයිබර් ඔප්ටික් මාර්ග මගින් සම්බන්ධ කර ඇත.

ගබඩා පද්ධති ගැන වචන කිහිපයක්. අපි NetApp හි ආපදා-ප්‍රතිරෝධී වලාකුළක පළමු අනුවාදය ගොඩනඟමු. මෙන්න අපි INFINIDAT තෝරගත්තා, සහ මෙන්න ඇයි:

  • Active-Active replication විකල්පය. එක් ගබඩා පද්ධතියක් සම්පූර්ණයෙන්ම අසමත් වුවද එය අතථ්‍ය යන්ත්‍රය ක්‍රියාත්මක වීමට ඉඩ සලසයි. මම ඔබට අනුකරණය ගැන වැඩි විස්තර පසුව කියන්නම්.
  • පද්ධති දෝෂ ඉවසීම වැඩි කිරීමට තැටි පාලක තුනක්. සාමාන්යයෙන් දෙකක් තිබේ.
  • සූදානම් විසඳුම. ජාලයට සම්බන්ධ වී වින්‍යාසගත කළ යුතු පෙර එකලස් කළ රාක්කයක් අපට ලැබුණි.
  • අවධානයෙන් තාක්ෂණික සහාය. INFINIDAT ඉංජිනේරුවන් නිරන්තරයෙන් ගබඩා පද්ධති ලොග සහ සිදුවීම් විශ්ලේෂණය කරයි, නව ස්ථිරාංග අනුවාද ස්ථාපනය කරයි, සහ වින්‍යාස කිරීමට උදවු කරයි.

අසුරන ලද ඡායාරූප කිහිපයක් මෙන්න:

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

එය ක්රියාත්මක වන්නේ කෙසේද?

වලාකුළ දැනටමත් තමා තුළම දෝෂ ඉවසා සිටියි. එය තනි දෘඪාංග සහ මෘදුකාංග අසමත්වීම් වලින් සේවාදායකයා ආරක්ෂා කරයි. ආපදා-ප්‍රතිරෝධී එක් වෙබ් අඩවියක් තුළ ඇති දැවැන්ත අසාර්ථකත්වයන්ගෙන් ආරක්ෂා වීමට උපකාරී වනු ඇත: නිදසුනක් ලෙස, ගබඩා පද්ධතියක් අසමත් වීම (හෝ බොහෝ විට සිදු වන SDS පොකුරක්), ගබඩා ජාලයක දැවැන්ත දෝෂ ආදිය. හොඳයි, සහ වඩාත්ම වැදගත් දෙය: ගින්නක්, බ්ලැක්අවුට්, රේඩර් අත්පත් කර ගැනීම හෝ පිටසක්වල ගොඩබෑම හේතුවෙන් සම්පූර්ණ වෙබ් අඩවියකට ප්‍රවේශ විය නොහැකි වූ විට එවැනි වලාකුළක් ඉතිරි වේ.

මෙම සියලු අවස්ථා වලදී, සේවාදායක අථත්‍ය යන්ත්‍ර අඛණ්ඩව ක්‍රියා කරයි, සහ මෙන්න ඇයි.

ග්‍රාහක අථත්‍ය යන්ත්‍ර සහිත ඕනෑම ESXi ධාරකයකට ගබඩා පද්ධති දෙකෙන් ඕනෑම එකක් වෙත ප්‍රවේශ විය හැකි පරිදි පොකුරු සැලසුම නිර්මාණය කර ඇත. OST අඩවියේ ගබඩා පද්ධතිය අසමත් වුවහොත්, අථත්‍ය යන්ත්‍ර දිගටම ක්‍රියා කරයි: ඒවා ක්‍රියාත්මක වන ධාරක දත්ත සඳහා NORD හි ගබඩා පද්ධතියට ප්‍රවේශ වේ.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය
පොකුරක සම්බන්ධතා රූප සටහන පෙනෙන්නේ මෙයයි.

මෙම වෙබ් අඩවි දෙකේ SAN රෙදි අතර අන්තර්-ස්විච් සබැඳියක් වින්‍යාස කර ඇති නිසා මෙය කළ හැකිය: Fabric A OST SAN ස්විචය Fabric A NORD SAN ස්විචයට සම්බන්ධ කර ඇති අතර ඒ හා සමානව Fabric B SAN ස්විච සඳහාද සම්බන්ධ වේ.

හොඳයි, SAN කර්මාන්තශාලා වල මෙම සියලු සංකීර්ණතා අර්ථවත් වන පරිදි, සක්‍රීය-ක්‍රියාකාරී අනුකරණය ගබඩා පද්ධති දෙක අතර වින්‍යාස කර ඇත: තොරතුරු එකවරම පාහේ දේශීය සහ දුරස්ථ ගබඩා පද්ධති වෙත ලියා ඇත, RPO = 0. මුල් දත්ත එක් ගබඩා පද්ධතියක ගබඩා කර ඇති අතර එහි අනුරුව අනෙකෙහි ගබඩා කර ඇති බව පෙනේ. දත්ත ගබඩා වෙළුම් මට්ටමින් පිටපත් කර ඇති අතර, VM දත්ත (එහි තැටි, වින්‍යාස ගොනුව, swap ගොනුව, ආදිය) ඒවා මත ගබඩා කර ඇත.

ESXi ධාරකය ප්‍රාථමික පරිමාව සහ එහි අනුරුව එක තැටි උපාංගයක් (ගබඩා උපාංගය) ලෙස දකී. ESXi ධාරකයේ සිට සෑම තැටි උපාංගයකටම මාර්ග 24ක් ඇත:

12 මාර්ග එය දේශීය ගබඩා පද්ධතියට (ප්‍රශස්ත මාර්ග) සම්බන්ධ කරන අතර ඉතිරි 12 දුරස්ථ ගබඩා පද්ධතියට (ප්‍රශස්ත නොවන මාර්ග) සම්බන්ධ කරයි. සාමාන්ය තත්වයකදී, ESXi "ප්රශස්ත" මාර්ග භාවිතා කරමින් දේශීය ගබඩා පද්ධතියේ දත්ත වෙත ප්රවේශ වේ. මෙම ගබඩා පද්ධතිය අසාර්ථක වූ විට, ESXi ප්රශස්ත මාර්ග අහිමි වන අතර "ප්රශස්ත නොවන" වෙත මාරු වේ. රූප සටහනේ පෙනෙන්නේ මෙයයි.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය
ආපදා-ප්‍රතිරෝධී පොකුරේ යෝජනා ක්‍රමය.

සියලුම සේවාදායක ජාල පොදු ජාල රෙදි හරහා අඩවි දෙකටම සම්බන්ධ වේ. සෑම වෙබ් අඩවියක්ම සේවාලාභියාගේ ජාලයන් අවසන් කරන Provider Edge (PE) ක්‍රියාත්මක කරයි. PEs පොදු පොකුරකට ඒකාබද්ධ වේ. එක් අඩවියක PE අසමත් වුවහොත්, සියලුම ගමනාගමනය දෙවන අඩවියට හරවා යවනු ලැබේ. මෙයට ස්තූතිවන්ත වන්නට, PE නොමැතිව ඉතිරිව ඇති වෙබ් අඩවියේ ඇති අතථ්‍ය යන්ත්‍ර සේවාදායකයාට ජාලය හරහා ප්‍රවේශ විය හැකිය.

අපි දැන් බලමු විවිධ අසාර්ථක වීම් වලදී client virtual Machine වලට මොකද වෙන්නේ කියලා. සැහැල්ලු විකල්ප වලින් ආරම්භ කර වඩාත් බරපතල ලෙස අවසන් කරමු - සම්පූර්ණ වෙබ් අඩවියේ අසාර්ථකත්වය. උදාහරණවල, ප්‍රධාන වේදිකාව OST වන අතර, දත්ත අනුරූ සහිත උපස්ථ වේදිකාව NORD වේ.

ග්‍රාහක අතථ්‍ය යන්ත්‍රයට සිදු වන්නේ නම්...

අනුකරණය කිරීමේ සබැඳිය අසාර්ථකයි. අඩවි දෙකෙහි ගබඩා පද්ධති අතර අනුකරණය නතර වේ.
ESXi ක්‍රියා කරන්නේ දේශීය තැටි උපාංග සමඟ පමණි (ප්‍රශස්ත මාර්ග හරහා).
අතථ්‍ය යන්ත්‍ර දිගටම ක්‍රියා කරයි.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

ISL (Inter-Switch Link) කැඩී යයි. නඩුව අසම්භාව්ය. සමහර පිස්සු කැණීම් යන්ත්‍රයක් ස්වාධීන මාර්ගවල ධාවනය වන සහ විවිධ යෙදවුම් හරහා අඩවි වෙත ගෙන එන දෘශ්‍ය මාර්ග කිහිපයක් එකවර හාරා ඇත්නම් මිස. නමුත් කොයි හැටි වුවත්. මෙම අවස්ථාවෙහිදී, ESXi ධාරකයන්ට මාර්ගවලින් අඩක් අහිමි වන අතර ඔවුන්ගේ දේශීය ගබඩා පද්ධති වෙත පමණක් ප්‍රවේශ විය හැක. අනුරූ එකතු කරනු ලැබේ, නමුත් ධාරකයන්ට ඒවාට ප්‍රවේශ වීමට නොහැකි වනු ඇත.

අතථ්‍ය යන්ත්‍ර සාමාන්‍යයෙන් ක්‍රියා කරයි.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

SAN ස්විචය එක් අඩවියක අසමත් වේ. ESXi ධාරක ගබඩා පද්ධතියට සමහර මාර්ග අහිමි වේ. මෙම අවස්ථාවෙහිදී, ස්විචය අසමත් වූ අඩවියේ ධාරක ක්‍රියා කරන්නේ ඔවුන්ගේ HBA එකක් හරහා පමණි.

අතථ්‍ය යන්ත්‍ර සාමාන්‍ය පරිදි ක්‍රියාත්මක වේ.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

එක් අඩවියක ඇති සියලුම SAN ස්විචයන් අසාර්ථක වේ. OST සයිට් එකේ එහෙම විපතක් උනා කියමුකෝ. මෙම අවස්ථාවේදී, මෙම වෙබ් අඩවියේ ESXi ධාරකයන්ට ඔවුන්ගේ තැටි උපාංග වෙත සියලු මාර්ග අහිමි වනු ඇත. සම්මත VMware vSphere HA යාන්ත්‍රණය ක්‍රියාත්මක වේ: එය NORD හි OST අඩවියේ සියලුම අතථ්‍ය යන්ත්‍ර උපරිම තත්පර 140 කින් නැවත ආරම්භ කරයි.

NORD අඩවි ධාරක මත ධාවනය වන අතථ්‍ය යන්ත්‍ර සාමාන්‍යයෙන් ක්‍රියාත්මක වේ.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

ESXi ධාරකය එක් අඩවියක අසාර්ථක වේ. මෙහිදී vSphere HA යාන්ත්‍රණය නැවත ක්‍රියා කරයි: අසාර්ථක වූ ධාරකයේ අථත්‍ය යන්ත්‍ර වෙනත් ධාරක මත නැවත ආරම්භ වේ - එකම හෝ දුරස්ථ අඩවියේ. අතථ්‍ය යන්ත්‍රය නැවත ආරම්භ කිරීමේ කාලය මිනිත්තු 1 දක්වා වේ.

OST අඩවියේ ඇති සියලුම ESXi සත්කාරක අසමත් වුවහොත්, විකල්ප නොමැත: VMs වෙනත් එකකින් නැවත ආරම්භ වේ. නැවත ආරම්භ කිරීමේ කාලය සමාන වේ.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

එක් අඩවියක ගබඩා පද්ධතිය අසාර්ථක වේ. OST අඩවියේ ගබඩා පද්ධතිය අසමත් වේ යැයි කියමු. එවිට OST අඩවියේ ESXi සත්කාරක NORD හි ගබඩා අනුරූ සමඟ වැඩ කිරීමට මාරු වේ. අසාර්ථක ගබඩා පද්ධතිය නැවත සේවයට පැමිණි පසු, බලහත්කාරයෙන් අනුකරණයක් සිදුවනු ඇති අතර ESXi OST ධාරක නැවත දේශීය ගබඩා පද්ධතියට ප්‍රවේශ වීම ආරම්භ කරනු ඇත.

අතථ්‍ය යන්ත්‍ර මේ කාලය පුරාම සාමාන්‍ය පරිදි ක්‍රියා කරයි.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

එක් වෙබ් අඩවියක් අසාර්ථකයි. මෙම අවස්ථාවේදී, vSphere HA යාන්ත්‍රණය හරහා උපස්ථ අඩවියේ සියලුම අතථ්‍ය යන්ත්‍ර නැවත ආරම්භ වේ. VM නැවත ආරම්භ කිරීමේ කාලය තත්පර 140 කි. මෙම අවස්ථාවේදී, අථත්‍ය යන්ත්‍රයේ සියලුම ජාල සැකසුම් සුරකිනු ඇති අතර, එය ජාලය හරහා සේවාදායකයාට ප්‍රවේශ විය හැකිය.

උපස්ථ අඩවියේ යන්ත්‍ර නැවත ආරම්භ කිරීම සුමටව සිදුවන බව සහතික කිරීම සඳහා, එක් එක් වෙබ් අඩවිය පිරී ඇත්තේ අඩක් පමණි. සියලුම අතථ්‍ය යන්ත්‍ර දෙවන, හානියට පත් අඩවියෙන් ගමන් කළහොත් දෙවන භාගය රක්ෂිතයකි.

ආපදා ඔරොත්තු දෙන වලාකුළ: එය ක්‍රියා කරන ආකාරය

දත්ත මධ්‍යස්ථාන දෙකක් මත පදනම් වූ ආපදා-ප්‍රතිරෝධී වලාකුළක් එවැනි අසාර්ථකත්වයන්ගෙන් ආරක්ෂා කරයි.

මෙම සතුට ලාභදායී නොවේ, මන්ද, ප්රධාන සම්පත් වලට අමතරව, දෙවන වෙබ් අඩවියේ රක්ෂිතයක් අවශ්ය වේ. එබැවින්, ව්‍යාපාරික-විවේචනාත්මක සේවාවන් එවැනි වලාකුළක තබා ඇති අතර, එහි දිගුකාලීන අක්‍රිය කාලය විශාල මූල්‍ය හා කීර්තිනාම පාඩු ඇති කරයි, නැතහොත් තොරතුරු පද්ධතිය නියාමකයින් හෝ අභ්‍යන්තර සමාගම් රෙගුලාසි වලින් ආපදා-ප්‍රතිරෝධී අවශ්‍යතාවලට යටත් වේ.

මූලාශ්ර:

  1. www.infinidat.com/sites/default/files/resource-pdfs/DS-INFBOX-190331-US_0.pdf
  2. support.infinidat.com/hc/en-us/articles/207057109-InfiniBox-best-practices-guides

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න