பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

ஹே ஹப்ர்!

புத்தாண்டு விடுமுறைக்குப் பிறகு, இரண்டு தளங்களின் அடிப்படையில் பேரழிவைத் தடுக்கும் மேகக்கணியை மீண்டும் தொடங்கினோம். இது எவ்வாறு செயல்படுகிறது என்பதை இன்று நாங்கள் உங்களுக்குச் சொல்வோம், கிளஸ்டரின் தனிப்பட்ட கூறுகள் தோல்வியுற்றால் மற்றும் முழு தளமும் செயலிழக்கும்போது கிளையன்ட் மெய்நிகர் இயந்திரங்களுக்கு என்ன நடக்கும் என்பதைக் காண்பிப்போம் (ஸ்பாய்லர் - அவற்றுடன் எல்லாம் நன்றாக இருக்கிறது).

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது
OST தளத்தில் பேரழிவை எதிர்க்கும் கிளவுட் ஸ்டோரேஜ் சிஸ்டம்.

உள்ளே என்ன

ஹூட்டின் கீழ், கிளஸ்டரில் VMware ESXi ஹைப்பர்வைசர், இரண்டு INFINIDAT InfiniBox F2240 சேமிப்பக அமைப்புகள், Cisco Nexus நெட்வொர்க் கருவிகள் மற்றும் Brocade SAN சுவிட்சுகள் கொண்ட Cisco UCS சேவையகங்கள் உள்ளன. கிளஸ்டர் இரண்டு தளங்களாக பிரிக்கப்பட்டுள்ளது - OST மற்றும் NORD, அதாவது ஒவ்வொரு தரவு மையமும் ஒரே மாதிரியான உபகரணங்களைக் கொண்டுள்ளது. உண்மையில், இதுவே பேரழிவை எதிர்க்கும் திறன் கொண்டது.

ஒரு தளத்தில், முக்கிய கூறுகளும் நகலெடுக்கப்படுகின்றன (புரவலன்கள், SAN சுவிட்சுகள், நெட்வொர்க்கிங்).
இரண்டு தளங்களும் பிரத்யேக ஃபைபர் ஆப்டிக் வழிகளால் இணைக்கப்பட்டுள்ளன, மேலும் ஒதுக்கப்பட்டுள்ளன.

சேமிப்பக அமைப்புகளைப் பற்றி சில வார்த்தைகள். NetApp இல் பேரழிவைத் தடுக்கும் கிளவுட்டின் முதல் பதிப்பை உருவாக்கினோம். இங்கே நாங்கள் INFINIDAT ஐத் தேர்ந்தெடுத்தோம், அதற்கான காரணம் இங்கே:

  • ஆக்டிவ்-ஆக்டிவ் ரெப்ளிகேஷன் விருப்பம். சேமிப்பக அமைப்புகளில் ஒன்று முற்றிலும் தோல்வியடைந்தாலும் மெய்நிகர் இயந்திரம் செயல்பட அனுமதிக்கிறது. நகலெடுப்பதைப் பற்றி பின்னர் கூறுவேன்.
  • கணினி தவறு சகிப்புத்தன்மையை அதிகரிக்க மூன்று வட்டு கட்டுப்படுத்திகள். பொதுவாக இரண்டு உள்ளன.
  • தயார் தீர்வு. பிணையத்துடன் இணைக்கப்பட்டு உள்ளமைக்கப்பட வேண்டிய முன் கூட்டிணைக்கப்பட்ட ரேக்கைப் பெற்றோம்.
  • கவனமுள்ள தொழில்நுட்ப ஆதரவு. INFINIDAT பொறியாளர்கள் சேமிப்பக அமைப்பு பதிவுகள் மற்றும் நிகழ்வுகளை தொடர்ந்து ஆய்வு செய்கிறார்கள், புதிய ஃபார்ம்வேர் பதிப்புகளை நிறுவுகிறார்கள் மற்றும் உள்ளமைவுக்கு உதவுகிறார்கள்.

அன்பேக் செய்வதிலிருந்து சில புகைப்படங்கள் இங்கே:

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

அது எப்படி வேலை செய்கிறது

மேகம் ஏற்கனவே தனக்குள்ளேயே தவறுகளை பொறுத்துக்கொள்கிறது. ஒற்றை வன்பொருள் மற்றும் மென்பொருள் தோல்விகளில் இருந்து வாடிக்கையாளரைப் பாதுகாக்கிறது. பேரழிவு-எதிர்ப்பு ஒரு தளத்தில் உள்ள பாரிய தோல்விகளிலிருந்து பாதுகாக்க உதவும்: எடுத்துக்காட்டாக, சேமிப்பக அமைப்பின் தோல்வி (அல்லது SDS கிளஸ்டர், இது அடிக்கடி நிகழும் 🙂), சேமிப்பக நெட்வொர்க்கில் பாரிய பிழைகள் போன்றவை. நல்லது, மிக முக்கியமாக: தீ, இருட்டடிப்பு, ரைடர் கையகப்படுத்தல் அல்லது ஏலியன் தரையிறக்கம் காரணமாக ஒரு முழு தளமும் அணுக முடியாததாக இருக்கும்போது அத்தகைய மேகம் சேமிக்கிறது.

இந்த எல்லா நிகழ்வுகளிலும், கிளையன்ட் மெய்நிகர் இயந்திரங்கள் தொடர்ந்து செயல்படுகின்றன, அதற்கான காரணம் இங்கே உள்ளது.

கிளையன்ட் மெய்நிகர் இயந்திரங்களைக் கொண்ட எந்த ESXi ஹோஸ்டும் இரண்டு சேமிப்பக அமைப்புகளில் ஏதேனும் ஒன்றை அணுகும் வகையில் கிளஸ்டர் வடிவமைப்பு வடிவமைக்கப்பட்டுள்ளது. OST தளத்தில் உள்ள சேமிப்பக அமைப்பு தோல்வியுற்றால், மெய்நிகர் இயந்திரங்கள் தொடர்ந்து செயல்படும்: அவை இயங்கும் ஹோஸ்ட்கள் தரவுக்காக NORD இல் உள்ள சேமிப்பக அமைப்பை அணுகும்.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது
ஒரு கிளஸ்டரில் உள்ள இணைப்பு வரைபடம் இப்படித்தான் இருக்கும்.

இரண்டு தளங்களின் SAN துணிகளுக்கு இடையே ஒரு இடை-சுவிட்ச் இணைப்பு கட்டமைக்கப்பட்டுள்ளதால் இது சாத்தியமாகும்: Fabric A OST SAN சுவிட்ச் Fabric A NORD SAN சுவிட்ச்சுடன் இணைக்கப்பட்டுள்ளது, அதே போல் Fabric B SAN சுவிட்சுகளுக்கும்.

சரி, SAN தொழிற்சாலைகளின் அனைத்து நுணுக்கங்களும் அர்த்தமுள்ளதாக இருக்கும் வகையில், இரண்டு சேமிப்பக அமைப்புகளுக்கு இடையில் செயலில்-செயலில் உள்ள பிரதியமைப்பு கட்டமைக்கப்படுகிறது: தகவல் கிட்டத்தட்ட ஒரே நேரத்தில் உள்ளூர் மற்றும் தொலைநிலை சேமிப்பக அமைப்புகளுக்கு எழுதப்படுகிறது, RPO = 0. அசல் தரவு ஒரு சேமிப்பக அமைப்பில் சேமிக்கப்பட்டுள்ளது, அதன் பிரதி மற்றொன்றில் சேமிக்கப்படுகிறது. தரவு சேமிப்பக அளவுகளின் மட்டத்தில் நகலெடுக்கப்படுகிறது, மேலும் VM தரவு (அதன் வட்டுகள், உள்ளமைவு கோப்பு, இடமாற்று கோப்பு போன்றவை) அவற்றில் சேமிக்கப்படும்.

ESXi ஹோஸ்ட் முதன்மை தொகுதியையும் அதன் பிரதியையும் ஒரு வட்டு சாதனமாக (சேமிப்பக சாதனம்) பார்க்கிறது. ESXi ஹோஸ்டிலிருந்து ஒவ்வொரு வட்டு சாதனத்திற்கும் 24 பாதைகள் உள்ளன:

12 பாதைகள் அதை உள்ளூர் சேமிப்பக அமைப்புடன் இணைக்கின்றன (உகந்த பாதைகள்), மீதமுள்ள 12 தொலைநிலை சேமிப்பக அமைப்புடன் (உகந்தமற்ற பாதைகள்). ஒரு சாதாரண சூழ்நிலையில், "உகந்த" பாதைகளைப் பயன்படுத்தி உள்ளூர் சேமிப்பக அமைப்பில் உள்ள தரவை ESXi அணுகுகிறது. இந்த சேமிப்பக அமைப்பு தோல்வியடையும் போது, ​​ESXi உகந்த பாதைகளை இழந்து "உகந்ததல்ல" என்பதற்கு மாறுகிறது. வரைபடத்தில் இது போல் தெரிகிறது.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது
பேரிடர் தடுப்புக் குழுவின் திட்டம்.

அனைத்து கிளையன்ட் நெட்வொர்க்குகளும் பொதுவான பிணைய துணி மூலம் இரு தளங்களுடனும் இணைக்கப்பட்டுள்ளன. ஒவ்வொரு தளமும் ஒரு Provider Edge (PE)ஐ ​​இயக்குகிறது, அதில் கிளையண்டின் நெட்வொர்க்குகள் நிறுத்தப்படும். PE கள் ஒரு பொதுவான கிளஸ்டராக இணைக்கப்பட்டுள்ளன. ஒரு தளத்தில் PE தோல்வியுற்றால், அனைத்து போக்குவரத்தும் இரண்டாவது தளத்திற்கு திருப்பி விடப்படும். இதற்கு நன்றி, PE இல்லாத தளத்தில் இருந்து மெய்நிகர் இயந்திரங்கள் கிளையன்ட் நெட்வொர்க்கில் அணுகக்கூடியதாக இருக்கும்.

பல்வேறு தோல்விகளின் போது கிளையன்ட் மெய்நிகர் இயந்திரங்களுக்கு என்ன நடக்கும் என்று இப்போது பார்க்கலாம். இலகுவான விருப்பங்களுடன் தொடங்குவோம் மற்றும் மிகவும் தீவிரமான - முழு தளத்தின் தோல்வியுடன் முடிப்போம். எடுத்துக்காட்டுகளில், முக்கிய இயங்குதளம் OST ஆகவும், தரவுப் பிரதிகளுடன் காப்புப்பிரதி இயங்குதளம் NORD ஆகவும் இருக்கும்.

கிளையன்ட் மெய்நிகர் இயந்திரத்திற்கு என்ன நடக்கும் என்றால்...

பிரதி இணைப்பு தோல்வியடைந்தது. இரண்டு தளங்களின் சேமிப்பக அமைப்புகளுக்கிடையேயான பிரதிபலிப்பு நிறுத்தப்படும்.
ESXi உள்ளூர் வட்டு சாதனங்களுடன் மட்டுமே வேலை செய்யும் (உகந்த பாதைகள் வழியாக).
மெய்நிகர் இயந்திரங்கள் தொடர்ந்து வேலை செய்கின்றன.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

ISL (இன்டர்-ஸ்விட்ச் இணைப்பு) உடைகிறது. வழக்கு சாத்தியமில்லை. சில வெறித்தனமான அகழ்வாராய்ச்சியாளர் பல ஆப்டிகல் வழிகளை ஒரே நேரத்தில் தோண்டி எடுக்காத வரை, அவை சுயாதீனமான பாதைகளில் இயங்கும் மற்றும் வெவ்வேறு உள்ளீடுகள் மூலம் தளங்களுக்கு கொண்டு வரப்படும். எப்படி இருந்தாலும். இந்த வழக்கில், ESXi ஹோஸ்ட்கள் பாதி பாதைகளை இழக்கின்றன மற்றும் அவற்றின் உள்ளூர் சேமிப்பக அமைப்புகளை மட்டுமே அணுக முடியும். பிரதிகள் சேகரிக்கப்படுகின்றன, ஆனால் ஹோஸ்ட்களால் அவற்றை அணுக முடியாது.

மெய்நிகர் இயந்திரங்கள் சாதாரணமாக வேலை செய்கின்றன.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

SAN சுவிட்ச் ஒரு தளத்தில் தோல்வியடைகிறது. ESXi ஹோஸ்ட்கள் சேமிப்பக அமைப்பிற்கான சில பாதைகளை இழக்கின்றன. இந்த வழக்கில், ஸ்விட்ச் தோல்வியடைந்த தளத்தில் உள்ள ஹோஸ்ட்கள் அவற்றின் HBAகளில் ஒன்றின் மூலம் மட்டுமே செயல்படும்.

மெய்நிகர் இயந்திரங்கள் தொடர்ந்து இயங்குகின்றன.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

ஒரு தளத்தில் உள்ள அனைத்து SAN சுவிட்சுகளும் தோல்வியடைகின்றன. OST தளத்தில் இப்படி ஒரு பேரழிவு நடந்ததாக வைத்துக் கொள்வோம். இந்த வழக்கில், இந்த தளத்தில் உள்ள ESXi ஹோஸ்ட்கள் தங்கள் வட்டு சாதனங்களுக்கான அனைத்து பாதைகளையும் இழக்கும். நிலையான VMware vSphere HA பொறிமுறையானது செயல்பாட்டுக்கு வருகிறது: இது NORD இல் உள்ள OST தளத்தின் அனைத்து மெய்நிகர் இயந்திரங்களையும் அதிகபட்சமாக 140 வினாடிகளில் மறுதொடக்கம் செய்யும்.

NORD தள ஹோஸ்ட்களில் இயங்கும் மெய்நிகர் இயந்திரங்கள் சாதாரணமாக இயங்குகின்றன.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

ESXi ஹோஸ்ட் ஒரு தளத்தில் தோல்வியடைகிறது. இங்கே vSphere HA மெக்கானிசம் மீண்டும் வேலை செய்கிறது: தோல்வியடைந்த ஹோஸ்டில் இருந்து மெய்நிகர் இயந்திரங்கள் மற்ற ஹோஸ்ட்களில் மறுதொடக்கம் செய்யப்படுகின்றன - அதே அல்லது தொலை தளத்தில். மெய்நிகர் இயந்திரத்தை மறுதொடக்கம் செய்யும் நேரம் 1 நிமிடம் வரை ஆகும்.

OST தளத்தின் அனைத்து ESXi ஹோஸ்ட்களும் தோல்வியுற்றால், எந்த விருப்பங்களும் இல்லை: VMகள் மற்றொன்றில் மறுதொடக்கம் செய்யப்படும். மறுதொடக்கம் நேரம் அதே தான்.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

ஒரு தளத்தில் சேமிப்பக அமைப்பு தோல்வியடைகிறது. OST தளத்தில் சேமிப்பக அமைப்பு தோல்வியடைகிறது என்று வைத்துக்கொள்வோம். பின்னர் OST தளத்தின் ESXi ஹோஸ்ட்கள் NORD இல் உள்ள சேமிப்பக பிரதிகளுடன் வேலை செய்ய மாறுகின்றன. தோல்வியடைந்த சேமிப்பக அமைப்பு சேவைக்குத் திரும்பிய பிறகு, கட்டாய நகலெடுப்பு நிகழும் மற்றும் ESXi OST ஹோஸ்ட்கள் மீண்டும் உள்ளூர் சேமிப்பக அமைப்பை அணுகத் தொடங்கும்.

மெய்நிகர் இயந்திரங்கள் இந்த நேரத்தில் சாதாரணமாக வேலை செய்கின்றன.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

தளங்களில் ஒன்று தோல்வியுற்றது. இந்த வழக்கில், அனைத்து மெய்நிகர் இயந்திரங்களும் vSphere HA பொறிமுறையின் மூலம் காப்புப் பிரதி தளத்தில் மறுதொடக்கம் செய்யப்படும். VM மறுதொடக்கம் நேரம் 140 வினாடிகள். இந்த வழக்கில், மெய்நிகர் இயந்திரத்தின் அனைத்து பிணைய அமைப்புகளும் சேமிக்கப்படும், மேலும் இது பிணையத்தில் கிளையன்ட் அணுகக்கூடியதாக இருக்கும்.

காப்புப் பிரதி தளத்தில் இயந்திரங்களின் மறுதொடக்கம் சீராக நடைபெறுவதை உறுதிசெய்ய, ஒவ்வொரு தளமும் பாதி மட்டுமே நிரம்பியுள்ளது. அனைத்து மெய்நிகர் இயந்திரங்களும் இரண்டாவது, சேதமடைந்த தளத்திலிருந்து நகர்ந்தால், இரண்டாவது பாதி ஒரு இருப்பு ஆகும்.

பேரழிவை எதிர்க்கும் கிளவுட்: இது எவ்வாறு செயல்படுகிறது

இரண்டு தரவு மையங்களை அடிப்படையாகக் கொண்ட பேரழிவை எதிர்க்கும் மேகம் அத்தகைய தோல்விகளிலிருந்து பாதுகாக்கிறது.

இந்த இன்பம் மலிவானது அல்ல, ஏனெனில், முக்கிய ஆதாரங்களுக்கு கூடுதலாக, இரண்டாவது தளத்தில் ஒரு இருப்பு தேவைப்படுகிறது. எனவே, வணிக-முக்கியமான சேவைகள் அத்தகைய கிளவுட்டில் வைக்கப்படுகின்றன, நீண்ட கால வேலையில்லா நேரம் பெரிய நிதி மற்றும் நற்பெயர் இழப்புகளை ஏற்படுத்துகிறது அல்லது தகவல் அமைப்பு கட்டுப்பாட்டாளர்கள் அல்லது உள் நிறுவன விதிமுறைகளின் பேரழிவு-எதிர்ப்புத் தேவைகளுக்கு உட்பட்டது.

ஆதாரங்கள்:

  1. www.infinidat.com/sites/default/files/resource-pdfs/DS-INFBOX-190331-US_0.pdf
  2. support.infinidat.com/hc/en-us/articles/207057109-InfiniBox-best-practices-guides

ஆதாரம்: www.habr.com

கருத்தைச் சேர்