உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)

எந்த ஃபார்ம்வேர் பதிப்பு மிகவும் "சரியானது" மற்றும் "வேலை செய்கிறது"? ஒரு சேமிப்பக அமைப்பு 99,9999% தவறான சகிப்புத்தன்மைக்கு உத்தரவாதம் அளித்தால், மென்பொருள் மேம்படுத்தல் இல்லாமல் கூட அது தடையின்றி வேலை செய்யும் என்று அர்த்தமா? அல்லது, மாறாக, அதிகபட்ச தவறு சகிப்புத்தன்மையைப் பெற, நீங்கள் எப்போதும் சமீபத்திய ஃபார்ம்வேரை நிறுவ வேண்டுமா? இந்த கேள்விகளுக்கு எங்கள் அனுபவத்தின் அடிப்படையில் பதிலளிக்க முயற்சிப்போம்.

சிறிய அறிமுகம்

மென்பொருளின் ஒவ்வொரு பதிப்பும், அது ஒரு இயக்க முறைமையாக இருந்தாலும் அல்லது ஒரு சாதனத்திற்கான இயக்கியாக இருந்தாலும், பெரும்பாலும் குறைபாடுகள்/பிழைகள் மற்றும் பிற "அம்சங்கள்" ஆகியவற்றைக் கொண்டிருக்கும் என்பதை நாம் அனைவரும் புரிந்துகொள்கிறோம் சில நிபந்தனைகளின் கீழ் மட்டுமே. இத்தகைய நுணுக்கங்களின் எண்ணிக்கை மற்றும் முக்கியத்துவம் மென்பொருளின் சிக்கலான தன்மை (செயல்பாடு) மற்றும் அதன் வளர்ச்சியின் போது சோதனையின் தரம் ஆகியவற்றைப் பொறுத்தது. 

பெரும்பாலும், பயனர்கள் "தொழிற்சாலையில் இருந்து ஃபார்ம்வேர்" (பிரபலமான "இது வேலை செய்கிறது, எனவே குழப்ப வேண்டாம்") அல்லது எப்போதும் சமீபத்திய பதிப்பை நிறுவவும் (அவர்களின் புரிதலில், சமீபத்தியது மிகவும் வேலை செய்கிறது). நாங்கள் வேறுபட்ட அணுகுமுறையைப் பயன்படுத்துகிறோம் - பயன்படுத்தப்படும் அனைத்திற்கும் வெளியீட்டு குறிப்புகளைப் பார்க்கிறோம் mClouds மேகத்தில் உபகரணங்கள் மற்றும் ஒவ்வொரு உபகரணத்திற்கும் பொருத்தமான ஃபார்ம்வேரை கவனமாக தேர்ந்தெடுக்கவும்.

அவர்கள் சொல்வது போல் அனுபவத்துடன் இந்த முடிவுக்கு வந்தோம். எங்களின் செயல்பாட்டின் உதாரணத்தைப் பயன்படுத்தி, மென்பொருளின் புதுப்பிப்புகள் மற்றும் விளக்கங்களை நீங்கள் உடனடியாகக் கண்காணிக்கவில்லை என்றால், சேமிப்பக அமைப்புகளின் 99,9999% நம்பகத்தன்மை ஏன் ஒன்றுமில்லை என்பதை நாங்கள் உங்களுக்குக் கூறுவோம். எந்தவொரு விற்பனையாளரிடமிருந்தும் சேமிப்பக அமைப்புகளைப் பயன்படுத்துபவர்களுக்கு எங்கள் வழக்கு பொருத்தமானது, ஏனெனில் எந்தவொரு உற்பத்தியாளரிடமிருந்தும் வன்பொருளிலும் இதேபோன்ற சூழ்நிலை ஏற்படலாம்.

புதிய சேமிப்பக அமைப்பைத் தேர்ந்தெடுப்பது

கடந்த ஆண்டின் இறுதியில், எங்கள் உள்கட்டமைப்பில் ஒரு சுவாரஸ்யமான தரவு சேமிப்பு அமைப்பு சேர்க்கப்பட்டது: IBM FlashSystem 5000 வரிசையில் இருந்து ஒரு ஜூனியர் மாடல், இது வாங்கும் போது Storwize V5010e என்று அழைக்கப்பட்டது. இது இப்போது FlashSystem 5010 என்ற பெயரில் விற்கப்படுகிறது, ஆனால் இது உண்மையில் அதே ஸ்பெக்ட்ரம் மெய்நிகர் உள்ளே அதே வன்பொருள். 

ஒரு ஒருங்கிணைந்த மேலாண்மை அமைப்பின் இருப்பு, ஐபிஎம் ஃப்ளாஷ் சிஸ்டம் இடையே உள்ள முக்கிய வேறுபாடு ஆகும். இளைய தொடரின் மாதிரிகளுக்கு, இது நடைமுறையில் அதிக உற்பத்தி செய்யும் மாதிரிகளிலிருந்து வேறுபட்டதல்ல. ஒரு குறிப்பிட்ட மாதிரியைத் தேர்ந்தெடுப்பது பொருத்தமான வன்பொருள் தளத்தை மட்டுமே வழங்குகிறது, இதன் பண்புகள் ஒன்று அல்லது மற்றொரு செயல்பாட்டைப் பயன்படுத்துவதை சாத்தியமாக்குகின்றன அல்லது அதிக அளவிலான அளவிடுதல் வழங்குகின்றன. மென்பொருள் வன்பொருளை அடையாளம் கண்டு, இந்த தளத்திற்கு தேவையான மற்றும் போதுமான செயல்பாட்டை வழங்குகிறது.

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)IBM FlashSystem 5010

எங்கள் மாடல் 5010 பற்றி சுருக்கமாக. இது ஒரு நுழைவு-நிலை இரட்டை-கட்டுப்படுத்தி தொகுதி சேமிப்பக அமைப்பு. இது NLSAS, SAS, SSD வட்டுகளுக்கு இடமளிக்கும். NVMe ப்ளேஸ்மென்ட் இதில் இல்லை, ஏனெனில் இந்த சேமிப்பக மாடல் NVMe டிரைவ்களின் செயல்திறன் தேவையில்லாத பிரச்சனைகளை தீர்க்கும் வகையில் அமைந்துள்ளது.

காப்பகத் தகவல் அல்லது அடிக்கடி அணுகப்படாத தரவுகளுக்கு இடமளிக்க சேமிப்பக அமைப்பு வாங்கப்பட்டது. எனவே, அதன் செயல்பாட்டின் நிலையான தொகுப்பு எங்களுக்கு போதுமானதாக இருந்தது: டைரிங் (எளிதான அடுக்கு), மெல்லிய ஏற்பாடு. 1000-2000 IOPS அளவில் NLSAS வட்டுகளின் செயல்திறன் எங்களுக்கு மிகவும் திருப்திகரமாக இருந்தது.

எங்கள் அனுபவம் - நாங்கள் எப்படி ஃபார்ம்வேரை சரியான நேரத்தில் புதுப்பிக்கவில்லை

இப்போது மென்பொருள் புதுப்பிப்பு பற்றி. வாங்கும் போது, ​​கணினி ஏற்கனவே Spectrum Virtualize மென்பொருளின் சற்று காலாவதியான பதிப்பைக் கொண்டிருந்தது, அதாவது, 8.2.1.3.

ஃபார்ம்வேர் விளக்கங்களைப் படித்து, புதுப்பிப்பைத் திட்டமிட்டோம் 8.2.1.9. நாம் இன்னும் கொஞ்சம் திறமையாக இருந்திருந்தால், இந்தக் கட்டுரை இருந்திருக்காது - சமீபத்திய ஃபார்ம்வேரில் பிழை ஏற்பட்டிருக்காது. இருப்பினும், சில காரணங்களால், இந்த அமைப்பின் புதுப்பிப்பு ஒத்திவைக்கப்பட்டது.

இதன் விளைவாக, ஒரு சிறிய புதுப்பிப்பு தாமதமானது, இணைப்பில் உள்ள விளக்கத்தைப் போலவே மிகவும் விரும்பத்தகாத படத்திற்கு வழிவகுத்தது: https://www.ibm.com/support/pages/node/6172341

ஆம், அந்த பதிப்பின் ஃபார்ம்வேரில் APAR (அங்கீகரிக்கப்பட்ட நிரல் பகுப்பாய்வு அறிக்கை) HU02104 பொருத்தமானது. இது பின்வருமாறு தோன்றும். சுமையின் கீழ், சில சூழ்நிலைகளில், தற்காலிக சேமிப்பு நிரம்பி வழிகிறது, பின்னர் கணினி பாதுகாப்பு பயன்முறையில் செல்கிறது, இதில் பூலுக்கு I/O ஐ முடக்குகிறது. எங்கள் விஷயத்தில், RAID 3 பயன்முறையில் RAID குழுவிற்கான 6 வட்டுகளை துண்டிப்பது போல் தெரிகிறது. துண்டிப்பு 6 நிமிடங்களுக்கு நிகழ்கிறது. அடுத்து, குளத்தில் உள்ள தொகுதிகளுக்கான அணுகல் மீட்டமைக்கப்பட்டது.

ஐபிஎம் ஸ்பெக்ட்ரம் மெய்நிகராக்கத்தின் பின்னணியில் லாஜிக்கல் நிறுவனங்களின் அமைப்பு மற்றும் பெயரிடல் பற்றி யாருக்கும் தெரியாது என்றால், நான் இப்போது சுருக்கமாக விளக்குகிறேன்.

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)சேமிப்பக அமைப்பு தருக்க கூறுகளின் அமைப்பு

வட்டுகள் MDisk (நிர்வகிக்கப்பட்ட வட்டு) எனப்படும் குழுக்களாக சேகரிக்கப்படுகின்றன. MDisk ஒரு உன்னதமான RAID (0,1,10,5,6) அல்லது மெய்நிகராக்கப்பட்ட ஒன்றாக இருக்கலாம் - DRAID (விநியோக RAID). DRAID ஐப் பயன்படுத்துவது, வரிசையின் செயல்திறனை அதிகரிக்க உங்களை அனுமதிக்கிறது, ஏனெனில்... குழுவில் உள்ள அனைத்து வட்டுகளும் பயன்படுத்தப்படும், மேலும் சில தொகுதிகள் மட்டுமே மீட்டமைக்கப்பட வேண்டும் என்பதாலும், தோல்வியுற்ற வட்டில் இருந்து எல்லா தரவும் அல்ல என்பதாலும், மறுகட்டமைக்கும் நேரம் குறைக்கப்படும்.

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)RAID-5 பயன்முறையில் Distributed RAID (DRAID) ஐப் பயன்படுத்தும் போது வட்டுகள் முழுவதும் தரவுத் தொகுதிகளின் விநியோகம்.

ஒரு வட்டு செயலிழந்தால், DRAID மறுகட்டமைப்பு எவ்வாறு செயல்படுகிறது என்பதற்கான தர்க்கத்தை இந்த வரைபடம் காட்டுகிறது:

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)ஒரு வட்டு தோல்வியடையும் போது DRAID மறுகட்டமைப்பின் தர்க்கம்

அடுத்து, ஒன்று அல்லது அதற்கு மேற்பட்ட MDisக்குகள் பூல் என அழைக்கப்படும். ஒரே குளத்தில், ஒரே வகை வட்டுகளில் வெவ்வேறு RAID/DRAID நிலைகளுடன் MDisk ஐப் பயன்படுத்த பரிந்துரைக்கப்படவில்லை. நாங்கள் இதை ஆழமாகச் செல்ல மாட்டோம், ஏனென்றால் ... பின்வரும் கட்டுரைகளில் ஒன்றில் இதை மறைக்க திட்டமிட்டுள்ளோம். சரி, உண்மையில், பூல் தொகுதிகளாக பிரிக்கப்பட்டுள்ளது, அவை ஹோஸ்ட்களுக்கு ஒன்று அல்லது மற்றொரு தொகுதி அணுகல் நெறிமுறையைப் பயன்படுத்தி வழங்கப்படுகின்றன.

எனவே, விவரிக்கப்பட்டுள்ள சூழ்நிலையின் விளைவாக நாங்கள் APAR HU02104, மூன்று வட்டுகளின் தர்க்கரீதியான தோல்வி காரணமாக, MDisk செயல்படுவதை நிறுத்தியது, இதன் விளைவாக, பூல் மற்றும் தொடர்புடைய தொகுதிகள் தோல்வியடைந்தன.

இந்த அமைப்புகள் மிகவும் புத்திசாலித்தனமாக இருப்பதால், அவை ஐபிஎம் ஸ்டோரேஜ் இன்சைட்ஸ் கிளவுட்-அடிப்படையிலான கண்காணிப்பு அமைப்புடன் இணைக்கப்படலாம், இது சிக்கல் ஏற்பட்டால் தானாகவே ஐபிஎம் ஆதரவிற்கு சேவை கோரிக்கையை அனுப்புகிறது. ஒரு பயன்பாடு உருவாக்கப்பட்டு, IBM வல்லுநர்கள் தொலைநிலையில் கண்டறிதல்களைச் செய்து கணினி பயனரைத் தொடர்புகொள்ளவும். 

இதற்கு நன்றி, சிக்கல் மிக விரைவாக தீர்க்கப்பட்டது மற்றும் எங்கள் கணினியை முன்னர் தேர்ந்தெடுக்கப்பட்ட ஃபார்ம்வேர் 8.2.1.9 க்கு புதுப்பிக்க ஆதரவு சேவையிலிருந்து உடனடி பரிந்துரை பெறப்பட்டது, அது அந்த நேரத்தில் ஏற்கனவே சரி செய்யப்பட்டது. இது உறுதிப்படுத்துகிறது தொடர்புடைய வெளியீட்டு குறிப்பு.

முடிவுகள் மற்றும் எங்கள் பரிந்துரைகள்

சொல்வது போல்: "எல்லாம் நன்றாக இருக்கிறது, அது நன்றாக முடிகிறது." ஃபார்ம்வேரில் உள்ள பிழை கடுமையான சிக்கல்களை ஏற்படுத்தவில்லை - சேவையகங்கள் விரைவில் மற்றும் தரவு இழப்பு இல்லாமல் மீட்டமைக்கப்பட்டன. சில வாடிக்கையாளர்கள் மெய்நிகர் இயந்திரங்களை மறுதொடக்கம் செய்ய வேண்டியிருந்தது, ஆனால் பொதுவாக அனைத்து உள்கட்டமைப்பு கூறுகள் மற்றும் கிளையன்ட் இயந்திரங்களின் தினசரி காப்புப்பிரதிகளை நாங்கள் செய்வதால், நாங்கள் மிகவும் எதிர்மறையான விளைவுகளுக்கு தயாராக இருக்கிறோம். 

உறுதியளிக்கப்பட்ட 99,9999% கிடைக்கும் நம்பகமான அமைப்புகளுக்குக் கூட கவனமும் சரியான நேரத்தில் பராமரிப்பும் தேவை என்பதை உறுதிப்படுத்தியுள்ளோம். சூழ்நிலையின் அடிப்படையில், நாங்கள் பல முடிவுகளை எடுத்துள்ளோம் மற்றும் எங்கள் பரிந்துரைகளைப் பகிர்ந்து கொள்கிறோம்:

  • புதுப்பிப்புகளின் வெளியீட்டைக் கண்காணிப்பது, முக்கியமான சிக்கல்களைத் திருத்துவதற்கான வெளியீட்டுக் குறிப்புகளைப் படிப்பது மற்றும் திட்டமிடப்பட்ட புதுப்பிப்புகளை சரியான நேரத்தில் செயல்படுத்துவது அவசியம்.

    இது ஒரு நிறுவன மற்றும் மிகவும் வெளிப்படையான புள்ளியாகும், இதில் கவனம் செலுத்துவது மதிப்புக்குரியது அல்ல. இருப்பினும், இந்த "நிலை மைதானத்தில்" நீங்கள் மிகவும் எளிதாக தடுமாறலாம். உண்மையில், இந்த தருணம்தான் மேலே விவரிக்கப்பட்ட சிக்கல்களைச் சேர்த்தது. புதுப்பிப்பு விதிமுறைகளை வரையும்போது மிகவும் கவனமாக இருங்கள் மற்றும் அவற்றுடன் இணங்குவதைக் கவனமாகக் கண்காணிக்கவும். இந்த புள்ளி "ஒழுக்கம்" என்ற கருத்துடன் தொடர்புடையது.

  • கணினியை சமீபத்திய மென்பொருள் பதிப்பில் வைத்திருப்பது எப்போதும் நல்லது. மேலும், தற்போதையது ஒரு பெரிய எண் பதவியைக் கொண்டதல்ல, மாறாக பிற்கால வெளியீட்டுத் தேதியைக் கொண்டது. 

    எடுத்துக்காட்டாக, IBM தனது சேமிப்பக அமைப்புகளுக்கு குறைந்தபட்சம் இரண்டு மென்பொருள் வெளியீடுகளை புதுப்பித்த நிலையில் வைத்திருக்கிறது. இதை எழுதும் போது, ​​இவை 8.2 மற்றும் 8.3. 8.2 க்கான புதுப்பிப்புகள் முன்பே வெளிவந்தன. 8.3க்கான இதேபோன்ற மேம்படுத்தல் பொதுவாக சிறிது தாமதத்துடன் வெளியிடப்படும்.

    வெளியீடு 8.3 பல செயல்பாட்டு நன்மைகளைக் கொண்டுள்ளது, எடுத்துக்காட்டாக, ஒன்று அல்லது அதற்கு மேற்பட்ட புதிய வட்டுகளைச் சேர்ப்பதன் மூலம் MDisk (DRAID பயன்முறையில்) விரிவாக்கும் திறன் (இந்த அம்சம் பதிப்பு 8.3.1 இலிருந்து தோன்றியது). இது மிகவும் அடிப்படை செயல்பாடு, ஆனால் 8.2 இல், துரதிருஷ்டவசமாக, அத்தகைய அம்சம் இல்லை.

  • சில காரணங்களால் புதுப்பிக்க இயலவில்லை என்றால், 8.2.1.9 மற்றும் 8.3.1.0 பதிப்புகளுக்கு முந்தைய ஸ்பெக்ட்ரம் மெய்நிகர் மென்பொருளின் பதிப்புகளுக்கு (மேலே விவரிக்கப்பட்ட பிழை பொருத்தமானது), அதன் நிகழ்வின் அபாயத்தைக் குறைக்க, IBM தொழில்நுட்ப ஆதரவு பரிந்துரைக்கிறது. கீழே உள்ள படத்தில் காட்டப்பட்டுள்ளபடி, பூல் மட்டத்தில் கணினி செயல்திறனைக் கட்டுப்படுத்துகிறது (படம் GUI இன் Russified பதிப்பில் எடுக்கப்பட்டது). 10000 IOPS இன் மதிப்பு உதாரணமாகக் காட்டப்பட்டு உங்கள் கணினியின் குணாதிசயங்களின்படி தேர்ந்தெடுக்கப்பட்டது.

உங்கள் அதிக கிடைக்கும் சேமிப்பகத்தில் மென்பொருளைச் சரிபார்ப்பது ஏன் முக்கியம் (99,9999%)IBM சேமிப்பக செயல்திறனைக் கட்டுப்படுத்துகிறது

  • சேமிப்பக அமைப்புகளில் சுமையை சரியாகக் கணக்கிடுவது மற்றும் அதிக சுமைகளைத் தவிர்ப்பது அவசியம். இதைச் செய்ய, நீங்கள் IBM சைஸரைப் பயன்படுத்தலாம் (உங்களுக்கு அணுகல் இருந்தால்), அல்லது கூட்டாளர்களின் உதவி அல்லது மூன்றாம் தரப்பு ஆதாரங்களைப் பயன்படுத்தலாம். சேமிப்பக அமைப்பில் உள்ள சுமை சுயவிவரத்தைப் புரிந்துகொள்வது அவசியம், ஏனெனில் MB/s மற்றும் IOPS இல் செயல்திறன் குறைந்தது பின்வரும் அளவுருக்களைப் பொறுத்து பெரிதும் மாறுபடும்:

    • செயல்பாட்டு வகை: படிக்க அல்லது எழுத,

    • செயல்பாட்டு தொகுதி அளவு,

    • மொத்த I/O ஸ்ட்ரீமில் படிக்கும் மற்றும் எழுதும் செயல்பாடுகளின் சதவீதம்.

    மேலும், தரவுத் தொகுதிகள் எவ்வாறு படிக்கப்படுகின்றன என்பதன் மூலம் செயல்பாடுகளின் வேகம் பாதிக்கப்படுகிறது: தொடர்ச்சியாக அல்லது சீரற்ற வரிசையில். பயன்பாட்டின் பக்கத்தில் பல தரவு அணுகல் செயல்பாடுகளைச் செய்யும்போது, ​​சார்பு செயல்பாடுகளின் கருத்து உள்ளது. இதையும் கணக்கில் எடுத்துக்கொள்வது நல்லது. இவை அனைத்தும் OS, சேமிப்பக அமைப்பு, சேவையகங்கள்/ஹைப்பர்வைசர்களின் செயல்திறன் கவுண்டர்கள் மற்றும் பயன்பாடுகள், DBMS கள் மற்றும் வட்டு வளங்களின் பிற "நுகர்வோர்" ஆகியவற்றின் இயக்க அம்சங்களைப் புரிந்துகொள்வதன் மூலம் மொத்த தரவைக் காண உதவும்.

  • இறுதியாக, காப்புப்பிரதிகள் புதுப்பித்த நிலையில் இருப்பதையும் வேலை செய்வதையும் உறுதிப்படுத்திக் கொள்ளுங்கள். வணிகத்திற்கான ஏற்றுக்கொள்ளக்கூடிய RPO மதிப்புகளின் அடிப்படையில் காப்புப் பிரதி அட்டவணை கட்டமைக்கப்பட வேண்டும், மேலும் ஏற்றுக்கொள்ளக்கூடிய RTO மதிப்பை உறுதிசெய்ய, காப்புப்பிரதிகளின் அவ்வப்போது ஒருமைப்பாடு சோதனைகள் சரிபார்க்கப்பட வேண்டும் (ஒரு சில காப்புப் பிரதி மென்பொருள் விற்பனையாளர்கள் தங்கள் தயாரிப்புகளில் தானியங்கு சரிபார்ப்பைச் செயல்படுத்தியுள்ளனர்).

இறுதிவரை படித்ததற்கு நன்றி.
கருத்துகளில் உங்கள் கேள்விகள் மற்றும் கருத்துகளுக்கு பதிலளிக்க நாங்கள் தயாராக உள்ளோம். மேலும் எங்கள் டெலிகிராம் சேனலுக்கு குழுசேர உங்களை அழைக்கிறோம், இதில் நாங்கள் வழக்கமான விளம்பரங்களை நடத்துகிறோம் (IaaS மீதான தள்ளுபடிகள் மற்றும் VPS இல் 100% வரை விளம்பரக் குறியீடுகளுக்கான பரிசுகள்), சுவாரசியமான செய்திகளை எழுதுகிறோம் மற்றும் Habr வலைப்பதிவில் புதிய கட்டுரைகளை அறிவிக்கிறோம்.

ஆதாரம்: www.habr.com

கருத்தைச் சேர்