ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)

වඩාත්ම "නිවැරදි" සහ "වැඩ කරන" කුමන ස්ථිරාංග අනුවාදයද? ගබඩා පද්ධතියක් 99,9999% ක දෝෂ ඉවසීමක් සහතික කරන්නේ නම්, එයින් අදහස් කරන්නේ මෘදුකාංග යාවත්කාලීන කිරීමකින් තොරව පවා එය බාධාවකින් තොරව ක්‍රියා කරන බව ද? නැතහොත්, ඊට පටහැනිව, උපරිම දෝෂ ඉවසීම ලබා ගැනීම සඳහා, ඔබ සැමවිටම නවතම ස්ථිරාංග ස්ථාපනය කළ යුතුද? අපගේ අත්දැකීම් මත පදනම්ව මෙම ප්රශ්නවලට පිළිතුරු දීමට අපි උත්සාහ කරමු.

කුඩා හැඳින්වීමක්

මෘදුකාංගයේ සෑම අනුවාදයක්ම, එය මෙහෙයුම් පද්ධතියක් හෝ උපාංගයක් සඳහා ධාවකයක් වේවා, බොහෝ විට දෝෂ/දෝෂ සහ වෙනත් "විශේෂාංග" අඩංගු වන අතර එය උපකරණවල සේවා කාලය අවසන් වන තෙක් හෝ "විවෘත" වන තුරු "පෙන්වන්නේ නැත" යම් යම් කොන්දේසි යටතේ පමණි. එවැනි සූක්ෂ්මතාවයන් ගණන සහ වැදගත්කම රඳා පවතින්නේ මෘදුකාංගයේ සංකීර්ණත්වය (ක්‍රියාකාරීත්වය) සහ එහි සංවර්ධනය අතරතුර පරීක්ෂා කිරීමේ ගුණාත්මකභාවය මත ය. 

බොහෝ විට, පරිශීලකයන් "කර්මාන්තශාලාවේ සිට ස්ථිරාංග" (ප්රසිද්ධ "එය ක්රියා කරයි, ඒ නිසා එය අවුල් නොකරන්න") මත රැඳී සිටියි හෝ සෑම විටම නවතම අනුවාදය ස්ථාපනය කරන්න (ඔවුන්ගේ අවබෝධය අනුව, නවතම යනු වඩාත්ම වැඩ කිරීමයි). අපි වෙනස් ප්‍රවේශයක් භාවිතා කරමු - අපි භාවිතා කරන සෑම දෙයක් සඳහාම නිකුත් කිරීමේ සටහන් දෙස බලමු mClouds වලාකුළෙහි උපකරණ සහ එක් එක් උපකරණ සඳහා සුදුසු ස්ථිරාංග ප්රවේශමෙන් තෝරා ගන්න.

ඔවුන් පවසන පරිදි අපි මෙම නිගමනයට පැමිණියේ අත්දැකීම් සමඟිනි. අපගේ මෙහෙයුම් උදාහරණය භාවිතා කරමින්, ඔබ මෘදුකාංග යාවත්කාලීන කිරීම් සහ විස්තර ක්ෂණිකව නිරීක්ෂණය නොකරන්නේ නම්, ගබඩා පද්ධතිවල පොරොන්දු වූ 99,9999% විශ්වසනීයත්වය කිසිවක් අදහස් කරන්නේ මන්දැයි අපි ඔබට කියන්නෙමු. ඕනෑම නිෂ්පාදකයෙකුගේ දෘඩාංග සමඟ සමාන තත්වයක් සිදුවිය හැකි බැවින්, ඕනෑම වෙළෙන්දෙකුගෙන් ගබඩා පද්ධති භාවිතා කරන්නන් සඳහා අපගේ නඩුව සුදුසු වේ.

නව ගබඩා පද්ධතියක් තෝරා ගැනීම

පසුගිය වසර අවසානයේදී, අපගේ යටිතල ව්‍යුහයට සිත්ගන්නා දත්ත ගබඩා පද්ධතියක් එක් කරන ලදී: IBM FlashSystem 5000 රේඛාවෙන් කනිෂ්ඨ ආකෘතියක්, එය මිලදී ගන්නා අවස්ථාවේදී Storwize V5010e ලෙස හැඳින්වේ. දැන් එය FlashSystem 5010 නමින් විකුණනු ලැබේ, නමුත් ඇත්ත වශයෙන්ම එය ඇතුළත එකම Spectrum Virtualize සහිත එකම දෘඪාංග පදනම වේ. 

ඒකාබද්ධ කළමනාකරණ පද්ධතියක් තිබීම, මාර්ගය වන විට, IBM FlashSystem අතර ඇති ප්‍රධාන වෙනසයි. තරුණ මාලාවේ ආකෘති සඳහා, එය ප්රායෝගිකව වඩා ඵලදායී අයගේ ආකෘති වලින් වෙනස් නොවේ. නිශ්චිත ආකෘතියක් තෝරාගැනීම සුදුසු දෘඪාංග පදනමක් පමණක් සපයයි, එහි ලක්ෂණ එක් හෝ තවත් ක්රියාකාරිත්වයක් භාවිතා කිරීමට හෝ ඉහළ මට්ටමේ පරිමාණයක් ලබා දීමට හැකි වේ. මෘදුකාංගය දෘඪාංග හඳුනාගෙන මෙම වේදිකාව සඳහා අවශ්ය සහ ප්රමාණවත් ක්රියාකාරිත්වය සපයයි.

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)IBM FlashSystem 5010

අපගේ මාදිලිය 5010 ගැන කෙටියෙන්. මෙය ප්‍රවේශ මට්ටමේ ද්විත්ව පාලක බ්ලොක් ගබඩා පද්ධතියකි. එය NLSAS, SAS, SSD තැටි සඳහා පහසුකම් සැලසිය හැක. NVMe ධාවකවල ක්‍රියාකාරිත්වය අවශ්‍ය නොවන ගැටළු විසඳීම සඳහා මෙම ගබඩා ආකෘතිය ස්ථානගත කර ඇති බැවින් NVMe ස්ථානගත කිරීම එහි නොමැත.

ගබඩා පද්ධතිය මිලදී ගෙන ඇත්තේ සංරක්ෂිත තොරතුරු හෝ නිතර ප්‍රවේශ නොවන දත්ත සඳහා ඉඩ සැලසීමටය. එබැවින්, එහි ක්රියාකාරිත්වයේ සම්මත කට්ටලය අපට ප්රමාණවත් විය: Tiering (Easy Tier), Thin Provision. 1000-2000 IOPS මට්ටමේ NLSAS තැටිවල කාර්ය සාධනය ද අපට බෙහෙවින් සතුටුදායක විය.

අපගේ අත්දැකීම් - අපි නියමිත වේලාවට ස්ථිරාංග යාවත්කාලීන නොකළ ආකාරය

දැන් මෘදුකාංග යාවත්කාලීන කිරීම ගැන. මිලදී ගන්නා අවස්ථාවේදී, පද්ධතිය සතුව දැනටමත් Spectrum Virtualize මෘදුකාංගයේ තරමක් යල් පැන ගිය අනුවාදයක් තිබුණි, එනම්, 8.2.1.3.

අපි ස්ථිරාංග විස්තර අධ්‍යයනය කර යාවත්කාලීන කිරීමට සැලසුම් කළෙමු 8.2.1.9. අපි තව ටිකක් කාර්යක්ෂම වූවා නම්, මෙම ලිපිය නොපවතිනු ඇත - දෝෂය වඩාත් මෑත ස්ථිරාංග මත සිදු නොවනු ඇත. කෙසේ වෙතත්, යම් යම් හේතු නිසා, මෙම පද්ධතිය යාවත්කාලීන කිරීම කල් දමන ලදී.

එහි ප්‍රතිඵලයක් වශයෙන්, මඳක් යාවත්කාලීන ප්‍රමාදයක් සබැඳියේ ඇති විස්තරයේ මෙන් අතිශය අප්‍රසන්න පින්තූරයකට හේතු විය: https://www.ibm.com/support/pages/node/6172341

ඔව්, එම අනුවාදයේ ස්ථිරාංගයේ ඊනියා APAR (බලය ලත් වැඩසටහන් විශ්ලේෂණ වාර්තාව) HU02104 අදාළ විය. එය පහත පරිදි දිස්වේ. පැටවීම යටතේ, යම් යම් තත්වයන් යටතේ, හැඹිලිය පිටාර ගැලීමට පටන් ගනී, එවිට පද්ධතිය ආරක්ෂිත මාදිලියට යයි, එය සංචිතය සඳහා I/O අක්රිය කරයි. අපගේ නඩුවේදී, එය RAID 3 මාදිලියේ RAID කණ්ඩායමක් සඳහා තැටි 6 ක් විසන්ධි කිරීම මෙන් දිස් විය.විසන්ධි කිරීම විනාඩි 6 ක් සඳහා සිදු වේ. ඊළඟට, තටාකයේ වෙළුම් වෙත ප්රවේශය ප්රතිෂ්ඨාපනය වේ.

IBM Spectrum Virtualize සන්දර්භය තුළ තාර්කික ආයතනවල ව්‍යුහය සහ නම් කිරීම පිළිබඳව කිසිවෙකු නොදන්නා නම්, මම දැන් කෙටියෙන් පැහැදිලි කරමි.

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)ගබඩා පද්ධති තාර්කික මූලද්රව්යවල ව්යුහය

තැටි MDisk (කළමනාකරනය කළ තැටිය) ලෙස හඳුන්වන කණ්ඩායම් වලට එකතු කරනු ලැබේ. MDisk සම්භාව්‍ය RAID (0,1,10,5,6) හෝ අථත්‍ය කළ එකක් විය හැක - DRAID (බෙදාහැරුණු RAID). DRAID භාවිතා කිරීමෙන් ඔබට අරාවේ කාර්ය සාධනය වැඩි කිරීමට ඉඩ සලසයි, මන්ද... සමූහයේ සියලුම තැටි භාවිතා කරනු ලබන අතර, නැවත ගොඩනැඟීමේ කාලය අඩු වනු ඇත, සමහර බ්ලොක් පමණක් ප්රතිෂ්ඨාපනය කිරීමට අවශ්ය වනු ඇත, සහ අසාර්ථක තැටියේ සියලු දත්ත නොවේ.

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)RAID-5 මාදිලියේ Distributed RAID (DRAID) භාවිතා කරන විට තැටි හරහා දත්ත අවහිර කිරීම් බෙදා හැරීම.

එක් තැටියක් අසාර්ථක වූ විට DRAID නැවත ගොඩනැගීම ක්‍රියා කරන ආකාරය පිළිබඳ තර්කය මෙම රූප සටහන පෙන්වයි:

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)එක් තැටියක් අසමත් වූ විට DRAID නැවත ගොඩනැගීමේ තර්කනය

ඊළඟට, MDisk එකක් හෝ කිහිපයක් ඊනියා සංචිතයක් සාදයි. එකම සංචිතය තුළ, එකම වර්ගයේ තැටි මත විවිධ RAID/DRAID මට්ටම් සහිත MDisk භාවිතා කිරීම නිර්දේශ නොකරයි. අපි මේ ගැන ගැඹුරට නොයන්නෙමු, මන්ද ... පහත ලිපි වලින් එකකින් මෙය ආවරණය කිරීමට අපි සැලසුම් කරමු. හොඳයි, ඇත්ත වශයෙන්ම, සංචිතය වෙළුම් වලට බෙදා ඇත, ඒවා සත්කාරක වෙත එක් හෝ තවත් බ්ලොක් ප්‍රවේශ ප්‍රොටෝකෝලය භාවිතයෙන් ඉදිරිපත් කෙරේ.

ඉතින්, අපි විස්තර කර ඇති තත්වයේ ප්රතිඵලයක් ලෙස APAR HU02104, තැටි තුනක තාර්කික අසාර්ථකත්වය හේතුවෙන්, MDisk ක්‍රියාකාරී වීම නැවැත්වූ අතර, එමඟින්, සංචිතය සහ ඊට අනුරූප වෙළුම් අසාර්ථක විය.

මෙම පද්ධති ඉතා දක්ෂ බැවින්, ඒවා IBM Storage Insights cloud-පාදක අධීක්ෂණ පද්ධතියට සම්බන්ධ කළ හැකි අතර, ගැටලුවක් ඇති වුවහොත් IBM සහාය වෙත ස්වයංක්‍රීයව සේවා ඉල්ලීමක් යවයි. යෙදුමක් සාදනු ලබන අතර IBM විශේෂඥයින් දුරස්ථව රෝග විනිශ්චය සිදු කර පද්ධති පරිශීලකයා අමතන්න. 

මෙයට ස්තූතිවන්ත වන්නට, ගැටළුව ඉතා ඉක්මනින් විසඳා ඇති අතර අපගේ පද්ධතිය කලින් තෝරාගත් ස්ථිරාංග 8.2.1.9 වෙත යාවත්කාලීන කිරීම සඳහා ආධාරක සේවාවෙන් කඩිනම් නිර්දේශයක් ලැබුණි, එය ඒ වන විටත් සවි කර ඇත. එය තහවුරු කරයි අනුරූප නිකුත් කිරීමේ සටහන.

ප්රතිඵල සහ අපගේ නිර්දේශ

කියමනට අනුව: "සියල්ල හොඳයි, එය හොඳින් අවසන් වේ." ස්ථිරාංගයේ දෝෂය බරපතල ගැටළු ඇති කළේ නැත - සේවාදායකයන් හැකි ඉක්මනින් සහ දත්ත නැතිවීමකින් තොරව ප්රතිෂ්ඨාපනය කරන ලදී. සමහර සේවාලාභීන්ට අතථ්‍ය යන්ත්‍ර නැවත ආරම්භ කිරීමට සිදු විය, නමුත් සාමාන්‍යයෙන් අපි සියලු යටිතල පහසුකම් මූලද්‍රව්‍ය සහ සේවාදායක යන්ත්‍රවල දෛනික උපස්ථ කරන බැවින් සාමාන්‍යයෙන් අපි වඩාත් negative ණාත්මක ප්‍රතිවිපාක සඳහා සූදානම්ව සිටිමු. 

99,9999% පොරොන්දු වූ ලබා ගත හැකි විශ්වාසනීය පද්ධති පවා අවධානය සහ කාලෝචිත නඩත්තු කිරීම අවශ්‍ය බව අපට තහවුරු කර ඇත. තත්වය මත පදනම්ව, අපි අප වෙනුවෙන් නිගමන ගණනාවක් ගෙන ඇති අතර අපගේ නිර්දේශ බෙදා ගන්නෙමු:

  • යාවත්කාලීන නිකුත් කිරීම අධීක්ෂණය කිරීම, විභව තීරණාත්මක ගැටළු නිවැරදි කිරීම සඳහා නිකුත් කිරීම් සටහන් අධ්‍යයනය කිරීම සහ නියමිත වේලාවට සැලසුම් කළ යාවත්කාලීන කිරීම් සිදු කිරීම අත්‍යවශ්‍ය වේ.

    මෙය සංවිධානාත්මක හා තරමක් පැහැදිලි කරුණක් වන අතර, එය අවධානය යොමු කිරීම වටී නැති බව පෙනේ. කෙසේ වෙතත්, මෙම "මට්ටමේ බිම" මත ඔබට ඉතා පහසුවෙන් පැකිලෙන්න පුළුවන්. ඇත්ත වශයෙන්ම, ඉහත විස්තර කර ඇති කරදර එකතු කළේ මේ මොහොතයි. යාවත්කාලීන රෙගුලාසි සකස් කිරීමේදී ඉතා ප්‍රවේශම් වන්න සහ ඒවාට අනුකූල වීම නොඅඩු ප්‍රවේශමෙන් නිරීක්ෂණය කරන්න. මෙම කරුණ "විනය" යන සංකල්පයට වඩා සම්බන්ධ වේ.

  • සෑම විටම නවතම මෘදුකාංග අනුවාදය සමඟ පද්ධතිය තබා ගැනීම වඩා හොඳය. එපමණක් නොව, වත්මන් එක විශාල සංඛ්‍යාත්මක තනතුරක් ඇති එකක් නොව, පසුව නිකුත් කරන දිනයක් සහිත එකක් වේ. 

    උදාහරණයක් ලෙස, IBM එහි ගබඩා පද්ධති සඳහා අවම වශයෙන් මෘදුකාංග නිකුතු දෙකක්වත් යාවත්කාලීන කරයි. මෙය ලියන අවස්ථාව වන විට මේවා 8.2 සහ 8.3 වේ. 8.2 සඳහා යාවත්කාලීන කිරීම් කලින් එළියට එයි. 8.3 සඳහා සමාන යාවත්කාලීනයක් සාමාන්‍යයෙන් සුළු ප්‍රමාදයකින් නිකුත් වේ.

    Release 8.3 හට ක්රියාකාරී වාසි ගණනාවක් ඇත, උදාහරණයක් ලෙස, නව තැටි එකක් හෝ කිහිපයක් එකතු කිරීමෙන් MDisk (DRAID මාදිලියේ) පුළුල් කිරීමේ හැකියාව (මෙම විශේෂාංගය 8.3.1 අනුවාදයේ සිට දර්ශනය වී ඇත). මෙය තරමක් මූලික ක්‍රියාකාරීත්වයකි, නමුත් 8.2 හි, අවාසනාවකට මෙන්, එවැනි අංගයක් නොමැත.

  • කිසියම් හේතුවක් නිසා යාවත්කාලීන කිරීමට නොහැකි නම්, 8.2.1.9 සහ 8.3.1.0 අනුවාදවලට පෙර Spectrum Virtualize මෘදුකාංගයේ අනුවාද සඳහා (ඉහත විස්තර කර ඇති දෝෂය අදාළ වන විට), එය සිදුවීමේ අවදානම අවම කිරීම සඳහා, IBM තාක්ෂණික සහාය නිර්දේශ කරයි. පහත රූපයේ දැක්වෙන පරිදි තටාක මට්ටමේ පද්ධතියේ ක්‍රියාකාරිත්වය සීමා කිරීම (පින්තූරය GUI හි Russified අනුවාදයෙන් ගන්නා ලදී). 10000 IOPS හි අගය උදාහරණයක් ලෙස පෙන්වා ඇති අතර ඔබේ පද්ධතියේ ලක්ෂණ අනුව තෝරා ගනු ලැබේ.

ඔබගේ ඉහළ පවතින ගබඩාව මත මෘදුකාංග වලංගු කිරීම වැදගත් වන්නේ ඇයි (99,9999%)IBM ගබඩා කාර්ය සාධනය සීමා කිරීම

  • ගබඩා පද්ධති මත පැටවීම නිවැරදිව ගණනය කිරීම සහ අධික බර පැටවීම වළක්වා ගැනීම අවශ්ය වේ. මෙය සිදු කිරීම සඳහා, ඔබට IBM සයිසර් (ඔබට එයට ප්‍රවේශය තිබේ නම්) හෝ හවුල්කරුවන්ගේ උපකාරය හෝ තෙවන පාර්ශවීය සම්පත් භාවිතා කළ හැකිය. ගබඩා පද්ධතියේ පැටවුම් පැතිකඩ තේරුම් ගැනීම අනිවාර්ය වේ, මන්ද MB/s සහ IOPS හි කාර්ය සාධනය අවම වශයෙන් පහත පරාමිතීන් මත පදනම්ව බොහෝ සෙයින් වෙනස් වේ:

    • මෙහෙයුම් වර්ගය: කියවීම හෝ ලිවීම,

    • මෙහෙයුම් වාරණ ප්රමාණය,

    • සම්පූර්ණ I/O ප්‍රවාහයේ කියවීමේ සහ ලිවීමේ මෙහෙයුම් ප්‍රතිශතය.

    එසේම, දත්ත වාරණ කියවන ආකාරය අනුව මෙහෙයුම් වේගය බලපායි: අනුපිළිවෙලින් හෝ අහඹු ලෙස. යෙදුම් පැත්තේ බහු දත්ත ප්‍රවේශ මෙහෙයුම් සිදු කරන විට, රඳා පවතින මෙහෙයුම් සංකල්පය ඇත. මෙය සැලකිල්ලට ගැනීම ද යෝග්ය ය. OS හි කාර්ය සාධන කවුන්ටර, ගබඩා පද්ධතිය, සේවාදායකයන්/හයිපර්වයිසර් මෙන්ම යෙදුම්වල මෙහෙයුම් විශේෂාංග, DBMS සහ තැටි සම්පත් වල අනෙකුත් “පාරිභෝගිකයින්” පිළිබඳ අවබෝධයක් ලබා ගැනීමට මේ සියල්ල උපකාරී වේ.

  • අවසාන වශයෙන්, උපස්ථ යාවත්කාලීන කිරීමට සහ ක්‍රියා කිරීමට වග බලා ගන්න. උපස්ථ කාලසටහන ව්‍යාපාරය සඳහා පිළිගත හැකි RPO අගයන් මත පදනම්ව වින්‍යාසගත කළ යුතු අතර, පිළිගත හැකි RTO අගයක් සහතික කිරීම සඳහා උපස්ථවල වරින් වර අඛණ්ඩතාව පරීක්ෂා කිරීම (උපස්ථ මෘදුකාංග වෙළෙන්දන් කිහිප දෙනෙකුට ඔවුන්ගේ නිෂ්පාදනවල ස්වයංක්‍රීය සත්‍යාපනය ක්‍රියාත්මක කර ඇත) සත්‍යාපනය කළ යුතුය.

අවසානය දක්වා කියවූ ඔබට ස්තුතියි.
අදහස් දැක්වීමේදී ඔබගේ ප්‍රශ්න සහ අදහස් වලට පිළිතුරු දීමට අපි සූදානම්. තවද අපගේ ටෙලිග්‍රාම් නාලිකාවට දායක වන ලෙස අපි ඔබට ආරාධනා කරමු, අපි නිත්‍ය උසස්වීම් පවත්වන (IaaS සඳහා වට්ටම් සහ VPS මත 100% දක්වා ප්‍රවර්ධන කේත සඳහා දීමනා), රසවත් පුවත් ලියන්න සහ Habr බ්ලොග් අඩවියේ නව ලිපි නිවේදනය කරන්න.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න