ඔහු ඔබට හොඳ නැත

Rook හි වර්ධනය වන ජනප්‍රියත්වය සම්බන්ධයෙන්, මම එහි අන්තරායන් සහ මඟ දිගේ ඔබ බලා සිටින ගැටළු ගැන කතා කිරීමට කැමැත්තෙමි.

මා ගැන: මිටිය අනුවාදයෙන් ceph පරිපාලනයේ පළපුරුද්ද, ප්‍රජා නිර්මාතෘ t.me/ceph_ru විදුලි පණිවුඩයේ.

පදනම් විරහිත නොවීම සඳහා, මම ceph සමඟ ඇති ගැටළු පිළිබඳව Habr (ශ්‍රේණිගත කිරීම අනුව විනිශ්චය කිරීම) විසින් පිළිගත් පළ කිරීම් වෙත යොමු කරමි. මටත් මේ පෝස්ට් වල ගොඩක් ප්‍රශ්න ඇති උනා. භාවිතා කරන ද්‍රව්‍ය සඳහා සබැඳි පෝස්ට් අවසානයේ ඇත.

රූක් පිළිබඳ සටහනේ, අපි හේතුවක් සඳහා ceph සඳහන් කරමු - Rook අත්‍යවශ්‍යයෙන්ම cubernetes වලින් ඔතා ඇති ceph, එයින් අදහස් කරන්නේ එය එහි සියලු ගැටලු උරුම කර ගන්නා බවයි. අපි සීෆ් ගැටළු වලින් පටන් ගනිමු.

පොකුරු කළමනාකරණය සරල කරන්න

Rook හි ඇති එක් වාසියක් වන්නේ kuberentes හරහා ceph කළමනාකරණය කිරීමේ පහසුවයි.

කෙසේ වෙතත්, ceph හි වින්‍යාස කිරීම සඳහා පරාමිති 1000 කට වඩා අඩංගු වන අතර, ඒ සමඟම, rook හරහා අපට සංස්කරණය කළ හැක්කේ ඒවායින් සුළු කොටසක් පමණි.

ලුමිනස් පිළිබඳ උදාහරණයක්
> ceph daemon mon.a config show | wc -l
1401

ceph ස්ථාපනය කිරීමට සහ යාවත්කාලීන කිරීමට පහසු ක්රමයක් ලෙස Rook ස්ථානගත කර ඇත
Rook නොමැතිව ceph ස්ථාපනය කිරීමේදී ගැටළු නොමැත - ansible playbook මිනිත්තු 30 කින් ලියා ඇත, නමුත් යාවත්කාලීන කිරීමේදී ගැටළු රාශියක් ඇත.

ක්‍රොක්ගේ පෝස්ටුවෙන් උපුටා ගැනීමකි

උදාහරණය: hummer සිට jewel දක්වා යාවත්කාලීන කිරීමෙන් පසු crush tunables නිවැරදිව ක්‍රියා නොකරයි

> ceph osd crush show-tunables
{
...
"straw_calc_version": 1,
"allowed_bucket_algs": 22,
"පැතිකඩ": "නොදන්නා"
"optimal_tunables": 0,
...
}

නමුත් සුළු අනුවාද තුළ පවා ගැටළු තිබේ.

උදාහරණය: 12.2.6 යාවත්කාලීන කිරීම, පොකුර සෞඛ්‍ය දෝෂ තත්ත්වයට ගෙන ඒම සහ කොන්දේසි සහිත බිඳුණු PG
ceph.com/releases/v12-2-8-released

යාවත්කාලීන නොකරන්න, රැඳී සිටින්න සහ පරීක්ෂා කරන්න? නමුත් අපි වෙනත් දේවල් අතර යාවත්කාලීන කිරීමේ පහසුව සඳහා Rook භාවිතා කරන බව පෙනේ.

රූක් හි ආපදා ප්‍රතිසාධන පොකුරේ සංකීර්ණත්වය

උදාහරණය: OSD එහි පාදවල දෝෂයක් සමඟ වැටේ. ගැටළුව වින්‍යාසය තුළ ඇති එක් පරාමිතියක ඇති බවට ඔබ සැක කරයි, ඔබට විශේෂිත ඩීමන් සඳහා වින්‍යාසය වෙනස් කිරීමට අවශ්‍ය වේ, නමුත් ඔබට kubernetes සහ DaemonSet ඇති නිසා ඔබට එය කළ නොහැක.

විකල්පයක් නැත. ceph tell osd.Num injectargs ක්‍රියා නොකරයි - OSD බොරු කියයි.

දුෂ්කරතා නිදොස් කිරීම

සමහර සැකසුම් සහ කාර්ය සාධන පරීක්ෂණ සඳහා ඩීමන්ගේ osd සොකට් වෙත සෘජුවම සම්බන්ධ වීම අවශ්‍ය වේ. රූක් සම්බන්ධයෙන් ගත් කල, ඔබ මුලින්ම අවශ්‍ය බහාලුම සොයා ගත යුතුය, පසුව එය තුළට ගොස්, දෝෂහරණය සඳහා නැතිවූ මෙවලම සොයාගෙන ඉතා කලබල විය යුතුය.

OSD අනුක්‍රමිකව ඉහළ නැංවීමේ දුෂ්කරතා

උදාහරණය: OSD OOM හි වැටේ, නැවත සමතුලිතතාවය ආරම්භ වේ, ඉන්පසු පහත ඒවා වැටේ.

විසඳුම: OSD එක වරකට ඔසවන්න, එය සම්පූර්ණයෙන්ම පොකුරට ඇතුළත් වන තෙක් රැඳී සිට ඊළඟ ඒවා ඔසවන්න. (සීෆ් වාර්තාවේ වැඩි විස්තර. ව්‍යසනයක ව්‍යුහ විද්‍යාව).

බෙරේමෙටල් ස්ථාපනයකදී, මෙය සරලව සිදු කරනු ලබන්නේ අතින්ය; Rook සහ node එකකට OSD එකකදී, විශේෂ ගැටළු නොමැත; OSD> 1 node එකක් නම් විකල්ප එසවීමේ ගැටළු මතු වේ.

ඇත්ත වශයෙන්ම, ඒවා විසඳා ගත හැකිය, නමුත් අපි දේවල් සරල කිරීමට Rook භාවිතා කරමු, නමුත් වඩාත් සංකීර්ණත්වය ලබා ගන්න.

ceph demons සඳහා සීමාවන් තෝරාගැනීමේ අපහසුතාව

ceph හි baremetal ස්ථාපනය සඳහා, පොකුරක් සඳහා අවශ්ය සම්පත් ගණනය කිරීම තරමක් පහසුය - සූත්ර ඇති අතර පර්යේෂණ තිබේ. ඔබ දුර්වල CPU එකක් භාවිතා කරන්නේ නම්, Numa යනු කුමක්දැයි සොයා ගැනීමට ඔබට තවමත් කාර්ය සාධන පරීක්ෂණ කිහිපයක් සිදු කිරීමට සිදු වනු ඇත, නමුත් එය තවමත් Rook ට වඩා පහසු ය.

Rook සම්බන්ධයෙන් ගත් කල, ගණනය කළ හැකි මතක සීමාවන්ට අමතරව, CPU සීමාවක් සැකසීමේ ප්‍රශ්නය ඔබට ඇත.

මෙහිදී ඔබට කාර්ය සාධන පරීක්ෂණ සමඟ වෙහෙස මහන්සි වී වැඩ කිරීමට සිදුවනු ඇත. ඔබ සීමාවන් අඩු කළහොත්, ඔබට මන්දගාමී පොකුරක් ලැබෙනු ඇත; ඔබ අසීමිත ලෙස සකසා ඇත්නම්, නැවත සමතුලිත කිරීමේදී ඔබට ක්‍රියාකාරී CPU භාවිතය ලැබෙනු ඇත, එය kubernetes හි ඔබගේ යෙදුම් වලට නරක බලපෑමක් ඇති කරයි.

ජාලකරණ ගැටළු v1

ceph සඳහා 2x10GB ජාලයක් භාවිතා කිරීම රෙකමදාරු කරනු ලැබේ. එකක් සේවාදායක ගමනාගමනය සඳහා, අනෙක ceph සේවා අවශ්‍යතා සඳහා (ප්‍රති තුලනය). ඔබ බෙරේමෙටල් මත ceph සමඟ ජීවත් වන්නේ නම්, මෙම බෙදීම පහසුවෙන් වින්‍යාසගත වේ, ඔබ රූක් සමඟ ජීවත් වන්නේ නම්, ජාල අනුව බෙදීම ඔබට ගැටළු ඇති කරයි, මන්ද සෑම පොකුරු වින්‍යාසයක්ම ඔබට විවිධ ජාල දෙකක් පෝඩ් වෙත පෝෂණය කිරීමට ඉඩ නොදේ. .

ජාලකරණ ගැටළු v2

ඔබ ජාල වෙන් කිරීම ප්‍රතික්ෂේප කරන්නේ නම්, නැවත සමතුලිත කිරීමේදී, ceph ගමනාගමනය මුළු නාලිකාවම අවහිර කරනු ඇති අතර kubernetes හි ඔබගේ යෙදුම් මන්දගාමී වේ හෝ බිඳ වැටේ. ඔබට ceph නැවත සමතුලිත කිරීමේ වේගය අඩු කළ හැකිය, නමුත් දිගු නැවත සමතුලිත කිරීම හේතුවෙන් ඔබට තැටි හෝ OOM හරහා පොකුරෙන් දෙවන නෝඩය වැටීමේ අවදානම වැඩි වන අතර, පොකුර සඳහා පමණක් සහතික කියවීමක් දැනටමත් ඇත.

දිගු නැවත සමතුලිතතාවය - දිගු යෙදුම ප්රමාදයි

Ceph ගේ පෝස්ටුවෙන් උපුටා ගැනීමකි. ව්‍යසනයක ව්‍යුහ විද්‍යාව.

පරීක්ෂණ පොකුරු කාර්ය සාධනය:

ප්‍රමාණයෙන් 4 KB ලිවීමේ මෙහෙයුමකට 1 ms ගත වේ, කාර්ය සාධනය 1000 ත්‍රෙඩ් එකක මෙහෙයුම් 1/තත්පර වේ.

4 MB (වස්තු ප්රමාණය) මෙහෙයුමක් 22 ms, කාර්ය සාධනය 45 මෙහෙයුම් / තත්පර වේ.

එහි ප්‍රතිඵලයක් ලෙස, වසම තුනෙන් එකක් අසාර්ථක වූ විට, පොකුර යම් කාලයක් පිරිහුණු තත්වයක පවතින අතර, උණුසුම් වස්තූන්ගෙන් අඩක් විවිධ අනුවාද හරහා බෙදා හරින විට, ලිවීමේ මෙහෙයුම් වලින් අඩක් බලහත්කාරයෙන් ප්‍රතිසාධනයකින් ආරම්භ වේ.

අපි බලහත්කාරයෙන් ප්‍රතිසාධන කාලය දළ වශයෙන් ගණනය කරමු - පිරිහුණු වස්තුවකට මෙහෙයුම් ලියන්න.

මුලින්ම අපි 4 ms වලදී 22 MB කියවා, 22 ms ලියන්න, පසුව 1 ms වලදී අපි සත්ය දත්ත 4 KB ලියන්නෙමු. සම්මත කාර්ය සාධනය 45 ms වූ විට, SSD මත පිරිහුණු වස්තුවකට ලිවීමේ මෙහෙයුමකට 1 ms - කාර්ය සාධනයේ 45 ගුණයක පහත වැටීමක්.

අප සතුව ඇති පිරිහුණු වස්තූන්ගේ ප්‍රතිශතය වැඩි වන තරමට සියල්ල නරක අතට හැරේ.

පොකුරේ නිවැරදි ක්‍රියාකාරිත්වය සඳහා නැවත සමතුලිත කිරීමේ වේගය ඉතා වැදගත් බව පෙනේ.

ceph සඳහා විශේෂිත සේවාදායක සැකසුම්

ceph හට නිශ්චිත ධාරක සුසර කිරීමක් අවශ්‍ය විය හැක.

උදාහරණය: sysctl සිටුවම් සහ එම ජම්බෝෆ්‍රේම්, මෙම සිටුවම්වලින් සමහරක් ඔබගේ ගෙවීමට අහිතකර ලෙස බලපෑ හැකිය.

Rook සඳහා සැබෑ අවශ්යතාව තවමත් ප්රශ්නයක්

ඔබ වලාකුළෙහි සිටින්නේ නම්, ඔබට ඔබේ වලාකුළු සපයන්නා වෙතින් ගබඩාවක් ඇත, එය වඩාත් පහසු වේ.

ඔබ ඔබේම සේවාදායකයක සිටී නම්, kubernetes නොමැතිව ceph කළමනාකරණය කිරීම වඩාත් පහසු වනු ඇත.

ඔබ සමහර අඩු වියදම් සත්කාරක සේවා වලින් සේවාදායක කුලියට ගන්නවාද? එවිට ඔබට ජාලය, එහි ප්‍රමාදයන් සහ කලාප පළල සමඟ බොහෝ විනෝදයක් ලැබෙනු ඇත, එය පැහැදිලිවම ceph ට අහිතකර ලෙස බලපායි.

එකතුව: kuberentes ක්‍රියාත්මක කිරීම සහ ගබඩාව ක්‍රියාත්මක කිරීම විවිධ යෙදවුම් සහ විවිධ විසඳුම් විකල්පයන් සහිත විවිධ කාර්යයන් වේ - ඒවා මිශ්‍ර කිරීම යනු එකක් හෝ අනෙකක් වෙනුවෙන් අනතුරුදායක වෙළඳාමක් සිදු කිරීමයි. සැලසුම් අවධියේදී පවා මෙම විසඳුම් ඒකාබද්ධ කිරීම ඉතා අපහසු වනු ඇති අතර, තවමත් මෙහෙයුම් කාල පරිච්ඡේදයක් පවතී.

භාවිතා කළ සාහිත්‍ය ලැයිස්තුව:

පෝස්ට් #1 ඒත් ඔයා කියනවා Ceph... එයා ඇත්තටම හොඳද?
පෝස්ට් #2 Ceph. ව්‍යසනයක ව්‍යුහ විද්‍යාව

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න