అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్

క్యూబ్-ఆన్-క్యూబ్, మెటాక్లస్టర్‌లు, తేనెగూడు, వనరుల పంపిణీ

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 1. అలీబాబా క్లౌడ్‌పై కుబెర్నెటెస్ పర్యావరణ వ్యవస్థ

2015 నుండి, Alibaba Cloud Container Service for Kubernetes (ACK) అలీబాబా క్లౌడ్‌లో వేగంగా అభివృద్ధి చెందుతున్న క్లౌడ్ సేవలలో ఒకటి. ఇది అనేక మంది క్లయింట్‌లకు సేవలు అందిస్తుంది మరియు అలీబాబా యొక్క అంతర్గత మౌలిక సదుపాయాలు మరియు కంపెనీ యొక్క ఇతర క్లౌడ్ సేవలకు కూడా మద్దతు ఇస్తుంది.

ప్రపంచ స్థాయి క్లౌడ్ ప్రొవైడర్‌ల నుండి సారూప్య కంటైనర్ సేవల మాదిరిగానే, మా అగ్ర ప్రాధాన్యతలు విశ్వసనీయత మరియు లభ్యత. అందువల్ల, పదివేల కుబెర్నెటెస్ క్లస్టర్‌ల కోసం స్కేలబుల్ మరియు ప్రపంచవ్యాప్తంగా అందుబాటులో ఉండే ప్లాట్‌ఫారమ్ సృష్టించబడింది.

ఈ కథనంలో, క్లౌడ్ ఇన్‌ఫ్రాస్ట్రక్చర్‌పై పెద్ద సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్‌లను నిర్వహించడంలో మా అనుభవాన్ని, అలాగే అంతర్లీన ప్లాట్‌ఫారమ్ యొక్క నిర్మాణాన్ని పంచుకుంటాము.

ఎంట్రీ

కుబెర్నెటెస్ క్లౌడ్‌లోని వివిధ రకాల పనిభారాలకు వాస్తవ ప్రమాణంగా మారింది. అంజీర్లో చూపిన విధంగా. పైన 1, మరిన్ని Alibaba క్లౌడ్ అప్లికేషన్‌లు ఇప్పుడు Kubernetes క్లస్టర్‌లలో రన్ అవుతున్నాయి: స్టేట్‌ఫుల్ మరియు స్టేటస్‌లెస్ అప్లికేషన్‌లు, అలాగే అప్లికేషన్ మేనేజర్‌లు. Kubernetes నిర్వహణ ఎల్లప్పుడూ మౌలిక సదుపాయాలను నిర్మించే మరియు నిర్వహించే ఇంజనీర్‌లకు ఆసక్తికరమైన మరియు తీవ్రమైన చర్చనీయాంశంగా ఉంటుంది. అలీబాబా క్లౌడ్ వంటి క్లౌడ్ ప్రొవైడర్ల విషయానికి వస్తే, స్కేలింగ్ సమస్య తెరపైకి వస్తుంది. ఈ స్థాయిలో Kubernetes క్లస్టర్‌లను ఎలా నిర్వహించాలి? భారీ 10-నోడ్ కుబెర్నెట్స్ క్లస్టర్‌లను నిర్వహించడానికి మేము ఇప్పటికే ఉత్తమ పద్ధతులను కవర్ చేసాము. వాస్తవానికి, ఇది ఒక ఆసక్తికరమైన స్కేలింగ్ సమస్య. కానీ మరొక స్కేల్ ఉంది: పరిమాణం సమూహాలు తాము.

మేము చాలా మంది ACK వినియోగదారులతో ఈ అంశాన్ని చర్చించాము. వారిలో ఎక్కువ మంది చిన్న లేదా మధ్య తరహా కుబెర్నెట్స్ క్లస్టర్‌లను డజన్ల కొద్దీ, వందల సంఖ్యలో అమలు చేయడానికి ఎంచుకున్నారు. దీనికి మంచి కారణాలు ఉన్నాయి: సంభావ్య నష్టాన్ని పరిమితం చేయడం, విభిన్న బృందాల కోసం క్లస్టర్‌లను వేరు చేయడం, పరీక్ష కోసం వర్చువల్ క్లస్టర్‌లను సృష్టించడం. ACK ఈ వినియోగ నమూనాతో ప్రపంచ ప్రేక్షకులకు సేవలందించాలని లక్ష్యంగా పెట్టుకున్నట్లయితే, అది తప్పనిసరిగా 20 కంటే ఎక్కువ ప్రాంతాలలో పెద్ద సంఖ్యలో క్లస్టర్‌లను విశ్వసనీయంగా మరియు సమర్ధవంతంగా నిర్వహించాలి.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 2. భారీ సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్‌లను నిర్వహించడంలో సమస్యలు

ఈ స్థాయిలో క్లస్టర్‌లను నిర్వహించడంలో ప్రధాన సవాళ్లు ఏమిటి? చిత్రంలో చూపిన విధంగా, ఎదుర్కోవటానికి నాలుగు సమస్యలు ఉన్నాయి:

  • విజాతీయత

ACK స్టాండర్డ్, సర్వర్‌లెస్, ఎడ్జ్, విండోస్ మరియు అనేక ఇతర రకాల క్లస్టర్‌లకు మద్దతు ఇవ్వాలి. వేర్వేరు క్లస్టర్‌లకు వేర్వేరు ఎంపికలు, భాగాలు మరియు హోస్టింగ్ మోడల్‌లు అవసరం. కొంతమంది కస్టమర్‌లు వారి నిర్దిష్ట కేసుల కోసం అనుకూలీకరణకు సహాయం కావాలి.

  • వివిధ క్లస్టర్ పరిమాణాలు

సమూహాలు పరిమాణంలో మారుతూ ఉంటాయి, కొన్ని పాడ్‌లతో కూడిన రెండు నోడ్‌ల నుండి వేలాది పాడ్‌లతో పదివేల నోడ్‌ల వరకు ఉంటాయి. వనరుల అవసరాలు కూడా చాలా మారుతూ ఉంటాయి. సరికాని వనరుల కేటాయింపు పనితీరును ప్రభావితం చేయవచ్చు లేదా వైఫల్యానికి కూడా కారణం కావచ్చు.

  • వివిధ వెర్షన్లు

కుబెర్నెటెస్ చాలా త్వరగా అభివృద్ధి చెందుతోంది. ప్రతి కొన్ని నెలలకు కొత్త వెర్షన్‌లు విడుదలవుతాయి. కొత్త ఫీచర్‌లను ప్రయత్నించడానికి కస్టమర్‌లు ఎల్లప్పుడూ సిద్ధంగా ఉంటారు. కాబట్టి వారు కుబెర్నెటీస్ యొక్క కొత్త వెర్షన్‌లపై టెస్ట్ లోడ్‌ను మరియు స్థిరమైన వాటిపై ప్రొడక్షన్ లోడ్‌ను ఉంచాలనుకుంటున్నారు. ఈ అవసరాన్ని తీర్చడానికి, స్థిరమైన వెర్షన్‌లను కొనసాగిస్తూనే ACK కస్టమర్‌లకు కుబెర్నెట్స్ యొక్క కొత్త వెర్షన్‌లను నిరంతరం అందించాలి.

  • భద్రతా వర్తింపు

క్లస్టర్లు వివిధ ప్రాంతాలలో పంపిణీ చేయబడ్డాయి. అందుకని, వారు వివిధ భద్రతా అవసరాలు మరియు అధికారిక నిబంధనలకు అనుగుణంగా ఉండాలి. ఉదాహరణకు, యూరప్‌లోని క్లస్టర్ తప్పనిసరిగా GDPRకి అనుగుణంగా ఉండాలి, అయితే చైనాలోని ఫైనాన్షియల్ క్లౌడ్ తప్పనిసరిగా అదనపు రక్షణ పొరలను కలిగి ఉండాలి. ఈ అవసరాలు తప్పనిసరి మరియు వాటిని విస్మరించడం ఆమోదయోగ్యం కాదు, ఎందుకంటే ఇది క్లౌడ్ ప్లాట్‌ఫారమ్ యొక్క ఖాతాదారులకు భారీ నష్టాలను సృష్టిస్తుంది.

ACK ప్లాట్‌ఫారమ్ పైన పేర్కొన్న చాలా సమస్యలను పరిష్కరించడానికి రూపొందించబడింది. ఇది ప్రస్తుతం ప్రపంచవ్యాప్తంగా 10 వేల కంటే ఎక్కువ కుబెర్నెట్స్ క్లస్టర్‌లను విశ్వసనీయంగా మరియు స్థిరంగా నిర్వహిస్తోంది. అనేక కీలకమైన డిజైన్/ఆర్కిటెక్చర్ సూత్రాలతో సహా ఇది ఎలా సాధించబడిందో చూద్దాం.

డిజైన్

క్యూబ్-ఆన్-క్యూబ్ మరియు తేనెగూడు

కేంద్రీకృత సోపానక్రమం వలె కాకుండా, సెల్-ఆధారిత నిర్మాణం సాధారణంగా ఒకే డేటా సెంటర్‌కు మించి ప్లాట్‌ఫారమ్‌ను స్కేల్ చేయడానికి లేదా విపత్తు పునరుద్ధరణ పరిధిని విస్తరించడానికి ఉపయోగించబడుతుంది.

అలీబాబా క్లౌడ్‌లోని ప్రతి ప్రాంతం అనేక జోన్‌లను (AZ) కలిగి ఉంటుంది మరియు సాధారణంగా నిర్దిష్ట డేటా సెంటర్‌కు అనుగుణంగా ఉంటుంది. పెద్ద ప్రాంతంలో (ఉదాహరణకు హువాంగ్‌జౌ), తరచుగా వేల సంఖ్యలో కుబెర్నెట్స్ క్లయింట్ క్లస్టర్‌లు ACKని నడుపుతున్నాయి.

ACK ఈ Kubernetes క్లస్టర్‌లను Kubernetesని ఉపయోగించి నిర్వహిస్తుంది, అంటే మేము క్లయింట్ Kubernetes క్లస్టర్‌లను నిర్వహించడానికి Kubernetes మెటాక్లస్టర్‌ని కలిగి ఉన్నాము. ఈ నిర్మాణాన్ని "కుబే-ఆన్-కుబే" (KoK) అని కూడా పిలుస్తారు. KoK నిర్మాణం క్లయింట్ క్లస్టర్‌ల నిర్వహణను సులభతరం చేస్తుంది ఎందుకంటే క్లస్టర్ విస్తరణ సరళమైనది మరియు నిర్ణయాత్మకమైనది. మరీ ముఖ్యంగా, మేము స్థానిక కుబెర్నెట్స్ నుండి ఫీచర్‌లను మళ్లీ ఉపయోగించుకోవచ్చు. ఉదాహరణకు, విస్తరణ ద్వారా API సర్వర్‌లను నిర్వహించడం, బహుళ etcdలను నిర్వహించడానికి etcd ఆపరేటర్‌ని ఉపయోగించడం. ఇటువంటి పునరావృతం ఎల్లప్పుడూ ప్రత్యేక ఆనందాన్ని తెస్తుంది.

క్లయింట్‌ల సంఖ్యను బట్టి అనేక కుబెర్నెట్స్ మెటాక్లస్టర్‌లు ఒక ప్రాంతంలో మోహరించబడతాయి. మనం వీటిని మెటాక్లస్టర్ సెల్స్ అంటాము. మొత్తం జోన్ యొక్క వైఫల్యం నుండి రక్షించడానికి, ACK ఒకే ప్రాంతంలో బహుళ-యాక్టివ్ విస్తరణలకు మద్దతు ఇస్తుంది: మెటాక్లస్టర్ బహుళ జోన్‌లలో కుబెర్నెటెస్ క్లయింట్ క్లస్టర్ మాస్టర్ భాగాలను పంపిణీ చేస్తుంది మరియు వాటిని ఏకకాలంలో, అంటే బహుళ-యాక్టివ్ మోడ్‌లో అమలు చేస్తుంది. మాస్టర్ యొక్క విశ్వసనీయత మరియు సామర్థ్యాన్ని నిర్ధారించడానికి, ACK భాగాల ప్లేస్‌మెంట్‌ను ఆప్టిమైజ్ చేస్తుంది మరియు API సర్వర్ మరియు etcd ఒకదానికొకటి దగ్గరగా ఉండేలా చేస్తుంది.

ఈ మోడల్ కుబెర్నెట్‌లను సమర్ధవంతంగా, సరళంగా మరియు విశ్వసనీయంగా నిర్వహించడానికి మిమ్మల్ని అనుమతిస్తుంది.

మెటాక్లస్టర్ వనరుల ప్రణాళిక

మేము ఇప్పటికే చెప్పినట్లుగా, ప్రతి ప్రాంతంలోని మెటాక్లస్టర్ల సంఖ్య ఖాతాదారుల సంఖ్యపై ఆధారపడి ఉంటుంది. అయితే కొత్త మెటాక్లస్టర్‌ను ఏ సమయంలో జోడించాలి? ఇది సాధారణ వనరుల ప్రణాళిక సమస్య. నియమం ప్రకారం, ఇప్పటికే ఉన్న మెటాక్లస్టర్‌లు వాటి వనరులన్నీ అయిపోయినప్పుడు కొత్తదాన్ని సృష్టించడం ఆచారం.

ఉదాహరణకు, నెట్‌వర్క్ వనరులను తీసుకుందాం. KoK ఆర్కిటెక్చర్‌లో, క్లయింట్ క్లస్టర్‌ల నుండి కుబెర్నెటీస్ భాగాలు మెటాక్లస్టర్‌లో పాడ్‌లుగా అమర్చబడతాయి. మేము ఉపయోగిస్తాము టెర్వే (Fig. 3) అనేది కంటైనర్ నెట్‌వర్క్ నిర్వహణ కోసం అలీబాబా క్లౌడ్ ద్వారా అభివృద్ధి చేయబడిన అధిక-పనితీరు గల ప్లగ్ఇన్. ఇది గొప్ప భద్రతా విధానాలను అందిస్తుంది మరియు అలీబాబా క్లౌడ్ ఎలాస్టిక్ నెట్‌వర్కింగ్ ఇంటర్‌ఫేస్ (ENI) ద్వారా కస్టమర్‌ల వర్చువల్ ప్రైవేట్ క్లౌడ్‌లకు (VPCలు) కనెక్ట్ చేయడానికి మిమ్మల్ని అనుమతిస్తుంది. మెటాక్లస్టర్‌లో నోడ్‌లు, పాడ్‌లు మరియు సేవల అంతటా నెట్‌వర్క్ వనరులను సమర్థవంతంగా పంపిణీ చేయడానికి, మేము వర్చువల్ ప్రైవేట్ క్లౌడ్‌ల మెటాక్లస్టర్‌లో వాటి వినియోగాన్ని జాగ్రత్తగా పర్యవేక్షించాలి. నెట్‌వర్క్ వనరులు ముగిసినప్పుడు, కొత్త సెల్ సృష్టించబడుతుంది.

ప్రతి మెటాక్లస్టర్‌లోని క్లయింట్ క్లస్టర్‌ల సరైన సంఖ్యను నిర్ణయించడానికి, మేము మా ఖర్చులు, సాంద్రత అవసరాలు, వనరుల కోటా, విశ్వసనీయత అవసరాలు మరియు గణాంకాలను కూడా పరిగణనలోకి తీసుకుంటాము. ఈ మొత్తం సమాచారం ఆధారంగా కొత్త మెటాక్లస్టర్‌ను రూపొందించాలనే నిర్ణయం తీసుకోబడింది. చిన్న క్లస్టర్‌లు భవిష్యత్తులో బాగా విస్తరించవచ్చని దయచేసి గమనించండి, కాబట్టి క్లస్టర్‌ల సంఖ్య మారకుండా ఉన్నప్పటికీ వనరుల వినియోగం పెరుగుతుంది. మేము సాధారణంగా ప్రతి క్లస్టర్ పెరగడానికి తగినంత ఖాళీ స్థలాన్ని వదిలివేస్తాము.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 3. టెర్వే నెట్‌వర్క్ ఆర్కిటెక్చర్

క్లయింట్ క్లస్టర్‌లలో స్కేలింగ్ విజార్డ్ భాగాలు

విజార్డ్ భాగాలు విభిన్న వనరుల అవసరాలను కలిగి ఉంటాయి. అవి క్లస్టర్‌లోని నోడ్‌లు మరియు పాడ్‌ల సంఖ్య, APIServerతో పరస్పర చర్య చేసే ప్రామాణికం కాని కంట్రోలర్‌లు/ఆపరేటర్‌ల సంఖ్యపై ఆధారపడి ఉంటాయి.

ACKలో, ప్రతి Kubernetes క్లయింట్ క్లస్టర్ పరిమాణం మరియు రన్‌టైమ్ అవసరాలలో తేడా ఉంటుంది. విజార్డ్ భాగాలను ఉంచడానికి సార్వత్రిక కాన్ఫిగరేషన్ లేదు. పెద్ద క్లయింట్ కోసం మేము పొరపాటున తక్కువ వనరుల పరిమితిని సెట్ చేస్తే, దాని క్లస్టర్ లోడ్‌ని తట్టుకోలేకపోతుంది. మీరు అన్ని క్లస్టర్‌లకు సంప్రదాయబద్ధంగా అధిక పరిమితిని సెట్ చేస్తే, వనరులు వృధా అవుతాయి.

విశ్వసనీయత మరియు ఖర్చు మధ్య సూక్ష్మమైన ట్రేడ్-ఆఫ్‌ను కనుగొనడానికి, ACK ఒక టైప్ సిస్టమ్‌ను ఉపయోగిస్తుంది. అవి, మేము మూడు రకాల సమూహాలను నిర్వచించాము: చిన్న, మధ్యస్థ మరియు పెద్ద. ప్రతి రకానికి ప్రత్యేక వనరు కేటాయింపు ప్రొఫైల్ ఉంటుంది. విజర్డ్ భాగాల లోడ్, నోడ్‌ల సంఖ్య మరియు ఇతర కారకాలపై ఆధారపడి రకం నిర్ణయించబడుతుంది. క్లస్టర్ రకం కాలక్రమేణా మారవచ్చు. ACK ఈ కారకాలను నిరంతరం పర్యవేక్షిస్తుంది మరియు తదనుగుణంగా అప్/డౌన్ టైప్ చేయవచ్చు. క్లస్టర్ రకాన్ని మార్చిన తర్వాత, కనీస వినియోగదారు జోక్యంతో వనరుల కేటాయింపు స్వయంచాలకంగా నవీకరించబడుతుంది.

ఈ మార్పులు మరింత సజావుగా జరిగేలా మరియు మరింత ఆర్థికపరమైన అర్థాన్ని చేకూర్చేలా, సూక్ష్మమైన స్కేలింగ్ మరియు మరింత ఖచ్చితమైన రకాన్ని నవీకరించడం ద్వారా ఈ వ్యవస్థను మెరుగుపరచడానికి మేము కృషి చేస్తున్నాము.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 4. ఇంటెలిజెంట్ మల్టీ-స్టేజ్ టైప్ స్విచింగ్

స్కేల్ వద్ద క్లయింట్ క్లస్టర్‌ల పరిణామం

మునుపటి విభాగాలు పెద్ద సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్‌లను నిర్వహించడంలో కొన్ని అంశాలను కవర్ చేశాయి. అయితే, పరిష్కరించాల్సిన మరో సమస్య ఉంది: క్లస్టర్ల పరిణామం.

కుబెర్నెటెస్ అనేది క్లౌడ్ వరల్డ్ యొక్క "లైనక్స్". ఇది నిరంతరం నవీకరించబడుతుంది మరియు మరింత మాడ్యులర్ అవుతుంది. మేము మా కస్టమర్‌లకు నిరంతరం కొత్త సంస్కరణలను అందించాలి, దుర్బలత్వాలను పరిష్కరించాలి మరియు ఇప్పటికే ఉన్న క్లస్టర్‌లను నవీకరించాలి, అలాగే పెద్ద సంఖ్యలో సంబంధిత భాగాలను (CSI, CNI, పరికర ప్లగిన్, షెడ్యూలర్ ప్లగిన్ మరియు అనేక ఇతరాలు) నిర్వహించాలి.

కుబెర్నెట్స్ కాంపోనెంట్ మేనేజ్‌మెంట్‌ని ఉదాహరణగా తీసుకుందాం. ప్రారంభించడానికి, మేము ఈ కనెక్ట్ చేయబడిన అన్ని భాగాలను నమోదు చేయడానికి మరియు నిర్వహించడానికి కేంద్రీకృత వ్యవస్థను అభివృద్ధి చేసాము.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 5. ఫ్లెక్సిబుల్ మరియు ప్లగ్ చేయదగిన భాగాలు

ముందుకు వెళ్లడానికి ముందు, మీరు నవీకరణ విజయవంతమైందని నిర్ధారించుకోవాలి. దీన్ని చేయడానికి, మేము భాగాల కార్యాచరణను తనిఖీ చేయడానికి ఒక వ్యవస్థను అభివృద్ధి చేసాము. నవీకరణకు ముందు మరియు తర్వాత తనిఖీ చేయబడుతుంది.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 6. క్లస్టర్ భాగాల ప్రాథమిక తనిఖీ

ఈ భాగాలను త్వరగా మరియు విశ్వసనీయంగా అప్‌డేట్ చేయడానికి, నిరంతర విస్తరణ వ్యవస్థ పాక్షిక పురోగతి (గ్రేస్కేల్), పాజ్‌లు మరియు ఇతర ఫంక్షన్‌లకు మద్దతుతో పని చేస్తుంది. ప్రామాణిక కుబెర్నెటెస్ కంట్రోలర్‌లు ఈ వినియోగ సందర్భానికి సరిగ్గా సరిపోవు. అందువల్ల, క్లస్టర్ భాగాలను నిర్వహించడానికి, మేము ప్లగిన్ మరియు సహాయక నియంత్రణ మాడ్యూల్ (సైడ్‌కార్ మేనేజ్‌మెంట్)తో సహా ప్రత్యేక కంట్రోలర్‌ల సమితిని అభివృద్ధి చేసాము.

ఉదాహరణకు, BroadcastJob కంట్రోలర్ ప్రతి వర్కర్ మెషీన్‌లోని భాగాలను నవీకరించడానికి లేదా ప్రతి మెషీన్‌లోని నోడ్‌లను తనిఖీ చేయడానికి రూపొందించబడింది. బ్రాడ్‌కాస్ట్ జాబ్ క్లస్టర్‌లోని ప్రతి నోడ్‌లో డెమోన్‌సెట్ వంటి పాడ్‌ను అమలు చేస్తుంది. అయినప్పటికీ, DaemonSet ఎల్లప్పుడూ పాడ్‌ను చాలా కాలం పాటు నడుపుతుంది, అయితే BroadcastJob దానిని కూలిపోతుంది. బ్రాడ్‌కాస్ట్ కంట్రోలర్ కొత్తగా చేరిన నోడ్‌లపై పాడ్‌లను కూడా ప్రారంభిస్తుంది మరియు అవసరమైన భాగాలతో నోడ్‌లను ప్రారంభిస్తుంది. జూన్ 2019లో, మేము కంపెనీలో ఉపయోగించే OpenKruise ఆటోమేషన్ ఇంజిన్ యొక్క సోర్స్ కోడ్‌ను తెరిచాము.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 7. OpenKurise అన్ని నోడ్‌లలో బ్రాడ్‌కాస్ట్ టాస్క్ యొక్క అమలును నిర్వహిస్తుంది

కస్టమర్‌లు సరైన క్లస్టర్ కాన్ఫిగరేషన్‌లను ఎంచుకోవడంలో సహాయపడటానికి, మేము సర్వర్‌లెస్, ఎడ్జ్, విండోస్ మరియు బేర్ మెటల్ ప్రొఫైల్‌లతో సహా ముందే నిర్వచించిన ప్రొఫైల్‌ల సమితిని కూడా అందిస్తాము. ల్యాండ్‌స్కేప్ విస్తరిస్తున్నప్పుడు మరియు మా కస్టమర్‌ల అవసరాలు పెరుగుతున్నప్పుడు, దుర్భరమైన సెటప్ ప్రక్రియను సులభతరం చేయడానికి మేము మరిన్ని ప్రొఫైల్‌లను జోడిస్తాము.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 8. వివిధ దృశ్యాల కోసం అధునాతన మరియు సౌకర్యవంతమైన క్లస్టర్ ప్రొఫైల్‌లు

డేటా సెంటర్లలో గ్లోబల్ అబ్జర్బిలిటీ

క్రింద అంజీర్లో చూపిన విధంగా. 9, అలీబాబా క్లౌడ్ కంటైనర్ క్లౌడ్ సేవ ప్రపంచవ్యాప్తంగా ఇరవై ప్రాంతాలలో అమలు చేయబడింది. ఈ స్కేల్‌ను బట్టి, ACK యొక్క ముఖ్య లక్ష్యాలలో ఒకటి రన్నింగ్ క్లస్టర్‌ల స్థితిని సులభంగా పర్యవేక్షించడం, తద్వారా క్లయింట్ క్లస్టర్‌కు సమస్య ఎదురైతే, మేము పరిస్థితికి త్వరగా ప్రతిస్పందించగలము. మరో మాటలో చెప్పాలంటే, అన్ని ప్రాంతాల్లోని క్లయింట్ క్లస్టర్‌ల నుండి నిజ సమయంలో గణాంకాలను సమర్ధవంతంగా మరియు సురక్షితంగా సేకరించడానికి మిమ్మల్ని అనుమతించే పరిష్కారాన్ని మీరు రూపొందించాలి - మరియు ఫలితాలను దృశ్యమానంగా ప్రదర్శించండి.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 9. ఇరవై ప్రాంతాలలో అలీబాబా క్లౌడ్ కంటైనర్ సేవ యొక్క గ్లోబల్ విస్తరణ

అనేక కుబెర్నెట్స్ పర్యవేక్షణ వ్యవస్థల వలె, మేము మా ప్రధాన సాధనంగా ప్రోమేతియస్‌ని ఉపయోగిస్తాము. ప్రతి మెటాక్లస్టర్ కోసం, ప్రోమేతియస్ ఏజెంట్లు క్రింది కొలమానాలను సేకరిస్తారు:

  • హోస్ట్ వనరులు (CPU, మెమరీ, డిస్క్, మొదలైనవి) మరియు నెట్‌వర్క్ బ్యాండ్‌విడ్త్ వంటి OS ​​మెట్రిక్‌లు.
  • kube-apiserver, kube-controller-manager మరియు kube-scheduler వంటి మెట్రిక్‌లస్టర్ మరియు క్లయింట్ క్లస్టర్ మేనేజ్‌మెంట్ సిస్టమ్ కోసం కొలమానాలు.
  • kubernetes-state-metrics మరియు cadvisor నుండి కొలమానాలు.
  • డిస్క్ వ్రాసే సమయం, డేటాబేస్ పరిమాణం, నోడ్‌ల మధ్య కనెక్షన్‌ల నిర్గమాంశ మొదలైన etcd కొలమానాలు.

సాధారణ బహుళ-లేయర్ అగ్రిగేషన్ మోడల్‌ని ఉపయోగించి గ్లోబల్ గణాంకాలు సేకరించబడతాయి. ప్రతి మెటాక్లస్టర్ నుండి మానిటరింగ్ డేటా మొదట ప్రతి ప్రాంతంలో సమగ్రపరచబడుతుంది మరియు తర్వాత మొత్తం చిత్రాన్ని చూపే సెంట్రల్ సర్వర్‌కు పంపబడుతుంది. అంతా ఫెడరేషన్ యంత్రాంగం ద్వారానే పని చేస్తుంది. ప్రతి డేటా సెంటర్‌లోని ప్రోమేతియస్ సర్వర్ ఆ డేటా సెంటర్ నుండి కొలమానాలను సేకరిస్తుంది మరియు పర్యవేక్షణ డేటాను సమగ్రపరచడానికి సెంట్రల్ ప్రోమేతియస్ సర్వర్ బాధ్యత వహిస్తుంది. AlertManager సెంట్రల్ ప్రోమేథియస్‌కి కనెక్ట్ చేస్తుంది మరియు అవసరమైతే, DingTalk, ఇమెయిల్, SMS మొదలైన వాటి ద్వారా హెచ్చరికలను పంపుతుంది. విజువలైజేషన్ - గ్రాఫానాను ఉపయోగించి.

మూర్తి 10లో, పర్యవేక్షణ వ్యవస్థను మూడు స్థాయిలుగా విభజించవచ్చు:

  • సరిహద్దు స్థాయి

మధ్య నుండి చాలా దూరంలో ఉన్న పొర. ప్రోమేతియస్ ఎడ్జ్ సర్వర్ ప్రతి మెటాక్లస్టర్‌లో నడుస్తుంది, అదే నెట్‌వర్క్ డొమైన్‌లోని మెటా మరియు క్లయింట్ క్లస్టర్‌ల నుండి కొలమానాలను సేకరిస్తుంది.

  • క్యాస్కేడ్ స్థాయి

ప్రోమేతియస్ క్యాస్కేడ్ లేయర్ యొక్క విధి బహుళ ప్రాంతాల నుండి పర్యవేక్షణ డేటాను సేకరించడం. ఈ సర్వర్లు చైనా, ఆసియా, యూరప్ మరియు అమెరికా వంటి పెద్ద భౌగోళిక యూనిట్ల స్థాయిలో పనిచేస్తాయి. సమూహాలు పెరిగేకొద్దీ, ప్రాంతాన్ని విభజించవచ్చు, ఆపై ప్రతి కొత్త పెద్ద ప్రాంతంలో క్యాస్కేడ్-స్థాయి ప్రోమేథియస్ సర్వర్ కనిపిస్తుంది. ఈ వ్యూహంతో, మీరు అవసరమైన విధంగా సజావుగా స్కేల్ చేయవచ్చు.

  • కేంద్ర స్థాయి

సెంట్రల్ ప్రోమేతియస్ సర్వర్ అన్ని క్యాస్కేడ్ సర్వర్‌లకు కనెక్ట్ చేస్తుంది మరియు తుది డేటా అగ్రిగేషన్‌ను నిర్వహిస్తుంది. విశ్వసనీయత కోసం, ఒకే క్యాస్కేడ్ సర్వర్‌లకు కనెక్ట్ చేయబడిన రెండు సెంట్రల్ ప్రోమేతియస్ ఉదంతాలు వేర్వేరు జోన్‌లలో పెంచబడ్డాయి.

అలీబాబా క్లౌడ్ పదివేల కుబెర్నెట్స్ క్లస్టర్‌లను ఎలా నిర్వహిస్తుంది... కుబెర్నెట్స్
అన్నం. 10. ప్రోమేతియస్ ఫెడరేషన్ మెకానిజం ఆధారంగా గ్లోబల్ మల్టీ-లెవల్ మానిటరింగ్ ఆర్కిటెక్చర్

సారాంశం

కుబెర్నెట్స్ ఆధారిత క్లౌడ్ సొల్యూషన్‌లు మా పరిశ్రమను మారుస్తూనే ఉన్నాయి. అలీబాబా క్లౌడ్ కంటైనర్ సేవ సురక్షితమైన, నమ్మదగిన మరియు అధిక-పనితీరు గల హోస్టింగ్‌ను అందిస్తుంది - ఇది ఉత్తమ కుబెర్నెట్స్ క్లౌడ్ హోస్టింగ్‌లో ఒకటి. అలీబాబా క్లౌడ్ బృందం ఓపెన్ సోర్స్ మరియు ఓపెన్ సోర్స్ కమ్యూనిటీ సూత్రాలను గట్టిగా నమ్ముతుంది. క్లౌడ్ టెక్నాలజీల నిర్వహణ మరియు నిర్వహణ రంగంలో మా పరిజ్ఞానాన్ని మేము ఖచ్చితంగా పంచుకుంటాము.

మూలం: www.habr.com

ఒక వ్యాఖ్యను జోడించండి