క్యూబ్-ఆన్-క్యూబ్, మెటాక్లస్టర్లు, తేనెగూడు, వనరుల పంపిణీ
అన్నం. 1. అలీబాబా క్లౌడ్పై కుబెర్నెటెస్ పర్యావరణ వ్యవస్థ
2015 నుండి, Alibaba Cloud Container Service for Kubernetes (ACK) అలీబాబా క్లౌడ్లో వేగంగా అభివృద్ధి చెందుతున్న క్లౌడ్ సేవలలో ఒకటి. ఇది అనేక మంది క్లయింట్లకు సేవలు అందిస్తుంది మరియు అలీబాబా యొక్క అంతర్గత మౌలిక సదుపాయాలు మరియు కంపెనీ యొక్క ఇతర క్లౌడ్ సేవలకు కూడా మద్దతు ఇస్తుంది.
ప్రపంచ స్థాయి క్లౌడ్ ప్రొవైడర్ల నుండి సారూప్య కంటైనర్ సేవల మాదిరిగానే, మా అగ్ర ప్రాధాన్యతలు విశ్వసనీయత మరియు లభ్యత. అందువల్ల, పదివేల కుబెర్నెటెస్ క్లస్టర్ల కోసం స్కేలబుల్ మరియు ప్రపంచవ్యాప్తంగా అందుబాటులో ఉండే ప్లాట్ఫారమ్ సృష్టించబడింది.
ఈ కథనంలో, క్లౌడ్ ఇన్ఫ్రాస్ట్రక్చర్పై పెద్ద సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్లను నిర్వహించడంలో మా అనుభవాన్ని, అలాగే అంతర్లీన ప్లాట్ఫారమ్ యొక్క నిర్మాణాన్ని పంచుకుంటాము.
ఎంట్రీ
కుబెర్నెటెస్ క్లౌడ్లోని వివిధ రకాల పనిభారాలకు వాస్తవ ప్రమాణంగా మారింది. అంజీర్లో చూపిన విధంగా. పైన 1, మరిన్ని Alibaba క్లౌడ్ అప్లికేషన్లు ఇప్పుడు Kubernetes క్లస్టర్లలో రన్ అవుతున్నాయి: స్టేట్ఫుల్ మరియు స్టేటస్లెస్ అప్లికేషన్లు, అలాగే అప్లికేషన్ మేనేజర్లు. Kubernetes నిర్వహణ ఎల్లప్పుడూ మౌలిక సదుపాయాలను నిర్మించే మరియు నిర్వహించే ఇంజనీర్లకు ఆసక్తికరమైన మరియు తీవ్రమైన చర్చనీయాంశంగా ఉంటుంది. అలీబాబా క్లౌడ్ వంటి క్లౌడ్ ప్రొవైడర్ల విషయానికి వస్తే, స్కేలింగ్ సమస్య తెరపైకి వస్తుంది. ఈ స్థాయిలో Kubernetes క్లస్టర్లను ఎలా నిర్వహించాలి? భారీ 10-నోడ్ కుబెర్నెట్స్ క్లస్టర్లను నిర్వహించడానికి మేము ఇప్పటికే ఉత్తమ పద్ధతులను కవర్ చేసాము. వాస్తవానికి, ఇది ఒక ఆసక్తికరమైన స్కేలింగ్ సమస్య. కానీ మరొక స్కేల్ ఉంది: పరిమాణం సమూహాలు తాము.
మేము చాలా మంది ACK వినియోగదారులతో ఈ అంశాన్ని చర్చించాము. వారిలో ఎక్కువ మంది చిన్న లేదా మధ్య తరహా కుబెర్నెట్స్ క్లస్టర్లను డజన్ల కొద్దీ, వందల సంఖ్యలో అమలు చేయడానికి ఎంచుకున్నారు. దీనికి మంచి కారణాలు ఉన్నాయి: సంభావ్య నష్టాన్ని పరిమితం చేయడం, విభిన్న బృందాల కోసం క్లస్టర్లను వేరు చేయడం, పరీక్ష కోసం వర్చువల్ క్లస్టర్లను సృష్టించడం. ACK ఈ వినియోగ నమూనాతో ప్రపంచ ప్రేక్షకులకు సేవలందించాలని లక్ష్యంగా పెట్టుకున్నట్లయితే, అది తప్పనిసరిగా 20 కంటే ఎక్కువ ప్రాంతాలలో పెద్ద సంఖ్యలో క్లస్టర్లను విశ్వసనీయంగా మరియు సమర్ధవంతంగా నిర్వహించాలి.
అన్నం. 2. భారీ సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్లను నిర్వహించడంలో సమస్యలు
ఈ స్థాయిలో క్లస్టర్లను నిర్వహించడంలో ప్రధాన సవాళ్లు ఏమిటి? చిత్రంలో చూపిన విధంగా, ఎదుర్కోవటానికి నాలుగు సమస్యలు ఉన్నాయి:
- విజాతీయత
ACK స్టాండర్డ్, సర్వర్లెస్, ఎడ్జ్, విండోస్ మరియు అనేక ఇతర రకాల క్లస్టర్లకు మద్దతు ఇవ్వాలి. వేర్వేరు క్లస్టర్లకు వేర్వేరు ఎంపికలు, భాగాలు మరియు హోస్టింగ్ మోడల్లు అవసరం. కొంతమంది కస్టమర్లు వారి నిర్దిష్ట కేసుల కోసం అనుకూలీకరణకు సహాయం కావాలి.
- వివిధ క్లస్టర్ పరిమాణాలు
సమూహాలు పరిమాణంలో మారుతూ ఉంటాయి, కొన్ని పాడ్లతో కూడిన రెండు నోడ్ల నుండి వేలాది పాడ్లతో పదివేల నోడ్ల వరకు ఉంటాయి. వనరుల అవసరాలు కూడా చాలా మారుతూ ఉంటాయి. సరికాని వనరుల కేటాయింపు పనితీరును ప్రభావితం చేయవచ్చు లేదా వైఫల్యానికి కూడా కారణం కావచ్చు.
- వివిధ వెర్షన్లు
కుబెర్నెటెస్ చాలా త్వరగా అభివృద్ధి చెందుతోంది. ప్రతి కొన్ని నెలలకు కొత్త వెర్షన్లు విడుదలవుతాయి. కొత్త ఫీచర్లను ప్రయత్నించడానికి కస్టమర్లు ఎల్లప్పుడూ సిద్ధంగా ఉంటారు. కాబట్టి వారు కుబెర్నెటీస్ యొక్క కొత్త వెర్షన్లపై టెస్ట్ లోడ్ను మరియు స్థిరమైన వాటిపై ప్రొడక్షన్ లోడ్ను ఉంచాలనుకుంటున్నారు. ఈ అవసరాన్ని తీర్చడానికి, స్థిరమైన వెర్షన్లను కొనసాగిస్తూనే ACK కస్టమర్లకు కుబెర్నెట్స్ యొక్క కొత్త వెర్షన్లను నిరంతరం అందించాలి.
- భద్రతా వర్తింపు
క్లస్టర్లు వివిధ ప్రాంతాలలో పంపిణీ చేయబడ్డాయి. అందుకని, వారు వివిధ భద్రతా అవసరాలు మరియు అధికారిక నిబంధనలకు అనుగుణంగా ఉండాలి. ఉదాహరణకు, యూరప్లోని క్లస్టర్ తప్పనిసరిగా GDPRకి అనుగుణంగా ఉండాలి, అయితే చైనాలోని ఫైనాన్షియల్ క్లౌడ్ తప్పనిసరిగా అదనపు రక్షణ పొరలను కలిగి ఉండాలి. ఈ అవసరాలు తప్పనిసరి మరియు వాటిని విస్మరించడం ఆమోదయోగ్యం కాదు, ఎందుకంటే ఇది క్లౌడ్ ప్లాట్ఫారమ్ యొక్క ఖాతాదారులకు భారీ నష్టాలను సృష్టిస్తుంది.
ACK ప్లాట్ఫారమ్ పైన పేర్కొన్న చాలా సమస్యలను పరిష్కరించడానికి రూపొందించబడింది. ఇది ప్రస్తుతం ప్రపంచవ్యాప్తంగా 10 వేల కంటే ఎక్కువ కుబెర్నెట్స్ క్లస్టర్లను విశ్వసనీయంగా మరియు స్థిరంగా నిర్వహిస్తోంది. అనేక కీలకమైన డిజైన్/ఆర్కిటెక్చర్ సూత్రాలతో సహా ఇది ఎలా సాధించబడిందో చూద్దాం.
డిజైన్
క్యూబ్-ఆన్-క్యూబ్ మరియు తేనెగూడు
కేంద్రీకృత సోపానక్రమం వలె కాకుండా, సెల్-ఆధారిత నిర్మాణం సాధారణంగా ఒకే డేటా సెంటర్కు మించి ప్లాట్ఫారమ్ను స్కేల్ చేయడానికి లేదా విపత్తు పునరుద్ధరణ పరిధిని విస్తరించడానికి ఉపయోగించబడుతుంది.
అలీబాబా క్లౌడ్లోని ప్రతి ప్రాంతం అనేక జోన్లను (AZ) కలిగి ఉంటుంది మరియు సాధారణంగా నిర్దిష్ట డేటా సెంటర్కు అనుగుణంగా ఉంటుంది. పెద్ద ప్రాంతంలో (ఉదాహరణకు హువాంగ్జౌ), తరచుగా వేల సంఖ్యలో కుబెర్నెట్స్ క్లయింట్ క్లస్టర్లు ACKని నడుపుతున్నాయి.
ACK ఈ Kubernetes క్లస్టర్లను Kubernetesని ఉపయోగించి నిర్వహిస్తుంది, అంటే మేము క్లయింట్ Kubernetes క్లస్టర్లను నిర్వహించడానికి Kubernetes మెటాక్లస్టర్ని కలిగి ఉన్నాము. ఈ నిర్మాణాన్ని "కుబే-ఆన్-కుబే" (KoK) అని కూడా పిలుస్తారు. KoK నిర్మాణం క్లయింట్ క్లస్టర్ల నిర్వహణను సులభతరం చేస్తుంది ఎందుకంటే క్లస్టర్ విస్తరణ సరళమైనది మరియు నిర్ణయాత్మకమైనది. మరీ ముఖ్యంగా, మేము స్థానిక కుబెర్నెట్స్ నుండి ఫీచర్లను మళ్లీ ఉపయోగించుకోవచ్చు. ఉదాహరణకు, విస్తరణ ద్వారా API సర్వర్లను నిర్వహించడం, బహుళ etcdలను నిర్వహించడానికి etcd ఆపరేటర్ని ఉపయోగించడం. ఇటువంటి పునరావృతం ఎల్లప్పుడూ ప్రత్యేక ఆనందాన్ని తెస్తుంది.
క్లయింట్ల సంఖ్యను బట్టి అనేక కుబెర్నెట్స్ మెటాక్లస్టర్లు ఒక ప్రాంతంలో మోహరించబడతాయి. మనం వీటిని మెటాక్లస్టర్ సెల్స్ అంటాము. మొత్తం జోన్ యొక్క వైఫల్యం నుండి రక్షించడానికి, ACK ఒకే ప్రాంతంలో బహుళ-యాక్టివ్ విస్తరణలకు మద్దతు ఇస్తుంది: మెటాక్లస్టర్ బహుళ జోన్లలో కుబెర్నెటెస్ క్లయింట్ క్లస్టర్ మాస్టర్ భాగాలను పంపిణీ చేస్తుంది మరియు వాటిని ఏకకాలంలో, అంటే బహుళ-యాక్టివ్ మోడ్లో అమలు చేస్తుంది. మాస్టర్ యొక్క విశ్వసనీయత మరియు సామర్థ్యాన్ని నిర్ధారించడానికి, ACK భాగాల ప్లేస్మెంట్ను ఆప్టిమైజ్ చేస్తుంది మరియు API సర్వర్ మరియు etcd ఒకదానికొకటి దగ్గరగా ఉండేలా చేస్తుంది.
ఈ మోడల్ కుబెర్నెట్లను సమర్ధవంతంగా, సరళంగా మరియు విశ్వసనీయంగా నిర్వహించడానికి మిమ్మల్ని అనుమతిస్తుంది.
మెటాక్లస్టర్ వనరుల ప్రణాళిక
మేము ఇప్పటికే చెప్పినట్లుగా, ప్రతి ప్రాంతంలోని మెటాక్లస్టర్ల సంఖ్య ఖాతాదారుల సంఖ్యపై ఆధారపడి ఉంటుంది. అయితే కొత్త మెటాక్లస్టర్ను ఏ సమయంలో జోడించాలి? ఇది సాధారణ వనరుల ప్రణాళిక సమస్య. నియమం ప్రకారం, ఇప్పటికే ఉన్న మెటాక్లస్టర్లు వాటి వనరులన్నీ అయిపోయినప్పుడు కొత్తదాన్ని సృష్టించడం ఆచారం.
ఉదాహరణకు, నెట్వర్క్ వనరులను తీసుకుందాం. KoK ఆర్కిటెక్చర్లో, క్లయింట్ క్లస్టర్ల నుండి కుబెర్నెటీస్ భాగాలు మెటాక్లస్టర్లో పాడ్లుగా అమర్చబడతాయి. మేము ఉపయోగిస్తాము
ప్రతి మెటాక్లస్టర్లోని క్లయింట్ క్లస్టర్ల సరైన సంఖ్యను నిర్ణయించడానికి, మేము మా ఖర్చులు, సాంద్రత అవసరాలు, వనరుల కోటా, విశ్వసనీయత అవసరాలు మరియు గణాంకాలను కూడా పరిగణనలోకి తీసుకుంటాము. ఈ మొత్తం సమాచారం ఆధారంగా కొత్త మెటాక్లస్టర్ను రూపొందించాలనే నిర్ణయం తీసుకోబడింది. చిన్న క్లస్టర్లు భవిష్యత్తులో బాగా విస్తరించవచ్చని దయచేసి గమనించండి, కాబట్టి క్లస్టర్ల సంఖ్య మారకుండా ఉన్నప్పటికీ వనరుల వినియోగం పెరుగుతుంది. మేము సాధారణంగా ప్రతి క్లస్టర్ పెరగడానికి తగినంత ఖాళీ స్థలాన్ని వదిలివేస్తాము.
అన్నం. 3. టెర్వే నెట్వర్క్ ఆర్కిటెక్చర్
క్లయింట్ క్లస్టర్లలో స్కేలింగ్ విజార్డ్ భాగాలు
విజార్డ్ భాగాలు విభిన్న వనరుల అవసరాలను కలిగి ఉంటాయి. అవి క్లస్టర్లోని నోడ్లు మరియు పాడ్ల సంఖ్య, APIServerతో పరస్పర చర్య చేసే ప్రామాణికం కాని కంట్రోలర్లు/ఆపరేటర్ల సంఖ్యపై ఆధారపడి ఉంటాయి.
ACKలో, ప్రతి Kubernetes క్లయింట్ క్లస్టర్ పరిమాణం మరియు రన్టైమ్ అవసరాలలో తేడా ఉంటుంది. విజార్డ్ భాగాలను ఉంచడానికి సార్వత్రిక కాన్ఫిగరేషన్ లేదు. పెద్ద క్లయింట్ కోసం మేము పొరపాటున తక్కువ వనరుల పరిమితిని సెట్ చేస్తే, దాని క్లస్టర్ లోడ్ని తట్టుకోలేకపోతుంది. మీరు అన్ని క్లస్టర్లకు సంప్రదాయబద్ధంగా అధిక పరిమితిని సెట్ చేస్తే, వనరులు వృధా అవుతాయి.
విశ్వసనీయత మరియు ఖర్చు మధ్య సూక్ష్మమైన ట్రేడ్-ఆఫ్ను కనుగొనడానికి, ACK ఒక టైప్ సిస్టమ్ను ఉపయోగిస్తుంది. అవి, మేము మూడు రకాల సమూహాలను నిర్వచించాము: చిన్న, మధ్యస్థ మరియు పెద్ద. ప్రతి రకానికి ప్రత్యేక వనరు కేటాయింపు ప్రొఫైల్ ఉంటుంది. విజర్డ్ భాగాల లోడ్, నోడ్ల సంఖ్య మరియు ఇతర కారకాలపై ఆధారపడి రకం నిర్ణయించబడుతుంది. క్లస్టర్ రకం కాలక్రమేణా మారవచ్చు. ACK ఈ కారకాలను నిరంతరం పర్యవేక్షిస్తుంది మరియు తదనుగుణంగా అప్/డౌన్ టైప్ చేయవచ్చు. క్లస్టర్ రకాన్ని మార్చిన తర్వాత, కనీస వినియోగదారు జోక్యంతో వనరుల కేటాయింపు స్వయంచాలకంగా నవీకరించబడుతుంది.
ఈ మార్పులు మరింత సజావుగా జరిగేలా మరియు మరింత ఆర్థికపరమైన అర్థాన్ని చేకూర్చేలా, సూక్ష్మమైన స్కేలింగ్ మరియు మరింత ఖచ్చితమైన రకాన్ని నవీకరించడం ద్వారా ఈ వ్యవస్థను మెరుగుపరచడానికి మేము కృషి చేస్తున్నాము.
అన్నం. 4. ఇంటెలిజెంట్ మల్టీ-స్టేజ్ టైప్ స్విచింగ్
స్కేల్ వద్ద క్లయింట్ క్లస్టర్ల పరిణామం
మునుపటి విభాగాలు పెద్ద సంఖ్యలో కుబెర్నెట్స్ క్లస్టర్లను నిర్వహించడంలో కొన్ని అంశాలను కవర్ చేశాయి. అయితే, పరిష్కరించాల్సిన మరో సమస్య ఉంది: క్లస్టర్ల పరిణామం.
కుబెర్నెటెస్ అనేది క్లౌడ్ వరల్డ్ యొక్క "లైనక్స్". ఇది నిరంతరం నవీకరించబడుతుంది మరియు మరింత మాడ్యులర్ అవుతుంది. మేము మా కస్టమర్లకు నిరంతరం కొత్త సంస్కరణలను అందించాలి, దుర్బలత్వాలను పరిష్కరించాలి మరియు ఇప్పటికే ఉన్న క్లస్టర్లను నవీకరించాలి, అలాగే పెద్ద సంఖ్యలో సంబంధిత భాగాలను (CSI, CNI, పరికర ప్లగిన్, షెడ్యూలర్ ప్లగిన్ మరియు అనేక ఇతరాలు) నిర్వహించాలి.
కుబెర్నెట్స్ కాంపోనెంట్ మేనేజ్మెంట్ని ఉదాహరణగా తీసుకుందాం. ప్రారంభించడానికి, మేము ఈ కనెక్ట్ చేయబడిన అన్ని భాగాలను నమోదు చేయడానికి మరియు నిర్వహించడానికి కేంద్రీకృత వ్యవస్థను అభివృద్ధి చేసాము.
అన్నం. 5. ఫ్లెక్సిబుల్ మరియు ప్లగ్ చేయదగిన భాగాలు
ముందుకు వెళ్లడానికి ముందు, మీరు నవీకరణ విజయవంతమైందని నిర్ధారించుకోవాలి. దీన్ని చేయడానికి, మేము భాగాల కార్యాచరణను తనిఖీ చేయడానికి ఒక వ్యవస్థను అభివృద్ధి చేసాము. నవీకరణకు ముందు మరియు తర్వాత తనిఖీ చేయబడుతుంది.
అన్నం. 6. క్లస్టర్ భాగాల ప్రాథమిక తనిఖీ
ఈ భాగాలను త్వరగా మరియు విశ్వసనీయంగా అప్డేట్ చేయడానికి, నిరంతర విస్తరణ వ్యవస్థ పాక్షిక పురోగతి (గ్రేస్కేల్), పాజ్లు మరియు ఇతర ఫంక్షన్లకు మద్దతుతో పని చేస్తుంది. ప్రామాణిక కుబెర్నెటెస్ కంట్రోలర్లు ఈ వినియోగ సందర్భానికి సరిగ్గా సరిపోవు. అందువల్ల, క్లస్టర్ భాగాలను నిర్వహించడానికి, మేము ప్లగిన్ మరియు సహాయక నియంత్రణ మాడ్యూల్ (సైడ్కార్ మేనేజ్మెంట్)తో సహా ప్రత్యేక కంట్రోలర్ల సమితిని అభివృద్ధి చేసాము.
ఉదాహరణకు, BroadcastJob కంట్రోలర్ ప్రతి వర్కర్ మెషీన్లోని భాగాలను నవీకరించడానికి లేదా ప్రతి మెషీన్లోని నోడ్లను తనిఖీ చేయడానికి రూపొందించబడింది. బ్రాడ్కాస్ట్ జాబ్ క్లస్టర్లోని ప్రతి నోడ్లో డెమోన్సెట్ వంటి పాడ్ను అమలు చేస్తుంది. అయినప్పటికీ, DaemonSet ఎల్లప్పుడూ పాడ్ను చాలా కాలం పాటు నడుపుతుంది, అయితే BroadcastJob దానిని కూలిపోతుంది. బ్రాడ్కాస్ట్ కంట్రోలర్ కొత్తగా చేరిన నోడ్లపై పాడ్లను కూడా ప్రారంభిస్తుంది మరియు అవసరమైన భాగాలతో నోడ్లను ప్రారంభిస్తుంది. జూన్ 2019లో, మేము కంపెనీలో ఉపయోగించే OpenKruise ఆటోమేషన్ ఇంజిన్ యొక్క సోర్స్ కోడ్ను తెరిచాము.
అన్నం. 7. OpenKurise అన్ని నోడ్లలో బ్రాడ్కాస్ట్ టాస్క్ యొక్క అమలును నిర్వహిస్తుంది
కస్టమర్లు సరైన క్లస్టర్ కాన్ఫిగరేషన్లను ఎంచుకోవడంలో సహాయపడటానికి, మేము సర్వర్లెస్, ఎడ్జ్, విండోస్ మరియు బేర్ మెటల్ ప్రొఫైల్లతో సహా ముందే నిర్వచించిన ప్రొఫైల్ల సమితిని కూడా అందిస్తాము. ల్యాండ్స్కేప్ విస్తరిస్తున్నప్పుడు మరియు మా కస్టమర్ల అవసరాలు పెరుగుతున్నప్పుడు, దుర్భరమైన సెటప్ ప్రక్రియను సులభతరం చేయడానికి మేము మరిన్ని ప్రొఫైల్లను జోడిస్తాము.
అన్నం. 8. వివిధ దృశ్యాల కోసం అధునాతన మరియు సౌకర్యవంతమైన క్లస్టర్ ప్రొఫైల్లు
డేటా సెంటర్లలో గ్లోబల్ అబ్జర్బిలిటీ
క్రింద అంజీర్లో చూపిన విధంగా. 9, అలీబాబా క్లౌడ్ కంటైనర్ క్లౌడ్ సేవ ప్రపంచవ్యాప్తంగా ఇరవై ప్రాంతాలలో అమలు చేయబడింది. ఈ స్కేల్ను బట్టి, ACK యొక్క ముఖ్య లక్ష్యాలలో ఒకటి రన్నింగ్ క్లస్టర్ల స్థితిని సులభంగా పర్యవేక్షించడం, తద్వారా క్లయింట్ క్లస్టర్కు సమస్య ఎదురైతే, మేము పరిస్థితికి త్వరగా ప్రతిస్పందించగలము. మరో మాటలో చెప్పాలంటే, అన్ని ప్రాంతాల్లోని క్లయింట్ క్లస్టర్ల నుండి నిజ సమయంలో గణాంకాలను సమర్ధవంతంగా మరియు సురక్షితంగా సేకరించడానికి మిమ్మల్ని అనుమతించే పరిష్కారాన్ని మీరు రూపొందించాలి - మరియు ఫలితాలను దృశ్యమానంగా ప్రదర్శించండి.
అన్నం. 9. ఇరవై ప్రాంతాలలో అలీబాబా క్లౌడ్ కంటైనర్ సేవ యొక్క గ్లోబల్ విస్తరణ
అనేక కుబెర్నెట్స్ పర్యవేక్షణ వ్యవస్థల వలె, మేము మా ప్రధాన సాధనంగా ప్రోమేతియస్ని ఉపయోగిస్తాము. ప్రతి మెటాక్లస్టర్ కోసం, ప్రోమేతియస్ ఏజెంట్లు క్రింది కొలమానాలను సేకరిస్తారు:
- హోస్ట్ వనరులు (CPU, మెమరీ, డిస్క్, మొదలైనవి) మరియు నెట్వర్క్ బ్యాండ్విడ్త్ వంటి OS మెట్రిక్లు.
- kube-apiserver, kube-controller-manager మరియు kube-scheduler వంటి మెట్రిక్లస్టర్ మరియు క్లయింట్ క్లస్టర్ మేనేజ్మెంట్ సిస్టమ్ కోసం కొలమానాలు.
- kubernetes-state-metrics మరియు cadvisor నుండి కొలమానాలు.
- డిస్క్ వ్రాసే సమయం, డేటాబేస్ పరిమాణం, నోడ్ల మధ్య కనెక్షన్ల నిర్గమాంశ మొదలైన etcd కొలమానాలు.
సాధారణ బహుళ-లేయర్ అగ్రిగేషన్ మోడల్ని ఉపయోగించి గ్లోబల్ గణాంకాలు సేకరించబడతాయి. ప్రతి మెటాక్లస్టర్ నుండి మానిటరింగ్ డేటా మొదట ప్రతి ప్రాంతంలో సమగ్రపరచబడుతుంది మరియు తర్వాత మొత్తం చిత్రాన్ని చూపే సెంట్రల్ సర్వర్కు పంపబడుతుంది. అంతా ఫెడరేషన్ యంత్రాంగం ద్వారానే పని చేస్తుంది. ప్రతి డేటా సెంటర్లోని ప్రోమేతియస్ సర్వర్ ఆ డేటా సెంటర్ నుండి కొలమానాలను సేకరిస్తుంది మరియు పర్యవేక్షణ డేటాను సమగ్రపరచడానికి సెంట్రల్ ప్రోమేతియస్ సర్వర్ బాధ్యత వహిస్తుంది. AlertManager సెంట్రల్ ప్రోమేథియస్కి కనెక్ట్ చేస్తుంది మరియు అవసరమైతే, DingTalk, ఇమెయిల్, SMS మొదలైన వాటి ద్వారా హెచ్చరికలను పంపుతుంది. విజువలైజేషన్ - గ్రాఫానాను ఉపయోగించి.
మూర్తి 10లో, పర్యవేక్షణ వ్యవస్థను మూడు స్థాయిలుగా విభజించవచ్చు:
- సరిహద్దు స్థాయి
మధ్య నుండి చాలా దూరంలో ఉన్న పొర. ప్రోమేతియస్ ఎడ్జ్ సర్వర్ ప్రతి మెటాక్లస్టర్లో నడుస్తుంది, అదే నెట్వర్క్ డొమైన్లోని మెటా మరియు క్లయింట్ క్లస్టర్ల నుండి కొలమానాలను సేకరిస్తుంది.
- క్యాస్కేడ్ స్థాయి
ప్రోమేతియస్ క్యాస్కేడ్ లేయర్ యొక్క విధి బహుళ ప్రాంతాల నుండి పర్యవేక్షణ డేటాను సేకరించడం. ఈ సర్వర్లు చైనా, ఆసియా, యూరప్ మరియు అమెరికా వంటి పెద్ద భౌగోళిక యూనిట్ల స్థాయిలో పనిచేస్తాయి. సమూహాలు పెరిగేకొద్దీ, ప్రాంతాన్ని విభజించవచ్చు, ఆపై ప్రతి కొత్త పెద్ద ప్రాంతంలో క్యాస్కేడ్-స్థాయి ప్రోమేథియస్ సర్వర్ కనిపిస్తుంది. ఈ వ్యూహంతో, మీరు అవసరమైన విధంగా సజావుగా స్కేల్ చేయవచ్చు.
- కేంద్ర స్థాయి
సెంట్రల్ ప్రోమేతియస్ సర్వర్ అన్ని క్యాస్కేడ్ సర్వర్లకు కనెక్ట్ చేస్తుంది మరియు తుది డేటా అగ్రిగేషన్ను నిర్వహిస్తుంది. విశ్వసనీయత కోసం, ఒకే క్యాస్కేడ్ సర్వర్లకు కనెక్ట్ చేయబడిన రెండు సెంట్రల్ ప్రోమేతియస్ ఉదంతాలు వేర్వేరు జోన్లలో పెంచబడ్డాయి.
అన్నం. 10. ప్రోమేతియస్ ఫెడరేషన్ మెకానిజం ఆధారంగా గ్లోబల్ మల్టీ-లెవల్ మానిటరింగ్ ఆర్కిటెక్చర్
సారాంశం
కుబెర్నెట్స్ ఆధారిత క్లౌడ్ సొల్యూషన్లు మా పరిశ్రమను మారుస్తూనే ఉన్నాయి. అలీబాబా క్లౌడ్ కంటైనర్ సేవ సురక్షితమైన, నమ్మదగిన మరియు అధిక-పనితీరు గల హోస్టింగ్ను అందిస్తుంది - ఇది ఉత్తమ కుబెర్నెట్స్ క్లౌడ్ హోస్టింగ్లో ఒకటి. అలీబాబా క్లౌడ్ బృందం ఓపెన్ సోర్స్ మరియు ఓపెన్ సోర్స్ కమ్యూనిటీ సూత్రాలను గట్టిగా నమ్ముతుంది. క్లౌడ్ టెక్నాలజీల నిర్వహణ మరియు నిర్వహణ రంగంలో మా పరిజ్ఞానాన్ని మేము ఖచ్చితంగా పంచుకుంటాము.
మూలం: www.habr.com