ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

ከ 2008 ጀምሮ ድርጅታችን በዋናነት በመሠረተ ልማት አስተዳደር እና በድር ፕሮጀክቶች ላይ የሰዓት-ሰዓት የቴክኒክ ድጋፍ ላይ ተሰማርቷል: ከ 400 በላይ ደንበኞች አሉን, ይህም የሩስያ ኢ-ኮሜርስ 15% ነው. በዚህ መሠረት, በጣም የተለያየ አርክቴክቸር ይደገፋል. የሆነ ነገር ከወደቀ በ15 ደቂቃ ውስጥ ለማስተካከል እንገደዳለን። ነገር ግን አደጋ መከሰቱን ለመረዳት ፕሮጀክቱን መከታተል እና ለአደጋዎች ምላሽ መስጠት ያስፈልግዎታል. ይህን እንዴት ማድረግ ይቻላል?

ትክክለኛ የክትትል ሥርዓት በማደራጀት ላይ ችግር እንዳለ አምናለሁ። ምንም ችግር ባይኖር ኖሮ ንግግሬ አንድ ቲሲስን ይይዛል፡- “እባክዎ ፕሮሜቲየስ + ግራፋናን እና ተሰኪ 1፣ 2፣ 3ን ይጫኑ። እንደ አለመታደል ሆኖ ከአሁን በኋላ እንደዚያ አይሰራም። እና ዋናው ችግር ሁሉም በሶፍትዌር አካላት በ 2008 በነበረው ነገር ማመኑን ቀጥሏል.

የክትትል ስርዓቱን አደረጃጀት በተመለከተ... ብቁ ክትትል ያላቸው ፕሮጀክቶች የሉም ለማለት እደፍራለሁ። እና ሁኔታው ​​​​በጣም መጥፎ ከመሆኑ የተነሳ አንድ ነገር ቢወድቅ ሳይስተዋል አይቀርም - ለነገሩ ሁሉም ሰው "ሁሉም ነገር ክትትል እንደሚደረግበት" እርግጠኛ ነው.
ምናልባት ሁሉም ነገር ቁጥጥር ይደረግበታል. ግን እንዴት?

ሁላችንም የሚከተለውን የመሰለ ታሪክ አጋጥሞናል፡ የተወሰኑ ዲፖፖች፣ አንድ አስተዳዳሪ እየሰሩ ነው፣ የልማት ቡድን ወደ እነርሱ መጥቶ - “ተፈታን፣ አሁን ተቆጣጠር” አላቸው። ምን ተከታተል? እንዴት እንደሚሰራ?

እሺ የድሮውን መንገድ እንቆጣጠራለን. እና ቀድሞውንም እየተቀየረ ነው፣ እና እርስዎ ተቆጣጠሩት አገልግሎት A ፣ እሱም አገልግሎት B የሆነው ፣ ከአገልግሎት C ጋር የሚገናኝ። ግን የልማት ቡድኑ “ሶፍትዌሩን ጫን ፣ ሁሉንም ነገር መከታተል አለበት!” ይልዎታል ።

ታዲያ ምን ተለወጠ? - ሁሉም ነገር ተቀይሯል!

2008 ዓ.ም ሁሉ ነገር ጥሩ ነው

ሁለት ገንቢዎች፣ አንድ አገልጋይ፣ አንድ የውሂብ ጎታ አገልጋይ አሉ። ሁሉም ከዚህ ይሄዳል። የተወሰነ መረጃ አለን, zabbix, Nagios, cacti ን እንጭናለን. እና ከዚያ በሲፒዩ, በዲስክ አሠራር እና በዲስክ ቦታ ላይ ግልጽ ማንቂያዎችን እናዘጋጃለን. እንዲሁም ጣቢያው ምላሽ መስጠቱን እና ትዕዛዞች ወደ ዳታቤዝ ውስጥ መድረሳቸውን ለማረጋገጥ ሁለት የእጅ ፍተሻዎችን እናደርጋለን። እና ያ ነው - ብዙ ወይም ያነሰ ጥበቃ እናደርጋለን.

በዚያን ጊዜ አስተዳዳሪው ለክትትል ለማቅረብ የሠሩትን የሥራ መጠን ብናነፃፅር 98% የሚሆነው አውቶማቲክ ነበር፡ መቆጣጠሪያውን የሚሠራው ሰው ዛቢክስን እንዴት መጫን እንዳለበት፣ እንዴት እንደሚያዋቅር እና ማንቂያዎችን እንደሚያዋቅር መረዳት አለበት። እና 2% - ለውጫዊ ፍተሻዎች: ጣቢያው ምላሽ እንደሚሰጥ እና ለዳታቤዝ ጥያቄ ያቀርባል, አዲስ ትዕዛዞች እንደመጡ.

ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

2010 ጭነቱ እየጨመረ ነው

የፍለጋ ሞተር በማከል ድሩን መመዘን እንጀምራለን. የምርት ካታሎግ ሁሉንም ምርቶች እንደያዘ ማረጋገጥ እንፈልጋለን። እና ያ የምርት ፍለጋ ይሰራል. ዳታቤዙ እየሰራ መሆኑን፣ ትእዛዝ እየሰጠ መሆኑን፣ ጣቢያው ከውጭ ምላሽ እንደሚሰጥ እና ከሁለት ሰርቨሮች ምላሽ እንደሚሰጥ እና ተጠቃሚው ወደ ሌላ አገልጋይ ሲቀየር ከጣቢያው እንደማይባረር ወዘተ. ተጨማሪ አካላት አሉ።

ከዚህም በላይ ከመሠረተ ልማት ጋር የተያያዘው አካል አሁንም በአስተዳዳሪው ራስ ውስጥ ትልቁ ሆኖ ይቆያል. አሁንም በጭንቅላቴ ውስጥ ክትትል የሚያደርግ ሰው ዛቢክስን የሚጭን እና ሊያዋቅር የሚችል ሰው ነው የሚል ሀሳብ አለ።

ግን በተመሳሳይ ጊዜ የውጭ ቼኮችን በማካሄድ ላይ ሥራ ይታያል ፣ የፍለጋ ጠቋሚ መጠይቅ ስክሪፕቶች ስብስብ ፣ ፍለጋው በመረጃ ጠቋሚው ሂደት ውስጥ መቀየሩን የሚፈትሹ ስክሪፕቶች ፣ ዕቃዎች ወደ መተላለፉን የሚፈትሹ ስክሪፕቶች ስብስብ የመላኪያ አገልግሎት ወዘተ. እናም ይቀጥላል.

ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

ማስታወሻ: "የስክሪፕት ስብስብ" 3 ጊዜ ጻፍኩ. ማለትም፣ የመከታተል ኃላፊነት ያለው ሰው ዛቢክስን በቀላሉ የሚጭን ሰው አይደለም። ኮድ ማድረግ የጀመረ ሰው ነው። ግን በቡድኑ አእምሮ ውስጥ እስካሁን የተለወጠ ነገር የለም።

ነገር ግን ዓለም እየተቀየረ፣ እየተወሳሰበ እና እየተወሳሰበ ነው። ምናባዊ ሽፋን እና በርካታ አዳዲስ ስርዓቶች ተጨምረዋል። እርስ በርስ መግባባት ይጀምራሉ. “እንደ ማይክሮ ሰርቪስ ይሸታል?” ያለው ማነው? ግን እያንዳንዱ አገልግሎት አሁንም በተናጥል እንደ ድር ጣቢያ ይመስላል። ወደ እሱ ዞር ብለን አስፈላጊውን መረጃ እንደሚሰጥ እና በራሱ እንደሚሰራ መረዳት እንችላለን. እና ለ 5-7-10 ዓመታት በማደግ ላይ ባለው ፕሮጀክት ውስጥ አስተዳዳሪ ከሆንክ ፣ ይህ እውቀት ይከማቻል-አዲስ ደረጃ ታየ - ተገነዘብክ ፣ ሌላ ደረጃ ታየ - ተረዳኸው…

ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

ግን ለ 10 ዓመታት ማንም ሰው ከፕሮጀክቱ ጋር እምብዛም አይሄድም.

ሞኒተሪንግማን ከቆመበት ቀጥል

ወደ አዲስ ጀማሪ መጥተህ ወዲያው 20 ገንቢዎችን ቀጥሮ 15 ማይክሮ ሰርቪስ ጻፈ እና አንተ አስተዳዳሪ ነህ፡- “CI/CD ገንባ። አባክሽን." CI/CD ገንብተሃል እና በድንገት ሰማህ፡- "በ"cube" ውስጥ ከምርት ጋር ለመስራት አስቸጋሪ ነው፣ አፕሊኬሽኑ በውስጡ እንዴት እንደሚሰራ ሳንረዳ። በተመሳሳዩ "ኩብ" ውስጥ ማጠሪያ አድርገን.
በዚህ ኩብ ውስጥ ማጠሪያ ይሠራሉ. ወዲያውኑ “በመረጃ ቋቱ ላይ የሚሰራ መሆኑን እንድንገነዘብ ከምርት ጀምሮ በየቀኑ የሚዘመን የመድረክ ዳታቤዝ እንፈልጋለን ነገር ግን በተመሳሳይ ጊዜ የምርት ዳታቤዙን እንዳያበላሽ” ይነግሩዎታል።

በዚህ ሁሉ ውስጥ ትኖራለህ። ከመለቀቁ በፊት 2 ሳምንታት ቀርተዋል፣ “አሁን ይህን ሁሉ እንከታተል…” ማለትም ይነግሩዎታል። የክላስተር መሠረተ ልማትን መከታተል፣ የማይክሮ አገልግሎት አርክቴክቸርን መከታተል፣ ከውጭ አገልግሎቶች ጋር መሥራትን መከታተል...

እና ባልደረቦቼ የተለመደውን እቅድ ከጭንቅላታቸው አውጥተው እንዲህ ይላሉ: - "ደህና, ሁሉም ነገር እዚህ ግልጽ ነው! ይህን ሁሉ የሚከታተል ፕሮግራም ጫን። አዎ፣ አዎ፡ ፕሮሜቴየስ + ግራፋና + ተሰኪዎች።
እነሱም አክለው “ሁለት ሳምንት አለህ፣ ሁሉም ነገር ደህንነቱ የተጠበቀ መሆኑን አረጋግጥ።

በምናያቸው ብዙ ፕሮጀክቶች ውስጥ አንድ ሰው ለክትትል ይመደባል. ለ 2 ሳምንታት ክትትል ለማድረግ አንድ ሰው መቅጠር እንደምንፈልግ አስብ እና ለሱ መግለጫ ጻፍን። እስካሁን የተናገርነውን ሁሉ ግምት ውስጥ በማስገባት ይህ ሰው ምን ዓይነት ችሎታ ሊኖረው ይገባል?

  • የብረት መሠረተ ልማትን አሠራር መከታተል እና ዝርዝር ሁኔታ መረዳት አለበት.
  • የኩበርኔትስን የክትትል ዝርዝር ሁኔታ መረዳት አለበት (እና ሁሉም ወደ “ኩብ” መሄድ ይፈልጋል ፣ ምክንያቱም ከሁሉም ነገር ማጠቃለል ፣ መደበቅ ፣ ምክንያቱም አስተዳዳሪው ከቀረው ጋር ስለሚገናኝ) - ልሹ ፣ መሠረተ ልማቱ እና መተግበሪያዎችን እንዴት እንደሚቆጣጠሩ ይረዱ። ውስጥ.
  • አገልግሎቶች እርስ በርሳቸው በልዩ መንገዶች እንደሚግባቡ መረዳት አለበት፣ እና አገልግሎቶች እንዴት እርስበርስ እንደሚገናኙ ዝርዝሩን ማወቅ አለበት። አንዳንድ አገልግሎቶች በተመሳሳይ መንገድ የሚገናኙበትን ፕሮጀክት ማየት በጣም ይቻላል ፣ ምክንያቱም ሌላ መንገድ የለም። ለምሳሌ፣ ጀርባው በ REST፣ በgRPC በኩል ወደ ካታሎግ አገልግሎት ይሄዳል፣ የምርት ዝርዝሮችን ተቀብሎ መልሶ ይመለሳል። እዚህ መጠበቅ አይችሉም። እና ከሌሎች አገልግሎቶች ጋር በማይመሳሰል መልኩ ይሰራል። ትዕዛዙን ወደ ማቅረቢያ አገልግሎት ያስተላልፉ, ደብዳቤ ይላኩ, ወዘተ.
    ከዚህ ሁሉ ቀደም ብለው ዋኝተው ሊሆን ይችላል? ይህንን መከታተል የሚያስፈልገው አስተዳዳሪም የበለጠ ግራ ተጋባ።
  • በትክክል ማቀድ እና ማቀድ መቻል አለበት - ስራው እየጨመረ ሲሄድ.
  • ስለዚህ እንዴት በተለየ ሁኔታ መከታተል እንዳለበት ለመረዳት ከተፈጠረው አገልግሎት ስትራቴጂ መፍጠር አለበት. የፕሮጀክቱን አርክቴክቸር እና እድገቱን + በልማት ውስጥ ጥቅም ላይ የዋሉ ቴክኖሎጂዎችን ግንዛቤ ያስፈልገዋል።

አንድ ፍጹም የተለመደ ጉዳይ እናስታውስ፡ አንዳንድ አገልግሎቶች በPHP ውስጥ አሉ፣ አንዳንድ አገልግሎቶች በ Go ውስጥ አሉ፣ አንዳንድ አገልግሎቶች በJS አሉ። በሆነ መንገድ እርስ በርስ ይሠራሉ. "ማይክሮ አገልግሎት" የሚለው ቃል የመጣው እዚህ ነው: በጣም ብዙ የግለሰብ ስርዓቶች አሉ, ገንቢዎች ፕሮጀክቱን በአጠቃላይ ሊረዱት አይችሉም. የቡድኑ አንዱ አካል በጄኤስ ውስጥ በራሳቸው የሚሰሩ አገልግሎቶችን ይጽፋሉ እና የተቀረው ስርዓት እንዴት እንደሚሰራ አያውቁም. ሌላው ክፍል በፓይዘን ውስጥ አገልግሎቶችን ይጽፋል እና ሌሎች አገልግሎቶች እንዴት እንደሚሰሩ ላይ ጣልቃ አይገባም, በራሳቸው አካባቢ ተለይተዋል. ሦስተኛው አገልግሎት በPHP ወይም በሌላ ነገር መጻፍ ነው።
እነዚህ ሁሉ 20 ሰዎች በ 15 አገልግሎቶች የተከፋፈሉ ናቸው, እና ይህን ሁሉ መረዳት ያለበት አንድ አስተዳዳሪ ብቻ ነው. ተወ! ስርዓቱን ወደ 15 ማይክሮ ሰርቪስ እንከፍላለን ምክንያቱም 20 ሰዎች አጠቃላይ ስርዓቱን ሊረዱ አይችሉም።

ግን በሆነ መልኩ ክትትል ሊደረግበት ይገባል...

ውጤቱ ምንድነው? በውጤቱም ፣ መላው የገንቢዎች ቡድን ሊረዳው የማይችለውን ሁሉንም ነገር የሚያመጣ አንድ ሰው አለ ፣ እና በተመሳሳይ ጊዜ ከላይ ያመለከትነውን ማወቅ እና ማድረግ መቻል አለበት - የሃርድዌር መሠረተ ልማት ፣ የኩበርኔትስ መሠረተ ልማት ፣ ወዘተ.

ምን ልበል...ሂውስተን፣ ችግር አለብን።

ዘመናዊ የሶፍትዌር ፕሮጄክትን መከታተል በራሱ የሶፍትዌር ፕሮጀክት ነው።

ክትትል ሶፍትዌር ነው ከሚል የተሳሳተ እምነት፣ በተአምራት ላይ እምነት እናዳብራለን። ነገር ግን ተአምራት, ወዮ, አይከሰትም. zabbix ን መጫን እና ሁሉም ነገር እንዲሰራ መጠበቅ አይችሉም. Grafana ን መጫን እና ሁሉም ነገር ደህና እንደሚሆን ተስፋ ማድረግ ምንም ፋይዳ የለውም. አብዛኛው ጊዜ የአገልግሎቶችን አሠራር እና እርስ በርስ ያላቸውን ግንኙነት ቼኮች በማደራጀት, ውጫዊ ስርዓቶች እንዴት እንደሚሠሩ በመፈተሽ ላይ ይውላል. በእርግጥ 90% የሚሆነው ጊዜ የሚጠፋው ስክሪፕቶችን ለመፃፍ ሳይሆን ሶፍትዌርን በማዘጋጀት ነው። እና የፕሮጀክቱን ስራ በተረዳ ቡድን መያያዝ አለበት.
በዚህ ሁኔታ አንድ ሰው በክትትል ውስጥ ከተጣለ, ከዚያም አደጋ ይከሰታል. የትኛውም ቦታ ነው የሚሆነው።

ለምሳሌ, በካፍካ በኩል እርስ በርስ የሚግባቡ በርካታ አገልግሎቶች አሉ. ትዕዛዙ ደረሰ, ስለ ትዕዛዙ ለካፍካ መልእክት ልከናል. ስለ ትዕዛዙ መረጃን የሚያዳምጥ እና እቃውን የሚያጓጉዝ አገልግሎት አለ. ስለ ትዕዛዙ መረጃ የሚያዳምጥ እና ለተጠቃሚው ደብዳቤ የሚልክ አገልግሎት አለ። እና ከዚያ ብዙ ተጨማሪ አገልግሎቶች ይታያሉ, እና ግራ መጋባት እንጀምራለን.

እና ከመልቀቁ በፊት ትንሽ ጊዜ ሲቀረው ይህንን ለአስተዳዳሪው እና ለገንቢዎች በደረጃው ላይ ከሰጡት ሰውዬው ይህንን ፕሮቶኮል ሙሉ በሙሉ መረዳት አለበት። እነዚያ። የዚህ ልኬት ፕሮጀክት ከፍተኛ መጠን ያለው ጊዜ ይወስዳል, እና ይህ በስርዓተ-ልማት ውስጥ መታወቅ አለበት.
ነገር ግን ብዙ ጊዜ፣ በተለይም በጅማሬዎች ውስጥ፣ ክትትል እስከ በኋላ እንዴት እንደሚዘገይ እናያለን። “አሁን የፅንሰ-ሃሳብ ማረጋገጫ እንሰራለን፣ በእሱ እንጀምራለን፣ ይወድቃል - ለመስዋዕትነት ዝግጁ ነን። ከዚያም ሁሉንም እንከታተላለን። ፕሮጀክቱ ገንዘብ ማግኘት ሲጀምር (ወይም ከሆነ) ንግዱ ተጨማሪ ባህሪያትን ለመጨመር ይፈልጋል - ምክንያቱም መስራት ስለጀመረ, የበለጠ መዘርጋት አለበት! እና እርስዎ ቀደም ብለው ሁሉንም ነገር መከታተል በሚፈልጉበት ደረጃ ላይ ነዎት ፣ ይህም ጊዜ 1% አይወስድም ፣ ግን ብዙ ተጨማሪ። እና በነገራችን ላይ ገንቢዎች ለክትትል ያስፈልጋሉ, እና በአዲስ ባህሪያት ላይ እንዲሰሩ መፍቀድ ቀላል ነው. በውጤቱም, አዳዲስ ባህሪያት ተጽፈዋል, ሁሉም ነገር ተበላሽቷል, እና እርስዎ ማለቂያ በሌለው የመጨረሻ ገደብ ውስጥ ነዎት.

ስለዚህ ከመጀመሪያው ጀምሮ አንድን ፕሮጀክት እንዴት እንደሚቆጣጠሩ እና ክትትል ሊደረግበት የሚገባ ፕሮጀክት ካገኙ ምን ማድረግ እንዳለቦት, ግን የት መጀመር እንዳለ አታውቁም?

በመጀመሪያ, ማቀድ ያስፈልግዎታል.

ግጥማዊ መረበሽ፡ ብዙ ጊዜ በመሠረተ ልማት ክትትል ይጀምራሉ። ለምሳሌ, Kubernetes አሉን. ፕሮሜቲየስን ከግራፋና ጋር በመጫን እንጀምር፣ “cube”ን ለመከታተል ፕለጊኖችን በመትከል እንጀምር። ገንቢዎች ብቻ ሳይሆኑ አስተዳዳሪዎችም “ይህን ፕለጊን እንጭነዋለን፣ ግን ተሰኪው እንዴት እንደሚሰራ ያውቅ ይሆናል” የሚል መጥፎ ተግባር አላቸው። ሰዎች ከአስፈላጊ ድርጊቶች ይልቅ በቀላል እና በቀላል መጀመር ይወዳሉ። እና የመሠረተ ልማት ክትትል ቀላል ነው.

በመጀመሪያ ምን እና እንዴት መከታተል እንደሚፈልጉ ይወስኑ እና ከዚያ መሳሪያ ይምረጡ, ምክንያቱም ሌሎች ሰዎች ለእርስዎ ማሰብ አይችሉም. እና አለባቸው? ሌሎች ሰዎች ስለ ሁለንተናዊ ስርዓት ለራሳቸው አስበው ነበር - ወይም ይህ ተሰኪ ሲጻፍ በጭራሽ አላሰቡም። እና ይህ ፕለጊን 5 ሺህ ተጠቃሚዎች አሉት ማለት ምንም ጥቅም የለውም ማለት አይደለም። ምናልባት 5001ኛው ትሆናለህ ምክንያቱም ከዚህ በፊት 5000 ሰዎች ስለነበሩ ነው።

መሠረተ ልማትን መከታተል ከጀመሩ እና የመተግበሪያዎ ጀርባ ምላሽ መስጠት ካቆመ ሁሉም ተጠቃሚዎች ከሞባይል መተግበሪያ ጋር ያለውን ግንኙነት ያጣሉ. ስህተት ይመጣል። ወደ አንተ መጥተው “መተግበሪያው አይሰራም፣ እዚህ ምን እየሰራህ ነው?” ይሉሃል። - "እኛ እየተከታተልን ነው." - "መተግበሪያው እየሰራ እንዳልሆነ ካላዩ እንዴት ይቆጣጠራሉ?!"

  1. ከተጠቃሚው መግቢያ ነጥብ በትክክል መከታተል መጀመር እንዳለቦት አምናለሁ። ተጠቃሚው አፕሊኬሽኑ እየሰራ መሆኑን ካላየ ያ ነው, ውድቀት ነው. እና የክትትል ስርዓቱ በመጀመሪያ ስለዚህ ጉዳይ ማስጠንቀቅ አለበት.
  2. እና ከዚያ በኋላ ብቻ ነው መሠረተ ልማትን መከታተል የምንችለው. ወይም በትይዩ ያድርጉት። በመሠረተ ልማት ቀላል ነው - እዚህ በመጨረሻ zabbix ን መጫን እንችላለን።
  3. እና አሁን ነገሮች የማይሰሩበትን ለመረዳት ወደ የመተግበሪያው ስር መሄድ ያስፈልግዎታል።

ዋናው ሃሳቤ ክትትል ከልማቱ ሂደት ጋር አብሮ መሄድ አለበት የሚል ነው። የክትትል ቡድኑን ለሌላ ተግባር ካዘናጉት (ሲአይ/ሲዲ መፍጠር፣ የአሸዋ ቦክስ፣ የመሠረተ ልማት መልሶ ማደራጀት)፣ ክትትሉ ማዘግየት ይጀምራል እና ከልማት ጋር ጨርሶ ላይገኙ ይችላሉ (ወይ ፈጥኖም ሆነ ዘግይቶ ማቆም አለብዎት)።

ሁሉም ነገር በደረጃ

የክትትል ሥርዓት አደረጃጀትን የማየው በዚህ መንገድ ነው።

1) የመተግበሪያ ደረጃ;

  • የክትትል መተግበሪያ የንግድ አመክንዮ;
  • የአገልግሎቶች የጤና መለኪያዎችን መከታተል;
  • ውህደት ክትትል.

2) የመሠረተ ልማት ደረጃ;

  • የኦርኬስትራ ደረጃ ክትትል;
  • የስርዓት ሶፍትዌር ክትትል;
  • የብረት ደረጃ ክትትል.

3) እንደገና የማመልከቻው ደረጃ - ግን እንደ የምህንድስና ምርት:

  • የመተግበሪያ ምዝግብ ማስታወሻዎችን መሰብሰብ እና መከታተል;
  • ኤፒኤም;
  • መከታተል.

4) ማስጠንቀቂያ;

  • የማስጠንቀቂያ ሥርዓት አደረጃጀት;
  • የግዴታ ሥርዓት አደረጃጀት;
  • "የእውቀት መሰረት" ማደራጀት እና ለክስተቶች ሂደት የስራ ሂደት.

ከፍተኛወደ ማንቂያው የምንደርሰው በኋላ ሳይሆን ወዲያውኑ ነው! ክትትልን ማስጀመር አያስፈልግም እና "በኋላ" ማን ማንቂያዎችን እንደሚቀበል ለማወቅ. ደግሞም የክትትል ተግባር ምንድነው-በስርዓቱ ውስጥ የሆነ ነገር ስህተት የሚሰራበትን ቦታ ለመረዳት እና ለትክክለኛዎቹ ሰዎች ስለዚህ ጉዳይ ማሳወቅ። ይህንን እስከ መጨረሻው ከተዉት ትክክለኛ ሰዎች አንድ ነገር እየተሳሳተ መሆኑን የሚያውቁት "ምንም አይጠቅመንም" በማለት ብቻ ነው።

የመተግበሪያ ንብርብር - የንግድ ሎጂክ ክትትል

እዚህ እየተነጋገርን ያለነው አፕሊኬሽኑ ለተጠቃሚው የሚሰራ መሆኑን ለመፈተሽ ነው።

ይህ ደረጃ በእድገት ደረጃ መከናወን አለበት. ለምሳሌ፣ ሁኔታዊ ፕሮሜቴየስ አለን፡ ቼኮችን ወደሚያደርገው አገልጋይ ይሄዳል፣ የመጨረሻውን ነጥብ ይጎትታል እና የመጨረሻው ነጥብ ሄዶ ኤፒአይን ይፈትሻል።

ጣቢያው እየሰራ መሆኑን ለማረጋገጥ የመነሻ ገጹን ብዙ ጊዜ እንዲከታተሉ ሲጠየቁ ፕሮግራመሮች ኤፒአይ እየሰራ መሆኑን ለማረጋገጥ በፈለጉት ጊዜ ሁሉ መጎተት የሚችል እጀታ ይሰጣሉ። እና ፕሮግራመሮች በዚህ ቅጽበት አሁንም /api/test/helloworld ይጽፋሉ
ሁሉም ነገር እንደሚሰራ ለማረጋገጥ ብቸኛው መንገድ? - አይ!

  • እንደነዚህ ያሉ ቼኮች መፍጠር በመሠረቱ የገንቢዎች ተግባር ነው. የክፍል ፈተናዎች ኮዱን በሚጽፉ ፕሮግራመሮች መፃፍ አለባቸው። ምክንያቱም ለአስተዳዳሪው ከለቀቅከው፣ “ዱድ፣ ለሁሉም 25 ተግባራት የኤፒአይ ፕሮቶኮሎች ዝርዝር ይኸውና፣ እባክህ ሁሉንም ነገር ተቆጣጠር!” - ምንም አይሰራም.
  • “ሄሎ ዓለም”ን ካተሙ ማንም ሰው ኤፒአይ እንደሚሰራ እና እንደሚሰራ አያውቅም። እያንዳንዱ የኤፒአይ ለውጥ በቼኮች ላይ ለውጥ ማምጣት አለበት።
  • ቀደም ሲል እንደዚህ አይነት ችግር ካጋጠመዎት ባህሪያቱን ያቁሙ እና እነዚህን ቼኮች የሚጽፉ ገንቢዎችን ይመድቡ ወይም ኪሳራውን ይቀበሉ, ምንም እንዳልተረጋገጠ እና እንደማይሳካ ይቀበሉ.

ቴክኒካዊ ምክሮች፡-

  • ቼኮችን ለማደራጀት የውጭ አገልጋይ ማደራጀትዎን ያረጋግጡ - ፕሮጀክትዎ ለውጭው ዓለም ተደራሽ መሆኑን እርግጠኛ መሆን አለብዎት።
  • የግለሰብ የመጨረሻ ነጥቦችን ብቻ ሳይሆን በመላው የኤፒአይ ፕሮቶኮል ላይ ቼኮችን ያደራጁ።
  • ከፈተና ውጤቶች ጋር የፕሮሜቲየስ-ፍጻሜ ነጥብ ይፍጠሩ።

የመተግበሪያ ንብርብር - የጤና መለኪያዎች ክትትል

አሁን እየተነጋገርን ያለነው ስለ ውጫዊ የጤና መለኪያዎች አገልግሎቶች ነው።

ከውጫዊ የክትትል ስርዓት የምንጠራቸውን ውጫዊ ቼኮች በመጠቀም ሁሉንም የመተግበሪያውን "እጅዎች" ለመቆጣጠር ወስነናል. ነገር ግን እነዚህ ተጠቃሚው "የሚያያቸው" "መያዣዎች" ናቸው. አገልግሎቶቻችን እራሳቸው እንደሚሰሩ እርግጠኛ መሆን እንፈልጋለን። እዚህ የተሻለ ታሪክ አለ: K8s የጤና ምርመራዎች አሉት, ስለዚህም ቢያንስ "ኩብ" እራሱ አገልግሎቱ እየሰራ መሆኑን ሊያምን ይችላል. ነገር ግን ካየኋቸው ቼኮች ውስጥ ግማሹ ተመሳሳይ የህትመት “ሄሎ ዓለም” ናቸው። እነዚያ። ስለዚህ ከተሰማራ በኋላ አንድ ጊዜ ይጎትታል ፣ ሁሉም ነገር ደህና ነው ብሎ መለሰ - ያ ብቻ ነው። እና አገልግሎቱ፣ የራሱን ኤፒአይ የሚያቀርብ ከሆነ፣ ለዚያው ኤፒአይ እጅግ በጣም ብዙ የመግቢያ ነጥቦች አሉት፣ እሱም እንዲሁ ክትትል ያስፈልገዋል፣ ምክንያቱም እንደሚሰራ ማወቅ እንፈልጋለን። እና ቀድሞውንም በውስጣችን እየተከታተልነው ነው።

ይህንን በትክክል በቴክኒካል እንዴት መተግበር እንደሚቻል-እያንዳንዱ አገልግሎት ስለ ወቅታዊ አፈፃፀሙ የመጨረሻ ነጥብ ያጋልጣል ፣ እና በግራፋና (ወይም በማንኛውም ሌላ መተግበሪያ) ግራፎች ውስጥ የሁሉንም አገልግሎቶች ሁኔታ እናያለን።

  • እያንዳንዱ የኤፒአይ ለውጥ በቼኮች ላይ ለውጥ ማምጣት አለበት።
  • በጤና መለኪያዎች ወዲያውኑ አዲስ አገልግሎት ይፍጠሩ።
  • አንድ አስተዳዳሪ ወደ ገንቢዎቹ መጥቶ "ሁሉንም ነገር እንድረዳ እና ስለዚህ ጉዳይ መረጃ በክትትል ስርዓቴ ላይ እንድጨምር ሁለት ባህሪያትን ጨምሩልኝ" ብሎ ሊጠይቅ ይችላል። ግን ገንቢዎች ብዙውን ጊዜ “ከመለቀቁ ከሁለት ሳምንታት በፊት ምንም ነገር አንጨምርም” ብለው ይመልሳሉ።
    የልማት አስተዳዳሪዎች እንዲህ ዓይነት ኪሳራ እንደሚኖር ይወቁ፣ የልማቱ አስተዳዳሪዎችም ይወቁ። ምክንያቱም ሁሉም ነገር ሲወድቅ አንድ ሰው አሁንም ይደውላል እና "ያለማቋረጥ የሚወድቀውን አገልግሎት" ለመቆጣጠር ይፈልጋል (ሐ)
  • በነገራችን ላይ ለግራፋና ተሰኪዎችን እንዲጽፉ ገንቢዎችን ይመድቡ - ይህ ለአስተዳዳሪዎች ጥሩ እገዛ ይሆናል።

የመተግበሪያ ንብርብር - ውህደት ክትትል

የውህደት ክትትል በቢዝነስ-ወሳኝ ስርዓቶች መካከል ግንኙነቶችን በመከታተል ላይ ያተኩራል.

ለምሳሌ, እርስ በርስ የሚግባቡ 15 አገልግሎቶች አሉ. እነዚህ ከአሁን በኋላ የተለዩ ጣቢያዎች አይደሉም። እነዚያ። አገልግሎቱን በራሳችን መጎተት አንችልም ፣ / helloworld አግኝ እና አገልግሎቱ እየሰራ መሆኑን እንረዳለን። ምክንያቱም ትዕዛዝ ሰጪው የድር አገልግሎት ስለ ትዕዛዙ መረጃ ወደ አውቶቡስ - ከአውቶቡስ መላክ አለበት, የመጋዘን አገልግሎት ይህን መልእክት ተቀብሎ የበለጠ መስራት አለበት. እና የኢሜል ማከፋፈያ አገልግሎቱ ይህን በሆነ መንገድ የበለጠ ማስኬድ አለበት፣ ወዘተ።

በዚህ መሠረት, እያንዳንዱን የግል አገልግሎት ላይ በማንሳት, ሁሉም እንደሚሰራ መረዳት አንችልም. ምክንያቱም ሁሉም ነገር የሚገናኝበት እና የሚገናኝበት የተወሰነ አውቶቡስ ስላለን።
ስለዚህ, ይህ ደረጃ ከሌሎች አገልግሎቶች ጋር ለመግባባት የሙከራ አገልግሎቶችን ደረጃ ምልክት ማድረግ አለበት. የመልእክት ደላላውን በመከታተል የግንኙነት ክትትልን ማደራጀት አይቻልም። መረጃ የሚያወጣ አገልግሎት እና የሚቀበለው አገልግሎት ካለ ደላሉን ስንቆጣጠር ከጎን ወደ ጎን የሚበር ዳታ ብቻ ነው የምናየው። ምንም እንኳን እኛ በሆነ መንገድ የዚህን ውሂብ በውስጣችን ያለውን መስተጋብር ለመከታተል ብንችልም - አንድ የተወሰነ ፕሮዲዩሰር ውሂቡን ሲለጥፍ ፣ አንድ ሰው ያነበበው ፣ ይህ ፍሰት ወደ ካፍካ መሄዱን ይቀጥላል - አንድ አገልግሎት መልእክቱን በአንድ ስሪት ከላከ ይህ አሁንም መረጃ አይሰጠንም። , ነገር ግን ሌላኛው አገልግሎት ይህን ስሪት አልጠበቀም እና ዘለለው. ሁሉም ነገር እየሰራ መሆኑን አገልግሎቶቹ ስለሚነግሩን ስለዚህ ጉዳይ አናውቅም።

እኔ የምመክረው ነገር፡-

  • ለተመሳሰለ ግንኙነት፡ የመጨረሻው ነጥብ ለተዛማጅ አገልግሎቶች ጥያቄዎችን ያቀርባል። እነዚያ። ይህንን የመጨረሻ ነጥብ እንይዛለን ፣ በአገልግሎቱ ውስጥ አንድ ስክሪፕት ይጎትታል ፣ እሱም ወደ ሁሉም ነጥቦች ሄዶ “እዛ መጎተት እችላለሁ ፣ እና እዚያ እዛለሁ ፣ እዚያ መሳብ እችላለሁ…” ይላል።
  • ለተመሳሰለ ግንኙነት፡ መጪ መልዕክቶች - የመጨረሻው ነጥብ ለሙከራ መልዕክቶች አውቶቡሱን ይፈትሻል እና የሂደቱን ሁኔታ ያሳያል።
  • ለተመሳሰለ ግንኙነት፡ የወጪ መልዕክቶች - የመጨረሻ ነጥብ የሙከራ መልዕክቶችን ወደ አውቶቡስ ይልካል።

እንደተለመደው: ወደ አውቶቡስ ውስጥ ውሂብ የሚጥል አገልግሎት አለን. ወደዚህ አገልግሎት በመምጣት ስለ ውህደቱ ጤና እንዲነግሩን እንጠይቃለን። እና አገልግሎቱ ሌላ ቦታ (WebApp) መልእክት ማሰራት ከፈለገ ይህንን የሙከራ መልእክት ያስተላልፋል። እና በትእዛዝ ፕሮሰሲንግ በኩል አንድ አገልግሎት የምንሰራ ከሆነ በመጀመሪያ ራሱን ችሎ የሚለጥፈውን ይለጠፋል ፣ እና አንዳንድ ጥገኛ ነገሮች ካሉ ፣ ከዚያ ከአውቶቡስ የሚመጡ የሙከራ መልዕክቶችን ያነብባል ፣ እነሱን እንደሚያስተናግድ ፣ ሪፖርት ማድረግ እና እንደሚያስችል ይገነዘባል። , አስፈላጊ ከሆነ, የበለጠ ይለጥፏቸው, እና ስለዚህ ጉዳይ - ሁሉም ነገር ደህና ነው, እኔ ሕያው ነኝ.

ብዙ ጊዜ “ይህን በውጊያ መረጃ ላይ እንዴት መሞከር እንችላለን?” የሚለውን ጥያቄ እንሰማለን። ለምሳሌ, ስለ ተመሳሳይ የማዘዣ አገልግሎት እየተነጋገርን ነው. ትዕዛዙ እቃው ወደተዘጋበት መጋዘን መልእክት ይልካል፡ ይህንን በውጊያ መረጃ ላይ መሞከር አንችልም፣ ምክንያቱም “እቃዎቼ ይሰረዛሉ!” መፍትሄ፡- ይህንን ፈተና በሙሉ በጅማሬ ያቅዱ። መሳለቂያ የሚያደርግ የዩኒት ሙከራዎችም አሉዎት። ስለዚህ የንግዱን አሠራር የማይጎዳ የግንኙነት ቻናል ባሉበት በጥልቅ ደረጃ ያድርጉት።

የመሠረተ ልማት ደረጃ

የመሠረተ ልማት ክትትል እራሱን መከታተል ለረጅም ጊዜ ሲወሰድ የቆየ ነገር ነው.

  • የመሠረተ ልማት ክትትል እንደ የተለየ ሂደት ሊጀመር ይችላል.
  • ምንም እንኳን በእውነት ቢፈልጉም በመሠረተ ልማት ክትትል መጀመር የለብዎትም። ይህ ለሁሉም ድመቶች ህመም ነው. "መጀመሪያ ክላስተርን እከታተላለሁ, መሠረተ ልማትን እከታተላለሁ" - ማለትም. በመጀመሪያ ፣ ከዚህ በታች ያለውን ነገር ይቆጣጠራል ፣ ግን ወደ ማመልከቻው ውስጥ አይገባም። ምክንያቱም አፕሊኬሽኑ ለዶፕስ የማይገባ ነገር ነው። ለእሱ ተላልፏል, እና እንዴት እንደሚሰራ አይረዳውም. ግን መሠረተ ልማቱን ተረድቶ ይጀምራል። ግን አይሆንም - መጀመሪያ መተግበሪያውን ሁልጊዜ መከታተል ያስፈልግዎታል.
  • ከማንቂያዎች ብዛት ጋር ከመጠን በላይ አይውሰዱ። የዘመናዊ ስርዓቶችን ውስብስብነት ከግምት ውስጥ በማስገባት ማንቂያዎች ያለማቋረጥ እየበረሩ ናቸው እና በሆነ መንገድ ከዚህ ስብስብ ማንቂያዎች ጋር መኖር አለብዎት። እና ጠሪው ሰው፣ መቶ የሚሆኑ ቀጣይ ማንቂያዎችን ከተመለከተ፣ “ስለእሱ ማሰብ አልፈልግም” ብሎ ይወስናል። ማንቂያዎች ሾለ ወሳኝ ነገሮች ብቻ ማሳወቅ አለባቸው።

የመተግበሪያ ደረጃ እንደ የንግድ ክፍል

ዋና ዋና ነጥቦች:

  • ኤል.ኬ. ይህ የኢንዱስትሪ ደረጃ ነው። በሆነ ምክንያት የምዝግብ ማስታወሻዎችን ካልሰበሰቡ ወዲያውኑ ማድረግ ይጀምሩ።
  • ኤፒኤም ውጫዊ ኤፒኤምዎች የመተግበሪያ ክትትልን በፍጥነት ለመዝጋት መንገድ (NewRelic፣ BlackFire፣ Datadog)። ከእርስዎ ጋር ምን እየተደረገ እንዳለ ቢያንስ በሆነ መንገድ ለመረዳት ይህንን ነገር ለጊዜው መጫን ይችላሉ።
  • መከታተል። በደርዘን በሚቆጠሩ ማይክሮ ሰርቪስ ውስጥ ሁሉንም ነገር መፈለግ አለብዎት, ምክንያቱም ጥያቄው ከአሁን በኋላ በራሱ አይኖርም. በኋላ ላይ ለመጨመር በጣም ከባድ ነው, ስለዚህ በልማት ውስጥ ፍለጋን ወዲያውኑ ማቀድ የተሻለ ነው - ይህ የገንቢዎች ሾል እና ጥቅም ነው. እስካሁን ተግባራዊ ካላደረጉት ተግባራዊ ያድርጉት! ዣገር/ዚፕኪን ተመልከት

ማንቂያ

  • የማሳወቂያ ስርዓት አደረጃጀት፡- ብዙ ነገሮችን በሚከታተልበት ጊዜ ማሳወቂያዎችን ለመላክ የተዋሃደ ስርዓት መኖር አለበት። በግራፋና ውስጥ ይችላሉ. በምዕራቡ ዓለም ሁሉም ሰው ፔጀርዱቲ ይጠቀማል። ማንቂያዎች ግልጽ መሆን አለባቸው (ለምሳሌ ከየት እንደመጡ...)። እና ማሳወቂያዎች ሙሉ በሙሉ መቀበላቸውን ለመቆጣጠር ይመከራል
  • የግዴታ ሥርዓት አደረጃጀት፡ ማንቂያዎች ለሁሉም ሰው መላክ የለባቸውም (ወይ ሁሉም ሰው በተሰበሰበበት አካባቢ ምላሽ ይሰጣል ወይም ማንም ምላሽ አይሰጥም)። ገንቢዎች እንዲሁ መደወል አለባቸው፡ የኃላፊነት ቦታዎችን መግለጽዎን ያረጋግጡ፣ መመሪያዎችን ግልጽ ያድርጉ እና ሰኞ እና ረቡዕ ማን በትክክል እንደሚደውሉ እና ማክሰኞ እና አርብ ማን እንደሚደውሉ ይፃፉ (አለበለዚያ ማንንም እንኳን አይጠሩም የትልቅ ችግር ክስተት - እርስዎን ለመቀስቀስ ወይም ለመረበሽ ይፈራሉ፡ ሰዎች በአጠቃላይ ሌሎች ሰዎችን በተለይም በምሽት መደወል እና መቀስቀስ አይወዱም። እና እርዳታ መጠየቅ የብቃት ማነስ አመልካች እንዳልሆነ ያብራሩ ("እርዳታ እጠይቃለሁ, ያ ማለት እኔ መጥፎ ሰራተኛ ነኝ"), የእርዳታ ጥያቄዎችን ያበረታታል.
  • “የእውቀት መሠረት” አደረጃጀት እና ለክስተቶች ሂደት የሥራ ሂደት፡ ለእያንዳንዱ ከባድ ክስተት፣ ድህረ ሞት መታቀድ አለበት፣ እና እንደ ጊዜያዊ መለኪያ፣ ክስተቱን የሚፈቱ ድርጊቶች መመዝገብ አለባቸው። እና ተደጋጋሚ ማንቂያዎች ኃጢያት እንደሆኑ ተለማመዱ; በኮድ ወይም በመሠረተ ልማት ሼል መስተካከል አለባቸው.

የቴክኖሎጂ ቁልል

የእኛ ቁልል እንደሚከተለው ነው ብለን እናስብ።

  • የውሂብ መሰብሰብ - ፕሮሜቴየስ + ግራፋና;
  • የምዝግብ ማስታወሻ - ELK;
  • ለኤፒኤም ወይም ትራኪንግ - ጄገር (ዚፕኪን).

ክትትል ሞቷል? - ረጅም የቀጥታ ክትትል

የአማራጮች ምርጫ ወሳኝ አይደለም. ምክንያቱም መጀመሪያ ላይ ስርዓቱን እንዴት እንደሚቆጣጠሩ ከተረዱ እና እቅድ ከፃፉ, ከእርስዎ መስፈርቶች ጋር የሚስማሙ መሳሪያዎችን መምረጥ ይጀምራሉ. ጥያቄው በመጀመሪያ ለመከታተል የመረጡት ነገር ነው። ምክንያቱም ምናልባት መጀመሪያ ላይ የመረጡት መሳሪያ ከእርስዎ መስፈርቶች ጋር ፈጽሞ አይጣጣምም.

በቅርብ ጊዜ በየቦታው የማያቸው ጥቂት ቴክኒካል ነጥቦች፡-

Prometheus በኩበርኔትስ ውስጥ እየተገፈፈ ነው - ይህን ያመጣው ማን ነው?! ክላስተርህ ከተበላሸ ምን ታደርጋለህ? በውስጡ ውስብስብ ክላስተር ካለህ፣ ከክላስተር ውስጥ አንድ ዓይነት የክትትል ሥርዓት መኖር አለብህ፣ እና ከፊሉ ውጪ፣ ይህም መረጃ ከክላስተር ውስጥ የሚሰበስብ ነው።

በክላስተር ውስጥ ምዝግብ ማስታወሻዎችን እና ሁሉንም ነገር እንሰበስባለን. ነገር ግን የክትትል ስርዓቱ ውጭ መሆን አለበት. በጣም ብዙ ጊዜ፣ በውስጡ የተጫነ ፕሮምቲየስ ባለበት ክላስተር ውስጥ፣ የጣቢያው ስራ ውጫዊ ፍተሻዎችን የሚያካሂዱ ስርዓቶችም አሉ። ከውጭው ዓለም ጋር ያለዎት ግንኙነት ከተቋረጠ እና ማመልከቻው የማይሰራ ቢሆንስ? ሁሉም ነገር በውስጥም ጥሩ እንደሆነ ተረጋግጧል፣ ነገር ግን ነገሮችን ለተጠቃሚዎች ቀላል አያደርግም።

ግኝቶች

  • የክትትል ልማት የመገልገያዎችን መጫን አይደለም, ነገር ግን የሶፍትዌር ምርት ልማት ነው. የዛሬው ክትትል 98% ኮድ ማድረግ ነው። በአገልግሎቶች ውስጥ ኮድ ማድረግ፣ የውጭ ቼኮች ኮድ ማድረግ፣ የውጭ አገልግሎቶችን መፈተሽ እና ያ ብቻ ነው።
  • የእርስዎን ገንቢዎች በክትትል ጊዜ አያባክኑት፡ እስከ 30% የሚሆነውን ስራቸውን ሊወስድ ይችላል፣ ግን ዋጋ ያለው ነው።
  • Devops ፣ የሆነ ነገር መከታተል እንደማትችል አይጨነቁ ፣ ምክንያቱም አንዳንድ ነገሮች ፍጹም የተለየ የአስተሳሰብ መንገድ ናቸው። ፕሮግራመር አልነበርክም፣ እና የክትትል ሾል በትክክል ስራቸው ነው።
  • ፕሮጀክቱ ቀድሞውኑ እየሰራ ከሆነ እና ቁጥጥር ካልተደረገበት (እና እርስዎ አስተዳዳሪ ከሆኑ) ለክትትል ሀብቶችን ይመድቡ።
  • ምርቱ ቀድሞውኑ በምርት ላይ ከሆነ እና እርስዎ “ክትትልን እንዲያዘጋጁ” የተነገራችሁ ዱፕስ ከሆናችሁ - ይህን ሁሉ የጻፍኩትን ለማኔጅመንት ለማስረዳት ይሞክሩ።

ይህ በሴንት ሃይሎድ++ ኮንፈረንስ የተራዘመ የሪፖርቱ ስሪት ነው።

በእሱ ላይ የእኔን ሃሳቦች እና ሀሳቦች እና ተዛማጅ ርእሶች ከፈለጉ, እዚህ ይችላሉ ቻናሉን ያንብቡ 🙂

ምንጭ: hab.com

አስተያየት ያክሉ