ዲሚትሪ ካዛኮቭ, የውሂብ ትንታኔ ቡድን በ Kolesa ቡድን መሪ, ከመጀመሪያው የካዛክስታን የውሂብ ባለሙያዎች ጥናት ግንዛቤዎችን ያካፍላል.

በፎቶው ውስጥ: ዲሚትሪ ካዛኮቭ
ቢግ ዳታ በጣም እንደ ታዳጊ ወሲብ ነው የሚለውን ታዋቂ ሀረግ አስታውስ - ሁሉም ሰው ስለእሱ ያወራል፣ ነገር ግን በትክክል መኖሩን ማንም አያውቅም። ስለ የውሂብ ስፔሻሊስቶች ገበያ (በካዛክስታን ውስጥ) ተመሳሳይ ነገር ሊባል ይችላል - ማበረታቻ አለ ፣ ግን ከኋላው ያለው ማን ነው (እና ማንም እዚያ ካለ) ሙሉ በሙሉ ግልፅ አልነበረም - ለ HR ፣ ለአስተዳዳሪዎችም ሆነ ለ የውሂብ ሳይንቲስቶች እራሳቸው.
አሳልፈናል። ስለ ደሞዛቸው፣ ተግባራቸው፣ ችሎታቸው፣ መሣሪያዎቻቸው እና ሌሎችም ከ300 በላይ ልዩ ባለሙያዎችን ዳሰሳ አድርገዋል።
አከፋፋይ ፦ አዎ, እነሱ በእርግጠኝነት አሉ, ነገር ግን ሁሉም ነገር በጣም ቀላል አይደለም.
ጥሩ ግንዛቤ። በመጀመሪያ፣ ከጠበቅነው በላይ ብዙ የመረጃ ሳይንቲስቶች አሉ። ለ 300 ሰዎች ቃለ መጠይቅ ማድረግ ችለናል ከነዚህም መካከል የምርት፣ የግብይት እና የ BI ተንታኞች ብቻ ሳይሆን የኤምኤል እና ዲኤችኤች መሐንዲሶችም ነበሩ ፣ ይህም በተለይ አስደሳች ነበር። ትልቁ ቡድን እራሳቸውን የውሂብ ሳይንቲስቶች ብለው የሚጠሩትን ሁሉ ያጠቃልላል - ይህ 36% ምላሽ ሰጪዎች ነው. ይህ የገበያውን ፍላጎት ይሸፍናል ወይም አይሸፍንም ለማለት አስቸጋሪ ነው, ምክንያቱም ገበያው ራሱ ገና እየተቋቋመ ነው.

የሥራ ደረጃዎች ስርጭት ግራ የሚያጋባ ነው - እንደ ጁኒየር ብዙ የቡድን መሪዎች እና አስተዳዳሪዎች አሉ ማለት ይቻላል። ለዚህ በርካታ ምክንያቶች ሊኖሩ ይችላሉ. ለምሳሌ, መሪው መካከለኛ ወይም ከፍተኛ ደረጃ ስፔሻሊስት ሊሆን የሚችልበት ከ2-3 ሰዎች ብዛት ያላቸው ትናንሽ ቡድኖች.

ሌላው ምክንያት በአሁኑ ጊዜ በገበያው ውስጥ ያለው ትርምስ ሚና እና የተግባር ስርጭት ደረጃዎችን በተመለከተ ሊሆን ይችላል. የቡድን መሪዎች አንዳንድ ጊዜ የችሎታ እና የእውቀት ደረጃን ሳያካትት በቀላሉ አንድ ወይም ሁለት አመት ለሚሰሩ ሰዎች ይመደባሉ. ይህንን ተግባር በቦታ ስርጭት ውስጥ እናያለን - 38% አስተዳዳሪዎች እና የቡድን መሪዎች በቅድመ-ሂደት እና ሌላ 33% በመሠረታዊ ስታቲስቲካዊ ትንታኔ ውስጥ ተሰማርተዋል ።


እዚህ ምላሽ ሰጪዎች በኩባንያዎቻቸው ውስጥ ያለውን የትንታኔ ደረጃ በግላዊ ሁኔታ እንዲገመግሙ ጠየቅናቸው። በቅርበት ከተመለከቱ፣ ከ10-2 ሰዎች የትንታኔ ክፍል ውስጥ የሚሰሩ 3% ምላሽ ሰጪዎች “የላቀ ደረጃ” እንዳላቸው ያምናሉ።
"የላቀ ደረጃ" ምንድን ነው? የ BI ስርዓት በጣም ጥሩ ይሰራል። DWH እና Big Data አለ። የ A/B ምርመራዎች በመደበኛነት ይከናወናሉ. በምርት ውስጥ የሚሰሩ ML እና DS ስርዓቶች አሉ። ውሳኔዎች የሚከናወኑት በመረጃ ላይ በመመስረት ብቻ ነው። የመረጃ ማቀነባበሪያ እና የውሂብ ሳይንስ ክፍል በኩባንያው ውስጥ ካሉት ቁልፍ ነገሮች ውስጥ አንዱ ነው.
ከ 2-3 ሰዎች ክፍል ጋር ከላይ የተጠቀሱትን ሁሉ ለማሳካት ፈጽሞ የማይቻል ነው. እኔ እንደማስበው ይህ የዳሰሳ ጥናት ውጤት ትንሽ እያደገ የመጣ ህመም ነው - ወንዶቹ ደረጃቸውን በትክክለኛ ሁኔታ ለመወሰን እራሳቸውን የሚያወዳድሩ ገና ማንም የላቸውም።


እንደተጠበቀው፣ የውሂብ ሳይንቲስቶች አብዛኛውን ጊዜያቸውን የሚያጠፉት እጅግ በጣም ውስብስብ በሆነ ሂሳብ ወይም ምህንድስና ላይ ሳይሆን መረጃን በማዘጋጀት፣ በማውረድ እና በማጽዳት ላይ ነው። በእያንዳንዱ ስፔሻላይዜሽን ከላይ 3 ላይ ቅድመ-ሂደትን እናያለን። ነገር ግን እንደ ML ሞዴሎችን ማዳበር ወይም ከBig Data ጋር መስራትን የመሳሰሉ ውስብስብ ነገሮችን በ 3 ኛ ደረጃ - በ ML እና DWH መሐንዲሶች መካከል ብቻ አናያቸውም።

ሁለት አሳዛኝ ግንዛቤዎችም አሉ። ባለሙያዎች 40% ተግባራቸውን በራሳቸው ያዘጋጃሉ. በካዛክስታን ውስጥ እስካሁን ድረስ ከፍተኛ የዩኒኮርን ኩባንያዎች ብቻ ከትልቅ መረጃ ጋር የመሥራት ጥቅሞችን ሞክረው በብቃት እንዴት እንደሚሠሩ ተምረዋል። Big Data እና Machine Learning አሪፍ ናቸው ብለው ለገበያ ያሰራጫሉ፣ እና ሁለተኛው ደረጃ ከኋላው ይከተላል፣ ነገር ግን ከመረጃ ጋር መስራት እንዴት እንደሚሰራ ሁልጊዜ አይረዳም። ስለዚህ, ስፔሻሊስቶች ለራሳቸው ስራዎችን እንደሚያዘጋጁ እናያለን, እና ንግዶች ሁልጊዜ የሚፈልጉትን አያውቁም.

20% የሚሆኑ ባለሙያዎች ኩባንያቸው የውሂብ መጋዘን እንዳለው እንኳን እንደማያውቁ ሳውቅ ተገረምኩ። እና ከስርዓቶቹ ጋር። የውሂብ ጎታ አስተዳደር ሁሉም ነገር በጣም ጥሩ አይደለም - 41% የሚሆኑት MySQL ይጠቀማሉ፣ ሌሎች 34% ደግሞ PostgreSQL ይጠቀማሉ። ይህ ምን ማለት ነው? በትንሽ መረጃ የበለጠ ይሰራሉ።

ስለ ማከማቻ ስርዓቶች በጥያቄው ውስጥ MySQL እና እንዲያውም (!) Excel እንደገና እናያለን። ነገር ግን ይህ ለምሳሌ፣ አብዛኞቹ ኩባንያዎች በቀላሉ ከትልቅ መረጃ ጋር ለመስራት ገና ጥያቄ እንደሌላቸው ሊያመለክት ይችላል።

እዚህ ሁሉም ነገር እንደገና አሻሚ ነው. በአጠቃላይ ደሞዝ ከጠበኩት ትንሽ ያነሰ ነበር።

በግሌ ለ 200 ሺህ ተንጌ ለመስራት ዝግጁ የሆነ የኤምኤል መሐንዲስ መገመት ይከብደኛል - እሱ ምናልባት ተለማማጅ ነው። የእንደዚህ አይነት ስፔሻሊስቶች ብቃቶች በጣም ደካማ ናቸው, ወይም ኩባንያዎች የመረጃ ሳይንስን ስራ በበቂ ሁኔታ ለመገምገም አሁንም አስቸጋሪ ነው. ግን ምናልባት ይህ የሚያመለክተው ገበያው ገና በማብሰያው መጀመሪያ ላይ መሆኑን ነው። እና ከጊዜ በኋላ የደመወዝ ደረጃ በበቂ ደረጃ ይመሰረታል.
ምንጭ: hab.com
