በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

በHighload++ እና DataFest Minsk 2019 ባደረኳቸው ንግግሮች ላይ በመመስረት።

ዛሬ ለብዙዎች ደብዳቤ የመስመር ላይ ህይወት ዋና አካል ነው። በእሱ እርዳታ የንግድ ደብዳቤዎችን እንሰራለን, ከፋይናንስ ጋር የተያያዙ ሁሉንም አይነት ጠቃሚ መረጃዎችን እናከማቻለን, የሆቴል ቦታ ማስያዝ, ትዕዛዞችን እና ሌሎችንም. በ2018 አጋማሽ ላይ ለደብዳቤ ልማት የምርት ስትራቴጂ ቀረፅን። ዘመናዊ መልእክት ምን መሆን አለበት?

ደብዳቤ መሆን አለበት። ብልህ, ማለትም ተጠቃሚዎች እየጨመረ ያለውን የመረጃ መጠን እንዲያስሱ መርዳት: አጣሩ, አወቃቀሩ እና በጣም ምቹ በሆነ መንገድ ያቅርቡ. መሆን አለባት ጠቃሚ, በመልዕክት ሳጥንዎ ውስጥ የተለያዩ ስራዎችን በትክክል እንዲፈቱ ያስችልዎታል, ለምሳሌ, ቅጣቶችን ይክፈሉ (ይህ ተግባር, በሚያሳዝን ሁኔታ, እኔ እጠቀማለሁ). እና በተመሳሳይ ጊዜ, በእርግጥ, ደብዳቤ የመረጃ ጥበቃ, አይፈለጌ መልዕክትን በመቁረጥ እና ከጠለፋ መከላከል አለበት, ማለትም, መሆን አለበት. ደህና.

እነዚህ ቦታዎች በርካታ ቁልፍ ችግሮችን ይገልፃሉ, አብዛኛዎቹ የማሽን መማሪያን በመጠቀም ውጤታማ በሆነ መንገድ ሊፈቱ ይችላሉ. እንደ የስትራቴጂው አካል የተገነቡ የነባር ባህሪያት ምሳሌዎች እዚህ አሉ - ለእያንዳንዱ አቅጣጫ።

  • ብልጥ ምላሽ. መልዕክት ብልጥ የሆነ ምላሽ ባህሪ አለው። የነርቭ አውታረመረብ የደብዳቤውን ጽሑፍ ይመረምራል, ትርጉሙን እና ዓላማውን ይገነዘባል, በዚህም ምክንያት ሦስቱን በጣም ትክክለኛ የምላሽ አማራጮችን ያቀርባል-አዎንታዊ, አሉታዊ እና ገለልተኛ. ይህ ለደብዳቤዎች መልስ ሲሰጥ ጊዜን በከፍተኛ ሁኔታ ለመቆጠብ ይረዳል, እና ብዙውን ጊዜ መደበኛ ባልሆነ እና አስቂኝ በሆነ መልኩ ምላሽ ይሰጣል.
  • ኢሜይሎችን መቧደንበመስመር ላይ መደብሮች ውስጥ ካሉ ትዕዛዞች ጋር የተዛመደ። ብዙ ጊዜ በመስመር ላይ እንገዛለን፣ እና እንደ ደንቡ፣ መደብሮች ለእያንዳንዱ ትዕዛዝ ብዙ ኢሜይሎችን መላክ ይችላሉ። ለምሳሌ, ከ AliExpress, ትልቁ አገልግሎት, ብዙ ፊደሎች በአንድ ቅደም ተከተል ይመጣሉ, እና በተርሚናል ጉዳይ ላይ ቁጥራቸው እስከ 29 ሊደርስ እንደሚችል እናሰላለን. ስለዚህ የተሰየመውን አካል እውቅና ሞዴል በመጠቀም, የትዕዛዝ ቁጥሩን እናወጣለን. እና ሌላ መረጃ ከጽሑፉ እና የቡድን ሁሉንም ፊደሎች በአንድ ክር ውስጥ. እንዲሁም ሾለ ትዕዛዙ መሠረታዊ መረጃ በተለየ ሳጥን ውስጥ እናሳያለን, ይህም ከእንደዚህ አይነት ኢሜል ጋር ለመስራት ቀላል ያደርገዋል.

    በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

  • ፀረ-ማስገር. ማስገር በተለይ አደገኛ የተጭበረበረ የኢሜል አይነት ነው፣ በዚህ እርዳታ አጥቂዎች የፋይናንስ መረጃን (የተጠቃሚውን የባንክ ካርዶችን ጨምሮ) እና መግቢያዎች ለማግኘት ይሞክራሉ። እንደነዚህ ያሉት ደብዳቤዎች ምስላዊን ጨምሮ በአገልግሎቱ የተላኩ እውነተኛዎችን ይመስላሉ። ስለዚህ በኮምፒዩተር ቪዥን እገዛ ከትላልቅ ኩባንያዎች (ለምሳሌ Mail.ru, Sber, Alfa) ሎጎዎችን እና የፊደሎችን ዲዛይን ዘይቤን እንገነዘባለን እና ይህንን ከጽሑፍ እና ሌሎች በአይፈለጌ መልእክት እና አስጋሪ ክላሲፋየሮች ውስጥ ከግምት ውስጥ እናስገባለን ። .

ማሽን መማር

በአጠቃላይ በኢሜል ስለ ማሽን መማር ጥቂት። ደብዳቤ በከፍተኛ ሁኔታ የተጫነ ስርዓት ነው፡ በቀን በአማካይ 1,5 ቢሊዮን ፊደላት በአገልጋዮቻችን በኩል ለ30 ሚሊዮን DAU ተጠቃሚዎች ያልፋሉ። ወደ 30 የሚጠጉ የማሽን መማሪያ ስርዓቶች ሁሉንም አስፈላጊ ተግባራት እና ባህሪያት ይደግፋሉ.

እያንዳንዱ ፊደል በጠቅላላው የምደባ ቧንቧ መስመር ውስጥ ያልፋል። በመጀመሪያ አይፈለጌ መልዕክትን ቆርጠን ጥሩ ኢሜይሎችን እንተዋለን. ተጠቃሚዎች ብዙውን ጊዜ የፀረ-አይፈለጌ መልዕክት ስራን አያስተውሉም, ምክንያቱም 95-99% አይፈለጌ መልእክት በተገቢው አቃፊ ውስጥ እንኳን አያበቃም. አይፈለጌ መልዕክት ማወቂያ የስርዓታችን በጣም አስፈላጊ አካል እና በጣም አስቸጋሪው ነው ምክንያቱም በፀረ-አይፈለጌ መልዕክት መስክ ውስጥ በመከላከያ እና በማጥቂያ ስርዓቶች መካከል የማያቋርጥ መላመድ ስለሚኖር ለቡድናችን ቀጣይነት ያለው የምህንድስና ፈተና ነው.

በመቀጠል ፊደላትን ከሰዎች እና ከሮቦቶች እንለያቸዋለን. የሰዎች ኢሜይሎች በጣም አስፈላጊ ናቸው፣ ስለዚህ ለእነሱ እንደ ስማርት ምላሽ ያሉ ባህሪያትን እናቀርባለን። የሮቦቶች ደብዳቤዎች በሁለት ክፍሎች ይከፈላሉ: ግብይት - እነዚህ ከአገልግሎቶች አስፈላጊ ደብዳቤዎች ናቸው, ለምሳሌ የግዢዎች ማረጋገጫዎች ወይም የሆቴል ቦታ ማስያዝ, ፋይናንስ እና መረጃ - እነዚህ የንግድ ማስታወቂያዎች, ቅናሾች ናቸው.

የግብይት ኢሜይሎች ለግል ደብዳቤዎች አስፈላጊነት እኩል ናቸው ብለን እናምናለን። እነሱ በቅርብ መሆን አለባቸው, ምክንያቱም ብዙ ጊዜ ስለ ትዕዛዝ ወይም የአየር ትኬት ቦታ መረጃ በፍጥነት መፈለግ አለብን, እና እነዚህን ፊደሎች ለመፈለግ ጊዜ እናጠፋለን. ስለዚህ, ለመመቻቸት, በራስ-ሰር ወደ ስድስት ዋና ዋና ምድቦች እንከፋፍላቸዋለን: ጉዞ, ትዕዛዞች, ፋይናንስ, ቲኬቶች, ምዝገባዎች እና በመጨረሻም, ቅጣቶች.

የመረጃ ደብዳቤዎች ትልቁ እና ምናልባትም ብዙም አስፈላጊ ያልሆኑ ቡድኖች ናቸው, ፈጣን ምላሽ የማይፈልጉ ናቸው, ምክንያቱም በተጠቃሚው ህይወት ውስጥ እንደዚህ አይነት ደብዳቤ ካላነበበ ምንም ጠቃሚ ነገር አይለወጥም. በአዲሱ በይነገጽ፣ በሁለት ክሮች ውስጥ እንፈርሳቸዋለን፡ ማህበራዊ አውታረ መረቦች እና ጋዜጣዎች፣ በዚህም የመልእክት ሳጥኑን በምስል በማጽዳት እና አስፈላጊ መልዕክቶችን ብቻ እንዲታዩ እናደርጋለን።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ክዋኔ

ብዙ ቁጥር ያላቸው ስርዓቶች በስራ ላይ ብዙ ችግሮች ያስከትላሉ. ደግሞም ሞዴሎች በጊዜ ሂደት ልክ እንደ ማንኛውም ሶፍትዌሮች፡ ባህሪያት ይሰበራሉ፣ ማሽኖች አይሳኩም፣ ኮድ ይጣመማል። በተጨማሪም, ውሂብ በየጊዜው እየተቀየረ ነው: አዳዲሶች ተጨምረዋል, የተጠቃሚ ባህሪ ቅጦች ይለወጣሉ, ወዘተ, ስለዚህ ትክክለኛ ድጋፍ የሌለው ሞዴል ከጊዜ ወደ ጊዜ እየባሰ እና እየባሰ ይሄዳል.

ጥልቀት ያለው የማሽን ትምህርት በተጠቃሚዎች ህይወት ውስጥ ዘልቆ የሚገባ መሆኑን መዘንጋት የለብንም, በስርዓተ-ምህዳሩ ላይ የሚኖራቸው ተፅእኖ የበለጠ ነው, በዚህም ምክንያት, የበለጠ የገንዘብ ኪሳራ ወይም የትርፍ ገበያ ተጫዋቾች ሊቀበሉ ይችላሉ. ስለዚህ, ቁጥራቸው እየጨመረ በሚሄድ አካባቢዎች, ተጫዋቾች ከኤምኤል አልጎሪዝም ሥራ ጋር እየተላመዱ ነው (ጥንታዊ ምሳሌዎች ማስታወቂያ, ፍለጋ እና ቀደም ሲል የተጠቀሰው ፀረ-አይፈለጌ መልዕክት).

እንዲሁም የማሽን መማሪያ ተግባራት ልዩ ባህሪ አላቸው-ማንኛውም, ትንሽም ቢሆን, በስርዓቱ ውስጥ ያለው ለውጥ ከአምሳያው ጋር ብዙ ስራዎችን ሊያመጣ ይችላል-በመረጃ መስራት, እንደገና ማሰልጠን, ማሰማራት, ሳምንታት ወይም ወራት ሊወስድ ይችላል. ስለዚህ, የእርስዎ ሞዴሎች የሚሰሩበት አካባቢ በፍጥነት ይለወጣል, እነሱን ለመጠበቅ የበለጠ ጥረት ይጠይቃል. አንድ ቡድን ብዙ ስርዓቶችን መፍጠር እና በእሱ ደስተኛ ሊሆን ይችላል, ነገር ግን ምንም አዲስ ነገር ለማድረግ እድሉ ሳይኖር ሁሉንም ሀብቶቹን ለመጠበቅ ሁሉንም ማለት ይቻላል. በአንድ ወቅት በፀረ-አይፈለጌ መልዕክት ቡድን ውስጥ እንደዚህ ያለ ሁኔታ አጋጥሞናል. እና ድጋፍ አውቶማቲክ መሆን አለበት የሚል ግልጽ ድምዳሜ ላይ ደርሰዋል።

አውቶማቲክ

አውቶማቲክ ምን ሊሆን ይችላል? ሁሉም ነገር ማለት ይቻላል ፣ በእውነቱ። የማሽን መማሪያ መሠረተ ልማትን የሚገልጹ አራት ቦታዎችን ለይቻለሁ።

  • መረጃ መሰብሰብ;
  • ተጨማሪ ስልጠና;
  • ማሰማራት;
  • ሙከራ እና ክትትል.

አካባቢው ያልተረጋጋ እና በየጊዜው የሚለዋወጥ ከሆነ በአምሳያው ዙሪያ ያለው አጠቃላይ መሠረተ ልማት ከአምሳያው የበለጠ አስፈላጊ ሆኖ ይታያል። ጥሩ የድሮ መስመራዊ ክላሲፋየር ሊሆን ይችላል፣ ነገር ግን ትክክለኛዎቹን ባህሪያት ከመገቡት እና ከተጠቃሚዎች ጥሩ አስተያየት ካገኙ፣ ከሁሉም ደወል እና ጩኸቶች ጋር ከስቴት ኦፍ ዘ-አርት ሞዴሎች በተሻለ ሁኔታ ይሰራል።

የግብረመልስ ምልልስ

ይህ ዑደት የውሂብ መሰብሰብን, ተጨማሪ ስልጠናን እና ማሰማራትን ያጣምራል - በእውነቱ, ሙሉውን የሞዴል ማሻሻያ ዑደት. ለምን አስፈላጊ ነው? በፖስታ ውስጥ የምዝገባ መርሃ ግብሩን ይመልከቱ:

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

የማሽን መማሪያ ገንቢ ቦቶች በኢሜል እንዳይመዘገቡ የሚከለክል የፀረ-ቦት ሞዴልን ተግባራዊ አድርጓል። ግራፉ እውነተኛ ተጠቃሚዎች ብቻ ወደሚቀሩበት እሴት ይወርዳል። ሁሉም ነገር ጥሩ ነው! ግን አራት ሰአታት አለፉ, ቦቶች ስክሪፕቶቻቸውን አስተካክለዋል, እና ሁሉም ነገር ወደ መደበኛው ይመለሳል. በዚህ ትግበራ ገንቢው አንድ ወር ባህሪያትን በመጨመር እና ሞዴሉን በማሰልጠን አሳልፏል, ነገር ግን አይፈለጌ መልዕክት ሰሪው በአራት ሰዓታት ውስጥ መላመድ ችሏል.

በጣም የሚያሠቃይ ላለመሆን እና ሁሉንም ነገር በኋላ ላይ እንደገና ላለመድገም በመጀመሪያ የግብረ-መልስ ምልልሱ ምን እንደሚመስል እና አካባቢው ከተለወጠ ምን እንደምናደርግ ማሰብ አለብን። መረጃን በመሰብሰብ እንጀምር - ይህ ለስልተ ቀመሮቻችን ነዳጅ ነው።

የውሂብ መሰብሰብ

ለዘመናዊ የነርቭ ኔትወርኮች የበለጠ መረጃ, የተሻለ እንደሚሆን ግልጽ ነው, እና እነሱ በእውነቱ, በምርቱ ተጠቃሚዎች የተፈጠሩ ናቸው. ተጠቃሚዎች ውሂብን ምልክት በማድረግ ሊረዱን ይችላሉ ነገርግን ይህንን አላግባብ መጠቀም አንችልም ምክንያቱም አንዳንድ ጊዜ ተጠቃሚዎች የእርስዎን ሞዴሎች ማጠናቀቅ ሰልችቷቸዋል እና ወደ ሌላ ምርት ይቀየራሉ።

በጣም ከተለመዱት ስህተቶች አንዱ (እዚህ ላይ አንድሪው ንግን ዋቢ አድርጌያለሁ) በሙከራ ዳታ ስብስብ ላይ ባሉ ልኬቶች ላይ ያተኮረ ነው ፣ እና ከተጠቃሚው አስተያየት ላይ ሳይሆን በእውነቱ የስራ ጥራት ዋና መለኪያ ነው ፣ ምክንያቱም እኛ ስለፈጠርን ለተጠቃሚው የሚሆን ምርት. ተጠቃሚው የአምሳያው ስራ ካልተረዳ ወይም ካልወደደው ሁሉም ነገር ተበላሽቷል.

ስለዚህ ተጠቃሚው ሁል ጊዜ ድምጽ መስጠት መቻል አለበት እና የግብረመልስ መሳሪያ ሊሰጠው ይገባል። ከፋይናንሺያል ጋር የተያያዘ ደብዳቤ በፖስታ ሳጥን ውስጥ እንደደረሰ ካሰብን፣ “ፋይናንስ” ላይ ምልክት ማድረግ እና ተጠቃሚው ጠቅ ማድረግ የሚችልበትን ቁልፍ መሳል እና ይህ ፋይናንስ አይደለም ማለት አለብን።

የግብረመልስ ጥራት

ስለተጠቃሚ ግብረመልስ ጥራት እንነጋገር። በመጀመሪያ፣ እርስዎ እና ተጠቃሚው የተለያዩ ትርጉሞችን በአንድ ጽንሰ-ሀሳብ ውስጥ ማስቀመጥ ይችላሉ። ለምሳሌ፣ እርስዎ እና የምርት አስተዳዳሪዎችዎ "ፋይናንስ" ማለት ከባንክ የተፃፉ ደብዳቤዎች ነው ብለው ያስባሉ፣ እና ተጠቃሚው ከአያቴ የተላከ ደብዳቤ ስለ ጡረታዎ እንዲሁ ፋይናንስን ይመለከታል ብለው ያስባሉ። በሁለተኛ ደረጃ, ያለምንም ሎጂክ አዝራሮችን መጫን የሚወዱ ተጠቃሚዎች አሉ. በሶስተኛ ደረጃ, ተጠቃሚው በመደምደሚያው ላይ በጥልቅ ሊሳሳት ይችላል. ከተግባራችን አስደናቂ ምሳሌ የክላሲፋየር ትግበራ ነው። የናይጄሪያ አይፈለጌ መልዕክት፣ በአፍሪካ ውስጥ በድንገት ከተገኘ የሩቅ ዘመድ ተጠቃሚው ብዙ ሚሊዮን ዶላር እንዲወስድ የሚጠየቅበት በጣም አስቂኝ የአይፈለጌ መልእክት አይነት። ይህንን ክላሲፋየር ተግባራዊ ካደረግን በኋላ በእነዚህ ኢሜይሎች ላይ "አይፈለጌ መልዕክት አይደለም" የሚለውን ጠቅ አድርገን 80% ያህሉ ጭማቂ የናይጄሪያ አይፈለጌ መልዕክት መሆናቸው ተረጋግጧል፣ ይህም ተጠቃሚዎች በጣም ሊታለሉ እንደሚችሉ ይጠቁማል።

እና አዝራሮቹ በሰዎች ብቻ ሳይሆን እንደ አሳሽ በሚመስሉ ሁሉም ዓይነት ቦቶች ሊጫኑ እንደሚችሉ መዘንጋት የለብንም. ስለዚህ ጥሬ አስተያየት ለመማር ጥሩ አይደለም. በዚህ መረጃ ምን ማድረግ ይችላሉ?

ሁለት መንገዶችን እንጠቀማለን-

  • ከተገናኘው ML ግብረ መልስ. ለምሳሌ, በመስመር ላይ የፀረ-ቦት ስርዓት አለን, እሱም እንደጠቀስኩት, በተወሰኑ ምልክቶች ላይ በመመርኮዝ ፈጣን ውሳኔ ይሰጣል. እና ከእውነታው በኋላ የሚሰራ ሁለተኛ, ዘገምተኛ ስርዓት አለ. ሾለ ተጠቃሚው፣ ባህሪው፣ ወዘተ የበለጠ መረጃ አለው። በውጤቱም, በጣም በመረጃ ላይ የተመሰረተ ውሳኔ ይደረጋል, በዚህ መሠረት, ከፍተኛ ትክክለኛነት እና ሙሉነት አለው. የእነዚህን ስርዓቶች አሠራር ልዩነት ወደ መጀመሪያው እንደ የስልጠና መረጃ መምራት ይችላሉ. ስለዚህ, ቀለል ያለ ስርዓት ሁልጊዜ ውስብስብ የሆነውን አፈፃፀም ለመቅረብ ይሞክራል.
  • ምደባን ጠቅ ያድርጉ. እያንዳንዱን የተጠቃሚ ጠቅታ በቀላሉ መከፋፈል ፣ ትክክለኛነቱን እና አጠቃቀሙን መገምገም ይችላሉ። ይህንን በፀረ-አይፈለጌ መልእክት ውስጥ እናደርጋለን ፣ የተጠቃሚ ባህሪያትን ፣ ታሪኩን ፣ የላኪ ባህሪያትን ፣ ጽሑፉን ልሹ እና የክላሲፋየሮችን ውጤት በመጠቀም። በውጤቱም, የተጠቃሚ ግብረመልስን የሚያረጋግጥ አውቶማቲክ ስርዓት እናገኛለን. እና በጣም ያነሰ በተደጋጋሚ እንደገና ማሰልጠን ስለሚያስፈልገው ስራው ለሌሎች ስርዓቶች ሁሉ መሰረት ሊሆን ይችላል. በዚህ ሞዴል ውስጥ ዋናው ቅድሚያ የሚሰጠው ትክክለኛነት ነው, ምክንያቱም ሞዴሉን በተሳሳተ መረጃ ላይ ማሰልጠን በሚያስከትላቸው ውጤቶች የተሞላ ነው.

መረጃውን እያጸዳን እና የኤምኤል ስርዓቶቻችንን የበለጠ በማሰልጠን ላይ ሳለን ስለተጠቃሚዎች መርሳት የለብንም, ምክንያቱም ለእኛ በሺዎች የሚቆጠሩ, በግራፉ ላይ በሚሊዮን የሚቆጠሩ ስህተቶች ስታትስቲክስ ናቸው, እና ለተጠቃሚው, እያንዳንዱ ስህተት አሳዛኝ ነገር ነው. ተጠቃሚው በምርቱ ውስጥ ካለው ስህተትዎ ጋር በሆነ መንገድ መኖር አለበት ከሚለው እውነታ በተጨማሪ ግብረመልስ ከተቀበለ በኋላ ለወደፊቱ ተመሳሳይ ሁኔታ እንደሚወገድ ይጠብቃል። ስለዚህ ለተጠቃሚዎች የመምረጥ እድልን ብቻ ሳይሆን የኤምኤል ስርዓቶችን ባህሪ ለማረም ሁል ጊዜም ጠቃሚ ነው ፣ ለእያንዳንዱ የግብረ-መልስ ጠቅታ ለምሳሌ የግል ሂዩሪስቲክስ መፍጠር ፣ በፖስታ ውስጥ ፣ ይህ የማጣራት ችሎታ ሊሆን ይችላል። እንደዚህ ያሉ ደብዳቤዎች በላኪ እና ለዚህ ተጠቃሚ ርዕስ።

እንዲሁም ሌሎች ተጠቃሚዎች ተመሳሳይ ችግር እንዳይደርስባቸው በአንዳንድ ሪፖርቶች ወይም በከፊል አውቶማቲክ ወይም በእጅ ሞድ ለመደገፍ በሚቀርቡ ጥያቄዎች ላይ ሞዴል መገንባት ያስፈልግዎታል።

ሂዩሪስቲክስ ለመማር

በእነዚህ ሂውሪስቲክስ እና ክራንች ላይ ሁለት ችግሮች አሉ. የመጀመሪያው ከጊዜ ወደ ጊዜ እየጨመረ የሚሄደው የክራንች እቃዎች ጥራታቸውን እና ውጤታቸውን ለረጅም ጊዜ ለመንከባከብ አስቸጋሪ ነው. ሁለተኛው ችግር ስህተቱ በተደጋጋሚ ላይሆን ይችላል, እና ሞዴሉን የበለጠ ለማሰልጠን ጥቂት ጠቅታዎች በቂ አይደሉም. የሚከተለው አካሄድ ተግባራዊ ከሆነ እነዚህ ሁለት የማይዛመዱ ውጤቶች በከፍተኛ ሁኔታ ገለልተኛ ሊሆኑ የሚችሉ ይመስላል።

  1. ጊዜያዊ ክራንች እንፈጥራለን.
  2. ከእሱ ወደ ሞዴሉ ውሂብ እንልካለን, በተቀበለው መረጃ ላይ ጨምሮ እራሱን በየጊዜው ያዘምናል. እዚህ, በእርግጥ, በስልጠና ስብስብ ውስጥ ያለውን የውሂብ ጥራት እንዳይቀንስ ሂውሪስቲክስ ከፍተኛ ትክክለኛነት እንዲኖረው አስፈላጊ ነው.
  3. ከዚያም ክራንችውን ለመቀስቀስ መቆጣጠሪያውን እናዘጋጃለን, እና ከተወሰነ ጊዜ በኋላ ክራንቻው የማይሰራ ከሆነ እና በአምሳያው ሙሉ በሙሉ የተሸፈነ ከሆነ, በጥንቃቄ ማስወገድ ይችላሉ. አሁን ይህ ችግር እንደገና ሊከሰት የማይችል ነው.

ስለዚህ የክራንች ሠራዊት በጣም ጠቃሚ ነው. ዋናው ነገር አገልግሎታቸው አስቸኳይ እንጂ ቋሚ አይደለም.

ተጨማሪ ስልጠና

መልሶ ማሰልጠን በተጠቃሚዎች ወይም በሌሎች ስርዓቶች ግብረመልስ የተገኘውን አዲስ መረጃ የማከል እና ነባር ሞዴልን በእሱ ላይ የማሰልጠን ሂደት ነው። ከተጨማሪ ስልጠና ጋር ብዙ ችግሮች ሊኖሩ ይችላሉ-

  1. ሞዴሉ በቀላሉ ተጨማሪ ስልጠናን አይደግፍም, ነገር ግን ከባዶ ብቻ ይማሩ.
  2. ተጨማሪ ስልጠና በእርግጠኝነት የምርት ጥራትን እንደሚያሻሽል በተፈጥሮ መጽሐፍ ውስጥ አልተጻፈም. ብዙውን ጊዜ ተቃራኒው ይከሰታል, ማለትም, መበላሸት ብቻ ይቻላል.
  3. ለውጦች ያልተጠበቁ ሊሆኑ ይችላሉ. ይህ ለራሳችን ያወቅነው ስውር ነጥብ ነው። ምንም እንኳን በ A/B ፈተና ውስጥ ያለ አዲስ ሞዴል አሁን ካለው ጋር ሲነጻጸር ተመሳሳይ ውጤቶችን ቢያሳይ እንኳን, ይህ ማለት በተመሳሳይ መልኩ ይሰራል ማለት አይደለም. ሥራቸው በአንድ በመቶ ብቻ ሊለያይ ይችላል, ይህም አዳዲስ ስህተቶችን ሊያመጣ ወይም ቀደም ሲል የተስተካከሉ አሮጌዎችን ሊመልስ ይችላል. እኛ እና ተጠቃሚዎች አሁን ካሉ ስህተቶች ጋር እንዴት እንደሚኖሩ አስቀድመን አውቀናል, እና ብዙ ቁጥር ያላቸው አዳዲስ ስህተቶች ሲፈጠሩ, ተጠቃሚው ምን እየተፈጠረ እንዳለ ላይረዳው ይችላል, ምክንያቱም ሊገመት የሚችል ባህሪን ይጠብቃል.

ስለዚህ, ተጨማሪ ስልጠና ውስጥ በጣም አስፈላጊው ነገር ሞዴሉ የተሻሻለ መሆኑን ማረጋገጥ ነው, ወይም ቢያንስ የከፋ አይደለም.

ስለ ተጨማሪ ስልጠና ስንነጋገር ወደ አእምሯችን የሚመጣው የመጀመሪያው ነገር ንቁ የመማር ዘዴ ነው። ይህ ምን ማለት ነው? ለምሳሌ፣ ክላሲፋዩ ኢሜል ከፋይናንስ ጋር የተገናኘ መሆኑን ይወስናል፣ እና በውሳኔው ወሰን ዙሪያ የተሰየሙ ምሳሌዎችን ናሙና እንጨምራለን ። ይሄ ጥሩ ይሰራል, ለምሳሌ, በማስታወቂያ ውስጥ, ብዙ ግብረመልስ በሚኖርበት እና ሞዴሉን በመስመር ላይ ማሰልጠን ይችላሉ. እና ትንሽ ግብረመልስ ካለ, ከዚያም በአሰራር ጊዜ የአምሳያው ባህሪን ለመገምገም በማይቻልበት መሰረት ከምርት መረጃ ስርጭት አንጻር ሲታይ በጣም የተዛባ ናሙና እናገኛለን.

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

በእርግጥ ግባችን አሮጌ ቅጦችን፣ ቀደም ሲል የታወቁ ሞዴሎችን መጠበቅ እና አዳዲሶችን ማግኘት ነው። ቀጣይነት እዚህ አስፈላጊ ነው. ብዙውን ጊዜ ለመንከባለል ከፍተኛ ሥቃይ የምንወስድበት ሞዴል ቀድሞውኑ እየሰራ ነው, ስለዚህ በአፈፃፀሙ ላይ ማተኮር እንችላለን.

በፖስታ ውስጥ የተለያዩ ሞዴሎች ጥቅም ላይ ይውላሉ: ዛፎች, መስመራዊ, የነርቭ አውታሮች. ለእያንዳንዳችን የራሳችንን ተጨማሪ የስልጠና ስልተ ቀመር እንሰራለን. ተጨማሪ የሥልጠና ሂደት ውስጥ, አዲስ መረጃን ብቻ ሳይሆን ብዙውን ጊዜ አዲስ ባህሪያትን እንቀበላለን, ይህም ከታች ባሉት ሁሉም ስልተ ቀመሮች ውስጥ ግምት ውስጥ እንገባለን.

መስመራዊ ሞዴሎች

የሎጂስቲክስ ሪግሬሽን አለን እንበል። ከሚከተሉት ክፍሎች የኪሳራ ሞዴል እንፈጥራለን.

  • በአዲስ ውሂብ ላይ LogLoss;
  • የአዳዲስ ባህሪያትን ክብደት እናስተካክላለን (አሮጌዎቹን አንነካም);
  • የድሮ ቅጦችን ለመጠበቅ ከድሮው መረጃ እንማራለን;
  • እና, ምናልባትም, በጣም አስፈላጊው ነገር: እንጨምራለን ሃርሞኒክ ሬጉላሬሽን , ይህም ክብደቱ በተለመደው መሰረት ከአሮጌው ሞዴል ጋር ሲነጻጸር ብዙም እንደማይለወጥ ዋስትና ይሰጣል.

እያንዳንዱ የኪሳራ ክፍል ቅንጅቶች ስላለው ለተግባራችን ምርጥ እሴቶችን በመስቀል ማረጋገጫ ወይም በምርት መስፈርቶች ላይ በመመስረት መምረጥ እንችላለን።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ዛፎች

ወደ ውሳኔ ዛፎች እንሂድ. ለዛፎች ተጨማሪ ስልጠና የሚከተለውን ስልተ ቀመር አዘጋጅተናል-

  1. ምርቱ ከ100-300 ዛፎች ያለው ደን ያካሂዳል, ይህም በአሮጌ የውሂብ ስብስብ ላይ የሰለጠነ ነው.
  2. በመጨረሻው ላይ M = 5 ቁርጥራጮችን እናስወግዳለን እና 2M = 10 አዲሶችን እንጨምራለን, በጠቅላላው የውሂብ ስብስብ ላይ የሰለጠኑ, ነገር ግን ለአዲሱ መረጃ ከፍተኛ ክብደት ያለው, ይህም በተፈጥሮው በአምሳያው ላይ ተጨማሪ ለውጥን ያረጋግጣል.

በግልጽ ለማየት እንደሚቻለው, በጊዜ ሂደት, የዛፎች ቁጥር በከፍተኛ ሁኔታ ይጨምራል, እና ጊዜውን ለማሟላት በየጊዜው መቀነስ አለባቸው. ይህንን ለማድረግ አሁን በየቦታው የሚገኘውን የእውቀት ማሰራጫ (KD) እንጠቀማለን። ስለ አሠራሩ መርህ በአጭሩ።

  1. አሁን ያለው "ውስብስብ" ሞዴል አለን. በስልጠናው መረጃ ስብስብ ላይ እናካሂዳለን እና በውጤቱ ላይ የክፍል ፕሮባቢሊቲ ስርጭትን እናገኛለን።
  2. በመቀጠል የተማሪውን ሞዴል (በዚህ ጉዳይ ላይ ያነሱ ዛፎች ያሉት ሞዴል) የክፍል ስርጭቱን እንደ ዒላማው ተለዋዋጭ በመጠቀም የአምሳያው ውጤቶችን ለመድገም እናሠለጥናለን.
  3. እዚህ ላይ የዳታ ማቀናበሪያ ማርክን በምንም መልኩ እንደማንጠቀም እና ስለዚህ የዘፈቀደ መረጃን መጠቀም እንደምንችል ልብ ማለት ያስፈልጋል። እርግጥ ነው፣ ለተማሪው ሞዴል የሥልጠና ናሙና ከውጊያው ዥረት የውሂብ ናሙና እንጠቀማለን። ስለዚህ የስልጠናው ስብስብ የአምሳያው ትክክለኛነት ለማረጋገጥ ያስችለናል, እና የዥረት ናሙናው በምርት ስርጭቱ ላይ ተመሳሳይ አፈፃፀም ዋስትና ይሰጣል, የስልጠናውን ስብስብ አድልዎ ይሸፍናል.

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

የእነዚህ ሁለት ቴክኒኮች ጥምረት (ዛፎችን መጨመር እና ከጊዜ ወደ ጊዜ ቁጥራቸውን በመቀነስ በእውቀት ማሰራጫ በመጠቀም) አዳዲስ ቅጦችን ማስተዋወቅ እና ሙሉ ለሙሉ ቀጣይነት እንዲኖረው ያረጋግጣል.

በኬዲ እርዳታ በሞዴል ባህሪያት ላይ የተለያዩ ስራዎችን እንሰራለን, ለምሳሌ ባህሪያትን ማስወገድ እና ክፍተቶችን መስራት. በእኛ ሁኔታ፣ በመረጃ ቋቱ ውስጥ የተከማቹ በርካታ ጠቃሚ የስታቲስቲክስ ባህሪያት (በላኪዎች፣ የጽሑፍ ሃሽ፣ ዩአርኤሎች፣ ወዘተ) አሉን፤ እነዚህም የመሳሳት አዝማሚያ አላቸው። በስልጠናው ስብስብ ውስጥ የውድቀት ሁኔታዎች ስለማይከሰቱ ሞዴሉ በእርግጥ ለእንደዚህ ዓይነቶቹ ክስተቶች እድገት ዝግጁ አይደለም ። በእንደዚህ ዓይነት ሁኔታዎች የ KD እና የመጨመር ቴክኒኮችን እናዋህዳለን-ለከፊል መረጃው በሚሰለጥንበት ጊዜ አስፈላጊዎቹን ባህሪያት እናስወግዳለን ወይም እንደገና እናስጀምራለን እና ዋና መለያዎችን (የአሁኑን ሞዴል ውጤቶች) እንወስዳለን እና የተማሪው ሞዴል ይህንን ስርጭት መድገም ይማራል። .

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ይበልጥ ከባድ በሆነ መጠን የሞዴል ማጭበርበር ሲከሰት ፣ የሚፈለገው የክር ናሙና መቶኛ ከፍ ያለ መሆኑን አስተውለናል።

ባህሪን ማስወገድ, ቀላሉ አሰራር, ትንሽ የፍሰቱ ክፍል ብቻ ያስፈልገዋል, ምክንያቱም ሁለት ባህሪያት ብቻ ስለሚቀየሩ እና የአሁኑ ሞዴል በተመሳሳይ ስብስብ ላይ የሰለጠኑ ናቸው - ልዩነቱ አነስተኛ ነው. ሞዴሉን ለማቃለል (የዛፎችን ብዛት ብዙ ጊዜ በመቀነስ) ከ ​​50 እስከ 50 ቀድሞውኑ ያስፈልጋል ። እና የአምሳያው አፈፃፀም ላይ ከፍተኛ ተጽዕኖ የሚያሳድሩ አስፈላጊ ስታቲስቲካዊ ባህሪዎችን ችላ ለማለት ፣ የአምሳያው ሥራ ደረጃውን ከፍ ለማድረግ የበለጠ ፍሰት ያስፈልጋል ። በሁሉም ዓይነት ፊደሎች ላይ አዲስ መቅረትን የሚቋቋም ሞዴል።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ፈጣን ጽሑፍ

ወደ FastText እንሂድ። ላስታውስህ የቃሉ ውክልና (መክተት) የቃሉን መክተት ድምር እና ሁሉንም ፊደሎቹ N-grams፣ አብዛኛውን ጊዜ ትሪግራም ነው። በጣም ብዙ ትሪግራሞች ሊኖሩ ስለሚችሉ, Bucket Hashing ጥቅም ላይ ይውላል, ማለትም, ሙሉውን ቦታ ወደ የተወሰነ ቋሚ ሃሽማፕ ይለውጣል. በዚህ ምክንያት የክብደት ማትሪክስ በእያንዳንዱ የቃላት ብዛት + ባልዲዎች ከውስጥ ንብርብር ልኬት ጋር ተገኝቷል።

ከተጨማሪ ስልጠና ጋር, አዲስ ምልክቶች ይታያሉ: ቃላት እና ትሪግራሞች. ከፌስቡክ በመደበኛ የክትትል ስልጠና ውስጥ ምንም ወሳኝ ነገር አይከሰትም. በአዲስ መረጃ ላይ እንደገና የሰለጠኑት የድሮ ክብደቶች ከመስቀል-ኤንትሮፒ ጋር ብቻ ናቸው። ስለዚህ, አዳዲስ ባህሪያት ጥቅም ላይ አይውሉም, በእርግጥ ይህ አቀራረብ በአምሳያው ውስጥ በምርት ውስጥ ካለው ያልተጠበቀ ሁኔታ ጋር የተያያዙ ሁሉም ከላይ የተገለጹት ድክመቶች አሉት. ለዛም ነው FastTextን በጥቂቱ ያስተካከልነው። ሁሉንም አዲስ ክብደቶች (ቃላቶች እና ትሪግራሞችን) እንጨምራለን ፣ አጠቃላይ ማትሪክስ በመስቀል-ኤንትሮፒ እናሰፋለን እና ከመስመር ሞዴል ጋር በማመሳሰል harmonic regularization እንጨምራለን ፣ ይህም በአሮጌው ክብደት ላይ ቀላል የማይባል ለውጥ ያረጋግጣል።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ሲ.ኤን.ኤን.

ኮንቮሉል ኔትወርኮች ትንሽ የተወሳሰቡ ናቸው። የመጨረሻዎቹ ንብርብሮች በ CNN ውስጥ ከተጠናቀቁ, በእርግጥ, harmonic regularization መተግበር እና ቀጣይነትን ማረጋገጥ ይችላሉ. ነገር ግን የጠቅላላው አውታረ መረብ ተጨማሪ ስልጠና የሚያስፈልግ ከሆነ እንደዚህ ዓይነቱ መደበኛነት በሁሉም ንብርብሮች ላይ ሊተገበር አይችልም። ነገር ግን በTriplet Loss (ተጨማሪ መካተትን) ለማሰልጠን አማራጭ አለ።ኦሪጅናል ጽሑፍ).

የሶስትዮሽ ኪሳራ

ጸረ-አስጋሪ ተግባርን እንደ ምሳሌ በመጠቀም፣ ትሪፕሌት ሎስን በጥቅሉ እንመልከታቸው። የእኛን አርማ እንወስዳለን, እንዲሁም የሌሎች ኩባንያዎችን አርማዎች አወንታዊ እና አሉታዊ ምሳሌዎችን እንወስዳለን. በመጀመሪያው መካከል ያለውን ርቀት እንቀንሳለን እና በሁለተኛው መካከል ያለውን ርቀት እንጨምራለን, የክፍሉን የበለጠ ጥብቅነት ለማረጋገጥ በትንሽ ክፍተት እንሰራለን.

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ኔትወርኩን የበለጠ ካሰለጥንን ፣የእኛ ሜትሪክ ቦታ ሙሉ በሙሉ ይለወጣል እና ከቀዳሚው ጋር ሙሉ በሙሉ የማይስማማ ይሆናል። ይህ ቬክተር በሚጠቀሙ ችግሮች ውስጥ ከባድ ችግር ነው. ይህንን ችግር ለመፍታት በስልጠና ወቅት አሮጌ ማቀፊያዎችን እንቀላቅላለን.

በስልጠናው ስብስብ ላይ አዲስ መረጃ ጨምረናል እና የአምሳያው ሁለተኛ ስሪት ከባዶ እያሰለጥን ነው። በሁለተኛው ደረጃ, የእኛን አውታረመረብ (Finetuning) የበለጠ እናሠለጥናለን: በመጀመሪያ የመጨረሻው ንብርብር ይጠናቀቃል, ከዚያም አውታረ መረቡ በሙሉ ያልቀዘቀዘ ነው. ትሪፕሌትሎችን በማቀናበር ሂደት ውስጥ የሰለጠነውን ሞዴል በመጠቀም የተካተቱትን ክፍሎች ብቻ እናሰላለን, የተቀረው - አሮጌውን በመጠቀም. ስለዚህ, ተጨማሪ ስልጠና በሂደት ላይ, የሜትሪክ ክፍተቶች v1 እና v2 ተኳሃኝነትን እናረጋግጣለን. የሃርሞኒክ መደበኛነት ልዩ ስሪት።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

አጠቃላይ አርክቴክቸር

ፀረ-አይፈለጌ መልዕክትን በመጠቀም አጠቃላይ ስርዓቱን እንደ ምሳሌ ከተመለከትን, ሞዴሎቹ የተገለሉ አይደሉም, ግን እርስ በእርሳቸው ውስጥ የተቀመጡ ናቸው. ምስሎችን፣ ቴክስት እና ሌሎች ባህሪያትን እንይዛለን፣ CNN እና Fast Text በመጠቀም መክተት እናገኛለን። በመቀጠል ፣ ክላሲፋየሮች በመክተቻዎች አናት ላይ ይተገበራሉ ፣ ይህም ለተለያዩ ክፍሎች (የፊደሎች ዓይነቶች ፣ አይፈለጌ መልእክት ፣ አርማ መኖር) ይሰጣል ። ለመጨረሻው ውሳኔ ምልክቶቹ እና ምልክቶች ቀድሞውኑ ወደ ዛፎች ጫካ እየገቡ ነው. በዚህ እቅድ ውስጥ ያሉ የግለሰብ ክላሲፋየሮች የስርዓቱን ውጤት በተሻለ ሁኔታ ለመተርጎም እና በችግሮች ጊዜ አካላትን እንደገና ማሰልጠን ይቻላል ሁሉንም መረጃዎች በጥሬ መልክ ወደ ውሳኔ ዛፎች ከመመገብ ይልቅ።

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

በውጤቱም, በእያንዳንዱ ደረጃ ቀጣይነት ዋስትና እንሰጣለን. በCNN እና Fast Text በታችኛው ደረጃ ሃርሞኒክ ተደጋጋሚነት እንጠቀማለን፣ በመሃል ላይ ላሉ ክላሲፋየሮች እንዲሁ ሃርሞኒክ ተደጋጋሚነት እና የዋጋ ማመጣጠንን የምንጠቀመው የፕሮባቢሊቲ ስርጭት ወጥነት ነው። ደህና፣ የዛፍ ማሳደግ በየደረጃው የሰለጠነ ነው ወይም እውቀትን ማጣራት በመጠቀም።

ባጠቃላይ በዝቅተኛ ደረጃ ላይ ያለ ማንኛውም አካል ከላይ ያለውን አጠቃላይ ስርዓት ወደ ማሻሻያ ስለሚመራ እንደዚህ ያለ የጎጆ ማሽን መማሪያ ስርዓትን መጠበቅ ብዙውን ጊዜ ህመም ነው። ነገር ግን በእኛ ውቅረት ውስጥ እያንዳንዱ አካል ትንሽ ስለሚቀየር እና ከቀደመው ጋር የሚጣጣም ስለሆነ ሙሉውን መዋቅር እንደገና ማሰልጠን ሳያስፈልግ አጠቃላይ ስርዓቱን በክፍል ሊዘምን ይችላል ፣ ይህም ያለ ከባድ ጭነት እንዲደገፍ ያስችለዋል።

አሰማር

ስለ የተለያዩ አይነት ሞዴሎች መረጃን መሰብሰብ እና ተጨማሪ ስልጠናዎችን ተወያይተናል, ስለዚህ ወደ ምርት አካባቢ ወደ ማሰማራት እንቀጥላለን.

ኤ/ቢ ሙከራ

ቀደም ሲል እንደተናገርኩት መረጃን በመሰብሰብ ሂደት ውስጥ ብዙውን ጊዜ የተዛባ ናሙና እናገኛለን, ከእሱም የአምሳያው የምርት አፈፃፀም ለመገምገም የማይቻል ነው. ስለዚህ, በሚሰማሩበት ጊዜ, ነገሮች በትክክል እንዴት እንደሚሄዱ ለመረዳት ሞዴሉ ከቀዳሚው ስሪት ጋር መወዳደር አለበት, ማለትም, የ A / B ሙከራዎችን ማካሄድ. በእርግጥ፣ ገበታዎችን የማውጣት እና የመተንተን ሂደት በጣም የተለመደ እና በቀላሉ በራስ ሰር የሚሰራ ነው። በሞዴል ምላሾች እና የተጠቃሚ ግብረመልሶች ላይ ያሉትን ሁሉንም መለኪያዎች እየሰበሰብን ሞዴሎቻችንን ቀስ በቀስ ወደ 5% ፣ 30% ፣ 50% እና 100% ተጠቃሚዎች እናቀርባለን። አንዳንድ ከባድ ውጫዊ ሁኔታዎችን በተመለከተ ሞዴሉን በራስ-ሰር እንመለሳለን እና ለሌሎች ጉዳዮች በቂ የተጠቃሚ ጠቅታዎችን ሰብስበን መቶኛ ለመጨመር እንወስናለን። በዚህ ምክንያት አዲሱን ሞዴል ወደ 50% ተጠቃሚዎች ሙሉ በሙሉ በራስ-ሰር እናመጣለን እና ለሁሉም ታዳሚዎች መልቀቅ በአንድ ሰው ይፀድቃል ፣ ምንም እንኳን ይህ እርምጃ በራስ-ሰር ሊሠራ ይችላል።

ሆኖም የA/B ሙከራ ሂደት ለማመቻቸት ቦታ ይሰጣል። እውነታው ግን ማንኛውም የ A/B ፈተና በጣም ረጅም ነው (በእኛ ሁኔታ ከ 6 እስከ 24 ሰአታት የሚፈጀው እንደ የግብረመልስ መጠን ነው), ይህም በጣም ውድ እና ውስን ሀብቶች አሉት. በተጨማሪም የፈተናውን አጠቃላይ ጊዜ ለማፋጠን በበቂ ሁኔታ ከፍተኛ የሆነ የፍሰት መቶኛ ያስፈልጋል (በትንሽ መቶኛ መለኪያዎችን ለመገምገም ስታቲስቲካዊ ጉልህ የሆነ ናሙና መመልመል በጣም ረጅም ጊዜ ሊወስድ ይችላል) የ A/B ቦታዎች ብዛት እጅግ በጣም የተገደበ። በግልጽ ለማየት እንደሚቻለው, ተጨማሪ የስልጠና ሂደት ውስጥ ብዙ የምንቀበለው በጣም ተስፋ ሰጪ ሞዴሎችን ብቻ መሞከር አለብን.

ይህንን ችግር ለመፍታት የA/B ፈተናን ስኬት የሚተነብይ የተለየ ክላሲፋየር አሰልጥነናል። ይህንን ለማድረግ የውሳኔ ሰጭ ስታቲስቲክስ ፣ ፕሪሲሽን ፣ ሪካል እና ሌሎች መለኪያዎች በስልጠናው ስብስብ ፣ በተላለፈው ላይ እና ከዥረቱ ናሙና ላይ እንደ ባህሪዎች እንወስዳለን ። እንዲሁም ሞዴሉን በምርት ውስጥ ካለው የአሁኑ ጋር እናነፃፅራለን ፣ ከሂዩሪስቲክስ ጋር እና የአምሳያው ውስብስብነት ከግምት ውስጥ እናስገባለን። እነዚህን ሁሉ ባህሪያት በመጠቀም በፈተና ታሪክ ላይ የሰለጠነ ክላሲፋየር የእጩ ሞዴሎችን ይገመግማል, በእኛ ሁኔታ እነዚህ የዛፍ ጫካዎች ናቸው, እና የትኛውን በ A/B ፈተና ውስጥ እንደሚጠቀሙ ይወስናል.

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

በአተገባበር ጊዜ ይህ አቀራረብ የተሳካውን የ A / B ፈተናዎች ብዙ ጊዜ እንድንጨምር አስችሎናል.

ሙከራ እና ክትትል

መሞከር እና ክትትል, በሚያስገርም ሁኔታ, ጤንነታችንን አይጎዱም, ይልቁንም, በተቃራኒው, ያሻሽሉታል እና ከአላስፈላጊ ጭንቀት ያርቁናል. መሞከር ውድቀትን ለመከላከል ያስችላል፣ እና ክትትል በተጠቃሚዎች ላይ ያለውን ተጽእኖ ለመቀነስ በጊዜው እንዲያውቁት ያስችልዎታል።

እዚህ መረዳት በጣም አስፈላጊ ነው ፈጥኖም ሆነ ዘግይቶ የእርስዎ ስርዓት ሁልጊዜ ስህተት እንደሚሰራ - ይህ በየትኛውም የሶፍትዌር እድገት ዑደት ምክንያት ነው. በስርዓት ልማት መጀመሪያ ላይ ሁሉም ነገር እስኪረጋጋ ድረስ እና ዋናው የፈጠራ ደረጃ እስኪጠናቀቅ ድረስ ሁልጊዜ ብዙ ሳንካዎች አሉ. ነገር ግን ከጊዜ በኋላ, entropy የራሱን ዋጋ ይወስዳል, እና ስህተቶች እንደገና ይታያሉ - ምክንያት ዙሪያ ክፍሎች መበስበስ እና ውሂብ ለውጦች, እኔ መጀመሪያ ላይ ስለ ተናገርኩ.

እዚህ ላይ ማንኛውም የማሽን መማሪያ ስርዓት በህይወቱ ዑደቱ ውስጥ ከትርፍ እይታ አንጻር መታሰብ እንዳለበት ማስተዋል እፈልጋለሁ። ከታች ያለው ግራፍ ስርዓቱ ያልተለመደ አይፈለጌ መልዕክት ለመያዝ እንዴት እንደሚሰራ የሚያሳይ ምሳሌ ያሳያል (በግራፉ ውስጥ ያለው መስመር ከዜሮ አጠገብ ነው)። አንድ ቀን፣ በስህተት በተሸጎጠ ባህሪ ምክንያት፣ አብዳለች። እንደ እድል ሆኖ፣ ያልተለመደ ቀስቅሴን በተመለከተ ምንም ዓይነት ክትትል አልነበረም፣ በውጤቱም ስርዓቱ በውሳኔ ሰጪው ወሰን ላይ ባለው “አይፈለጌ መልእክት” አቃፊ ውስጥ ፊደላትን በብዛት ማስቀመጥ ጀመረ። ውጤቱን ቢያስተካክልም, ስርዓቱ ቀድሞውኑ ብዙ ጊዜ ስህተቶችን አድርጓል, በአምስት አመታት ውስጥ እንኳን ለራሱ አይከፍልም. እና ይህ ከአምሳያው የሕይወት ዑደት አንጻር ሲታይ ሙሉ በሙሉ ውድቀት ነው.

በ Mail.ru ደብዳቤ ውስጥ የማሽን መማሪያ አሠራር

ስለዚህ እንደ ክትትል ያለ ቀላል ነገር በአምሳያው ህይወት ውስጥ ቁልፍ ሊሆን ይችላል. ከመደበኛ እና ግልጽ ልኬቶች በተጨማሪ የሞዴል ምላሾችን እና ውጤቶችን ስርጭትን እንዲሁም የቁልፍ ባህሪ እሴቶችን ስርጭት እንመለከታለን። የ KL ልዩነትን በመጠቀም የአሁኑን ስርጭት ከታሪካዊው ወይም በ A/B ፈተና ውስጥ ካሉት ዋጋዎች ከቀሪው ዥረት ጋር ማነፃፀር እንችላለን ፣ ይህም በአምሳያው ውስጥ ያልተለመዱ ነገሮችን እንድናስተውል እና ለውጦችን በጊዜው እንድንመልስ ያስችለናል።

በአብዛኛዎቹ አጋጣሚዎች የመጀመሪያዎቹን የስርዓቶች ስሪቶች ቀላል ሂውሪስቲክስ ወይም ለወደፊቱ እንደ ክትትል የምንጠቀምባቸውን ሞዴሎችን በመጠቀም እናስጀምራለን። ለምሳሌ, የ NER ሞዴልን ከተወሰኑ የመስመር ላይ መደብሮች ጋር በማነፃፀር እንቆጣጠራለን, እና የክላሲፋየር ሽፋን ከነሱ ጋር ሲነጻጸር ከቀነሰ, ምክንያቶቹን እንረዳለን. ሌላ ጠቃሚ የሂዩሪስቲክ አጠቃቀም!

ውጤቶች

የጽሁፉን ቁልፍ ሃሳቦች እንደገና እንለፍ።

  • Fibdeck. እኛ ሁልጊዜ ሾለ ተጠቃሚው እናስባለን: ከስህተታችን ጋር እንዴት እንደሚኖር, እንዴት እነሱን ሪፖርት ማድረግ እንደሚችል. ተጠቃሚዎች ለስልጠና ሞዴሎች የንጹህ ግብረመልስ ምንጭ እንዳልሆኑ መርሳት የለብዎትም, እና በረዳት ኤምኤል ስርዓቶች እርዳታ ማጽዳት ያስፈልገዋል. ከተጠቃሚው ምልክት መሰብሰብ የማይቻል ከሆነ, አማራጭ የግብረመልስ ምንጮችን እንፈልጋለን, ለምሳሌ, የተገናኙ ስርዓቶች.
  • ተጨማሪ ስልጠና. እዚህ ያለው ዋናው ነገር ቀጣይነት ነው, ስለዚህ አሁን ባለው የምርት ሞዴል ላይ እንተማመናለን. አዳዲስ ሞዴሎችን በሐርሞኒክ ተደጋጋሚነት እና መሰል ዘዴዎች ከቀዳሚው ብዙ እንዳይለዩ እናሠለጥናለን።
  • አሰማር. በመለኪያዎች ላይ ተመስርቶ በራስ-ሰር መዘርጋት ሞዴሎችን የመተግበር ጊዜን በእጅጉ ይቀንሳል. የክትትል ስታቲስቲክስ እና የውሳኔ አሰጣጥ ስርጭት፣ ከተጠቃሚዎች የሚደርሰው የመውደቅ ብዛት ለእረፍት እንቅልፍ እና ፍሬያማ ቅዳሜና እሁድ ግዴታ ነው።

ደህና፣ ይሄ የእርስዎን የኤም.ኤል ሲስተሞች በፍጥነት እንዲያሻሽሉ፣ በፍጥነት ለገበያ እንዲቀርቡ እና የበለጠ አስተማማኝ እና ውጥረት እንዲፈጥሩ እንደሚያደርጋቸው ተስፋ አደርጋለሁ።

ምንጭ: hab.com

አስተያየት ያክሉ