ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ሰላም ሁላችሁም! ስሜ ሳሻ እባላለሁ በLoyaltyLab ውስጥ CTO እና ተባባሪ መስራች ነኝ። ከሁለት አመት በፊት እኔና ጓደኞቼ ልክ እንደ ሁሉም ድሆች ተማሪዎች አመሻሹ ላይ በቤቱ አቅራቢያ ወደሚገኝ ሱቅ ለቢራ ሄድን። ቸርቻሪው ለቢራ እንደምንመጣ እያወቀ በቺፕ ወይም ክራከር ላይ ቅናሽ አለማድረጉ በጣም ተበሳጨን ምንም እንኳን ይህ በጣም ምክንያታዊ ቢሆንም! ይህ ሁኔታ ለምን እንደተፈጠረ አልገባንም እና የራሳችንን ኩባንያ ለመፍጠር ወሰንን. ደህና፣ እንደ ጉርሻ በየሳምንቱ አርብ ለእነዚያ ተመሳሳይ ቺፕስ ቅናሾችን ለራስዎ ይፃፉ።

ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

እና ሁሉም ነገር በምርቱ ቴክኒካዊ ጎን ላይ ካለው ቁሳቁስ ጋር እስከ መናገር ድረስ ደርሷል NVIDIA GTC. ስራችንን ከማህበረሰቡ ጋር በማካፈል ደስተኞች ነን ስለዚህ ሪፖርቴን በፅሁፍ መልክ አቀርባለሁ።

መግቢያ

በጉዞው መጀመሪያ ላይ እንዳሉት ሁሉም ሰው፣ የአማካሪ ስርዓቶች እንዴት እንደሚፈጠሩ አጠቃላይ እይታ ጀመርን። እና የሚከተለው ዓይነት ሥነ ሕንፃ በጣም ተወዳጅ ሆኖ ተገኝቷል-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ሁለት ክፍሎችን ያቀፈ ነው-

  1. በቀላል እና ፈጣን ሞዴል፣ በተለምዶ በትብብር ለምክር እጩዎች ናሙና መስጠት።
  2. በመረጃው ውስጥ ያሉትን ሁሉንም ሊሆኑ የሚችሉ ባህሪያትን ከግምት ውስጥ በማስገባት የእጩዎችን ደረጃ በበለጠ ውስብስብ እና ቀርፋፋ የይዘት ሞዴል።

እዚህ እና ከታች የሚከተሉትን ቃላት እጠቀማለሁ:

  • ለጥቆማዎች እጩ / እጩ - ጥንድ የተጠቃሚ-ምርት ፣ በምርት ውስጥ ወደ ምክሮች ሊገባ የሚችል።
  • እጩዎችን ማውጣት / ኤክስትራክተር / እጩ የማውጣት ዘዴ - "እጩዎችን ለመምከር" ካለው መረጃ ለማውጣት ሂደት ወይም ዘዴ።

በመጀመሪያ ደረጃ, የተለያዩ የትብብር ማጣሪያ ልዩነቶች ብዙውን ጊዜ ጥቅም ላይ ይውላሉ. በጣም ታዋቂው - ALS. የሚገርመው ነገር፣ ስለ አማካሪ ስርዓቶች አብዛኛዎቹ መጣጥፎች በመጀመሪያ ደረጃ ላይ በትብብር ሞዴሎች ላይ የተለያዩ ማሻሻያዎችን ብቻ ያሳያሉ፣ ነገር ግን ማንም ስለሌሎች የናሙና ዘዴዎች የሚናገር የለም። ለእኛ ፣ የትብብር ሞዴሎችን እና የተለያዩ ማመቻቸትን ብቻ የመጠቀም አቀራረብ ከጠበቅነው ጥራት ጋር አልሰራም ፣ ስለሆነም በዚህ ክፍል ላይ በጥናቱ ውስጥ ገብተናል ። እና በአንቀጹ መጨረሻ ላይ ALSን ምን ያህል ማሻሻል እንደቻልን አሳይሻለሁ, ይህም የእኛ መነሻ ነበር.

አካሄዳችንን ለመግለፅ ከመቀጠሌ በፊት፣ በእውነተኛ ጊዜ ምክሮች፣ ከ30 ደቂቃ በፊት የተከሰቱትን መረጃዎች ግምት ውስጥ ማስገባት አስፈላጊ በሚሆንበት ጊዜ፣ በትክክለኛው ጊዜ ሊሰሩ የሚችሉ ብዙ አቀራረቦች እንደሌሉ ልብ ማለት ያስፈልጋል። ነገር ግን, በእኛ ሁኔታ, ምክሮችን በቀን ከአንድ ጊዜ በላይ መሰብሰብ አለብን, እና በአብዛኛው - በሳምንት አንድ ጊዜ, ይህም ውስብስብ ሞዴሎችን ለመጠቀም እና ጥራቱን ለማባዛት እድል ይሰጠናል.

እጩዎችን በማውጣት ተግባር ላይ ALS ብቻ ምን እንደሚያሳይ ለዋናው መስመር እንውሰድ። የምንቆጣጠራቸው ቁልፍ መለኪያዎች፡-

  • ትክክለኛነት - ከተመረጡት ውስጥ በትክክል የተመረጡ እጩዎች መጠን።
  • አስታውስ - በተጨባጭ በዒላማው ልዩነት ውስጥ ከነበሩት ውስጥ የተከሰተው የእጩዎች መጠን።
  • F1-score - F-score በቀደሙት ሁለት ነጥቦች ላይ ይሰላል.

ከተጨማሪ የይዘት ባህሪያት ጋር ቀስ በቀስ ማደግን ካሰለጠነ በኋላ የመጨረሻውን ሞዴል መለኪያዎችን እንመለከታለን። እንዲሁም 3 ዋና መለኪያዎች አሉ፡-

  • precision@5 — አማካኝ መቶኛ ከከፍተኛዎቹ 5 ውጤቶች በእያንዳንዱ ደንበኛ።
  • ምላሽ-ሬት@5 - ገዢዎችን ከመደብሩ ጉብኝት ወደ ቢያንስ አንድ የግል ቅናሽ ግዥ መለወጥ (አንድ ቅናሽ 5 ምርቶችን ይይዛል)።
  • አማካይ roc-auc በተጠቃሚ - መካከለኛ roc-auc ለእያንዳንዱ ገዢ.

እነዚህ ሁሉ መመዘኛዎች የሚለኩት ላይ መሆኑን ልብ ማለት ያስፈልጋል የጊዜ ተከታታይ ተሻጋሪ ማረጋገጫማለትም ስልጠና በመጀመሪያዎቹ k ሳምንታት ውስጥ ይካሄዳል, እና k + 1 ሳምንታት እንደ የሙከራ መረጃ ይወሰዳሉ. ስለዚህ, ወቅታዊ ውጣ ውረዶች በአምሳያው ጥራት ትርጓሜ ላይ አነስተኛ ተጽዕኖ አሳድረዋል. ተጨማሪ፣ በሁሉም ገበታዎች ላይ፣ የአብሲሳ ዘንግ በመስቀለኛ ማረጋገጫ ውስጥ የሳምንት ቁጥርን ያሳያል፣ እና የተስተካከለው ዘንግ የተገለጸውን ሜትሪክ ዋጋ ያሳያል። ሁሉም ግራፎች በአንድ ደንበኛ የግብይት ውሂብ ላይ የተመሰረቱ ናቸው, ስለዚህም በመካከላቸው ያለው ንፅፅር ትክክል ነው.

አካሄዳችንን መግለፅ ከመጀመራችን በፊት በመጀመሪያ የ ALS የሰለጠነ ሞዴል የሆነውን የመነሻ መስመርን እንመልከት።
የእጩ ማውጣት መለኪያዎች፡-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

የመጨረሻ መለኪያዎች፡-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ሁሉንም የአልጎሪዝም አተገባበር እንደ አንድ የንግድ መላምት አድርጌ እመለከታለሁ። ስለዚህ, በጣም በግምት, ማንኛውም የትብብር ሞዴሎች እንደ መላምት ሊወሰዱ ይችላሉ, "ሰዎች እንደነሱ ሰዎች የሚገዙትን ለመግዛት ይፈልጋሉ". እንዳልኩት፣ እራሳችንን በእንደዚህ ዓይነት የትርጓሜ ትምህርቶች ብቻ አልወሰንንም፣ እና ከመስመር ውጭ ችርቻሮ ውስጥ አሁንም በውሂብ ላይ የሚሰሩ አንዳንድ መላምቶች እዚህ አሉ።

  1. ከዚህ በፊት ምን ገዝተዋል.
  2. ከዚህ በፊት ከገዛሁት ጋር ተመሳሳይ ነው።
  3. ያለፈው የረጅም ጊዜ ግዢ ጊዜ።
  4. በምድብ/ብራንድ ታዋቂ።
  5. ከሳምንት ወደ ሳምንት የተለያዩ እቃዎች ተለዋጭ ግዢዎች (ማርኮቭ ሰንሰለቶች).
  6. ተመሳሳይ ምርቶች ከገዢዎች ጋር, በተለያዩ ሞዴሎች (Word2Vec, DSSM, ወዘተ) የተገነቡ ባህሪያት መሰረት.

ከዚህ በፊት ምን ገዛህ

በችርቻሮ ችርቻሮ ውስጥ በደንብ የሚሰራው በጣም ግልፅ የሆነው ሂውሪስቲክ። እዚህ የታማኝነት ካርድ ያዢው በመጨረሻዎቹ K ቀናት (ብዙውን ጊዜ ከ1-3 ሳምንታት) ወይም ከ K ቀናት በፊት የገዛቸውን እቃዎች በሙሉ እንወስዳለን። ይህንን ዘዴ ብቻ በመተግበር የሚከተሉትን መለኪያዎች እናገኛለን።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

እዚህ ላይ በጣም ግልፅ ነው ጊዜውን በወሰድን ቁጥር የበለጠ ማስታወስ እና ትክክለኛነት ይቀንሳል እና በተቃራኒው። በአማካይ ለደንበኞች የተሻለ ውጤት "ያለፉትን 2 ሳምንታት" ይሰጣል.

ከዚህ በፊት ከገዛሁት ጋር ተመሳሳይ ነው።

“ከዚህ በፊት የተገዛው” ለግሮሰሪ ችርቻሮ በጥሩ ሁኔታ መስራቱ አያስደንቅም ፣ ግን ተጠቃሚው ከገዛው ብቻ እጩዎችን ማውጣት በጣም ጥሩ አይደለም ፣ ምክንያቱም አዲስ ምርት ገዥውን ማስደነቅ የማይቻል ነው ። ስለዚህ, ተመሳሳዩን የትብብር ሞዴሎችን በመጠቀም ይህንን ሂዩሪስቲክን በትንሹ ለማሻሻል እንመክራለን. በአኤልኤስ ስልጠና ወቅት ከተቀበልናቸው ቬክተሮች ተጠቃሚው አስቀድሞ ከገዛው ጋር ተመሳሳይ ምርቶችን ማግኘት ይችላሉ። ይህ ሃሳብ በቪዲዮ ይዘት መመልከቻ አገልግሎቶች ውስጥ ካሉ “ተመሳሳይ ቪዲዮዎች” ጋር በጣም ተመሳሳይ ነው፣ ነገር ግን ተጠቃሚው በተወሰነ ቅጽበት የሚበላ/የሚገዛውን ስለማናውቅ፣ ከገዛው ጋር ብቻ ተመሳሳይ የሆነ ነገር መፈለግ እንችላለን። በተለይም በትክክል እንዴት እንደሚሰራ አስቀድመን ስለምናውቅ. ይህንን ዘዴ ባለፉት 2 ሳምንታት በተጠቃሚ ግብይቶች ላይ በመተግበር የሚከተሉትን መለኪያዎች እናገኛለን።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ይህ ነው k - ባለፉት 14 ቀናት ውስጥ በገዢው ለተገዛ ለእያንዳንዱ ምርት የተገኙ ተመሳሳይ ምርቶች ብዛት።
ይህ አካሄድ በተለይ በተጠቃሚው የግዢ ታሪክ ውስጥ ያለውን ነገር በጭራሽ ላለመምከር ወሳኝ በሆነ ደንበኛ ላይ ለእኛ ጥሩ ሆኖ አገልግሏል።

ያለፈው የግዢ ጊዜ

አስቀድመን እንዳወቅነው, ሸቀጦችን በመግዛት ከፍተኛ ድግግሞሽ ምክንያት, የመጀመሪያው አቀራረብ ለትክክለኛዎቻችን ጥሩ ይሰራል. ነገር ግን እንደ ማጠቢያ ዱቄት / ሻምፑ / ወዘተ የመሳሰሉ እቃዎችስ? ይኸውም በየሳምንቱ ወይም ሁለት ሊያስፈልጉ በማይችሉ ምርቶች እና ቀደምት ዘዴዎች ሊወጡ በማይችሉ ምርቶች. ይህ የሚከተለውን ሀሳብ ያመለክታል - ምርቱን የበለጠ ለገዙ ገዢዎች በአማካይ የእያንዳንዱን ምርት የግዢ ጊዜ ለማስላት የታቀደ ነው. k አንድ ጊዜ. እና ከዚያ ምናልባት ገዥው ያለቀበትን ያውጡ። ለዕቃዎቹ የተቆጠሩት ጊዜያት በቂ መሆናቸውን በአይኖች ማረጋገጥ ይቻላል፡-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

እና ከዚያ በኋላ ምክሮቹ በምርት ላይ ሲሆኑ እና የወደቀውን ናሙና በሚወስዱበት ጊዜ የምርት ጊዜው ማብቂያ በጊዜ ልዩነት ውስጥ ቢወድቅ እናያለን. ዘዴው እንደሚከተለው ሊገለጽ ይችላል-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

እዚህ ሊታዩ የሚችሉ 2 ዋና ጉዳዮች አሉን።

  1. ምርቱን ከ K ጊዜ ባነሰ ጊዜ ለገዙ ደንበኞች የናሙና ይሁን።
  2. የወቅቱ መጨረሻ የዒላማው የጊዜ ክፍተት ከመጀመሩ በፊት ምርቱን ለናሙና መቅረብ አለመሆኑ።

የሚከተለው ግራፍ እንዲህ ዓይነቱ ዘዴ በተለያዩ hyperparameters ምን ውጤት እንደሚያስገኝ ያሳያል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
ft - ምርቱን ቢያንስ K (እዚህ K = 5) ጊዜ የገዙ ገዢዎችን ብቻ ይውሰዱ
tm - በታለመው የጊዜ ክፍተት ውስጥ የሚወድቁ እጩዎችን ብቻ ይውሰዱ

መቻል አያስደንቅም። (0, 0) ትልቁ አስታወሰ እና ትንሹ ትክክለኛነትበዚህ ሁኔታ ውስጥ ብዙ እጩዎች የሚወጡት ስለሆነ። ይሁን እንጂ ምርጡን ውጤት የሚገኘው አንድን የተወሰነ ምርት ከገዙት ደንበኞች ያነሰ ናሙና ሳናደርግ ነው። k ጊዜ እና ማውጣት፣ ከሌሎች ነገሮች መካከል፣ የወር አበባቸው የሚያበቃ እቃዎች ከታለመው ክፍተት በፊት የሚወድቁ ናቸው።

በምድብ ታዋቂ

ሌላው በትክክል ግልጽ የሆነ ሀሳብ በተለያዩ ምድቦች ወይም ብራንዶች ውስጥ ታዋቂ ምርቶችን ናሙና ማድረግ ነው. እዚህ ለእያንዳንዱ ደንበኛ እናሰላለን top-k “ተወዳጅ” ምድቦች/ብራንዶች እና ከዚያ ምድብ/ብራንድ “ታዋቂ” ያውጡ። በእኛ ሁኔታ, በምርት ግዢዎች ብዛት "ተወዳጅ" እና "ታዋቂ" እንገልጻለን. የዚህ አሰራር ተጨማሪ ጥቅም በቀዝቃዛ ጅምር ጉዳይ ላይ ተግባራዊ መሆን ነው. ያም ማለት በጣም ጥቂት ግዢዎችን ለፈጸሙ ወይም በመደብሩ ውስጥ ለረጅም ጊዜ ላልሆኑ ወይም በአጠቃላይ የታማኝነት ካርድ ለሰጡ ደንበኞች ማለት ነው. ለእነሱ ነባር ታሪክ ካላቸው ገዢዎች ታዋቂ የሆኑትን እቃዎች መጣል ቀላል እና የተሻለ ነው። መለኪያዎቹ የሚከተሉት ናቸው።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
እዚህ, "ምድብ" ከሚለው ቃል በኋላ ያለው ቁጥር ማለት የምድቡ ጎጆ ደረጃ ማለት ነው.

በአጠቃላይ, ጠባብ ምድቦች የበለጠ ትክክለኛ "ተወዳጅ" ምርቶችን ለገዢዎች ስለሚያወጡ, የተሻለ ውጤት ማግኘታቸው አያስገርምም.

ከሳምንት ወደ ሳምንት የተለያዩ እቃዎች ተለዋጭ ግዢዎች

ስለ አማካሪ ስርዓቶች በጽሁፎች ውስጥ ያላየሁት አስደሳች አቀራረብ በጣም ቀላል እና በተመሳሳይ ጊዜ የማርኮቭ ሰንሰለቶች ስታቲስቲካዊ ዘዴ ነው። እዚህ 2 የተለያዩ ሳምንታት እንወስዳለን, ከዚያም ለእያንዳንዱ ደንበኛ ጥንድ ምርቶችን እንገነባለን [በሳምንት i የተገዛ] - [በሳምንት j ውስጥ የተገዛ]፣ የት j > i, እና ከዚህ በሚቀጥለው ሳምንት ወደ ሌላ ምርት የመቀየር እድል ለእያንዳንዱ ምርት እናሰላለን. ማለትም ለእያንዳንዱ ጥንድ እቃዎች ምርት-ምርት በተገኙት ጥንዶች ውስጥ ቁጥራቸውን ይቁጠሩ እና በጥንድ ቁጥር ይከፋፍሉ, የት ምርት በመጀመሪያው ሳምንት ውስጥ ነበር. እጩዎችን ለማውጣት፣ የገዢውን የመጨረሻ ቼክ ወስደን እናገኛለን top-k ከተገኘው የሽግግር ማትሪክስ ውስጥ በጣም ሊሆኑ የሚችሉ ቀጣይ ምርቶች. የሽግግር ማትሪክስ የመገንባት ሂደት ይህን ይመስላል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

በሽግግር እድሎች ማትሪክስ ውስጥ ካሉ እውነተኛ ምሳሌዎች የሚከተሉትን አስደሳች ክስተቶች እናያለን-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
እዚህ በሸማቾች ባህሪ ውስጥ የሚገለጡ አስደሳች ጥገኞችን ማስተዋል ይችላሉ-ለምሳሌ ፣ citrus አፍቃሪዎች ወይም የወተት ምርት ፣ ምናልባትም ወደ ሌላ የሚቀይሩበት። እንደ ቅቤ ያሉ ከፍተኛ የድግግሞሽ ግዢዎች ያላቸው እቃዎች እዚህ ቢገኙም አያስገርምም።

ከማርኮቭ ሰንሰለቶች ጋር ባለው ዘዴ ውስጥ ያሉት መለኪያዎች እንደሚከተለው ናቸው ።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
k - ከገዢው የመጨረሻ ግብይት ለተገዛው ለእያንዳንዱ ዕቃ የሚወጡ ምርቶች ብዛት።
እንደምናየው, ከ k=4 ጋር ያለው ውቅረት ምርጡን ውጤት ያሳያል. በሳምንቱ 4 ላይ ያለው ጭማሪ በበዓል አከባቢ ወቅታዊ ባህሪ ሊገለጽ ይችላል። 

በተለያዩ ሞዴሎች የተገነቡ ባህሪያት መሰረት ከገዢዎች ጋር ተመሳሳይ ምርቶች

ስለዚህ ወደ በጣም አስቸጋሪው እና ሳቢው ክፍል ደርሰናል - በተለያዩ ሞዴሎች መሰረት የተገነቡ ገዢዎች እና ምርቶች ቬክተር ውስጥ የቅርብ ጎረቤቶችን ፍለጋ. በስራችን ውስጥ 3 እንደዚህ ያሉ ሞዴሎችን እንጠቀማለን-

  • ALS
  • Word2Vec (ለእንደዚህ ላሉት ተግባራት ንጥል 2 ቬክ)
  • DSSM

አስቀድመን ከ ALS ጋር ተነጋግረናል፣ እንዴት እንደሚማር ማንበብ ትችላለህ እዚህ. በ Word2Vec ጉዳይ ላይ የአምሳያው ታዋቂውን አተገባበር እንጠቀማለን ብልህነት. ከጽሑፎቹ ጋር በማመሳሰል ቅናሹን እንደ የግዢ ደረሰኝ እንገልፃለን። ስለዚህ, የምርት ቬክተርን በሚገነቡበት ጊዜ, አምሳያው በደረሰኙ ውስጥ ያለውን ምርት "አውድ" ለመተንበይ ይማራል (በደረሰኙ ውስጥ የተቀሩት እቃዎች). በኢ-ኮሜርስ መረጃ ውስጥ ፣ ወንዶቹ ከ ደረሰኝ ይልቅ የገዢውን ክፍለ ጊዜ መጠቀም የተሻለ ነው ። ኦዞንን. እና DSSM ለመበተን የበለጠ ትኩረት የሚስብ ነው። በመጀመሪያ የተጻፈው ከማይክሮሶፍት የመጡ ሰዎች እንደ ፍለጋ ሞዴል ነው ፣ ዋናውን የጥናት ወረቀት እዚህ ማንበብ ይችላሉ።. የአምሳያው አርክቴክቸር ይህን ይመስላል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ይህ ነው Q - ጥያቄ, የተጠቃሚ ፍለጋ ጥያቄ, ዲ[i] - ሰነድ, ድረ-ገጽ. የአምሳያው ግቤት የጥያቄውን ምልክቶች እና ገጾችን ይቀበላል. እያንዳንዱ የግቤት ንብርብር ሙሉ በሙሉ የተገናኙ ንብርብሮች (ባለብዙ ፐርሴፕቶን) ይከተላል. በመቀጠል ሞዴሉ በመጨረሻዎቹ የአምሳያው ንብርብሮች ውስጥ በተገኙት ቬክተሮች መካከል ያለውን ኮሳይን ለመቀነስ ይማራል.
የምክር ተግባራቶቹ በትክክል አንድ አይነት አርክቴክቸር ይጠቀማሉ፣ ነገር ግን ከጥያቄ ይልቅ ተጠቃሚ አለ፣ እና ከገጾች ይልቅ ምርቶች አሉ። እና በእኛ ሁኔታ ፣ ይህ ሥነ ሕንፃ ወደሚከተለው ተለውጧል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

አሁን ውጤቱን ለማጣራት የመጨረሻውን ነጥብ ለመሸፈን ይቀራል - በ ALS እና DSSM ውስጥ የተጠቃሚ ቬክተሮችን በግልፅ ከገለፅን ፣ በ Word2Vec ሁኔታ እኛ የምርት ቬክተሮች ብቻ አሉን። እዚህ የተጠቃሚ ቬክተርን ለመገንባት 3 ዋና መንገዶችን ለይተናል።

  1. ቬክተሮችን ብቻ ይጨምሩ፣ ከዚያ ለኮሳይን ርቀት ምርቶቹን በግዢ ታሪክ ውስጥ አማካኝ እንዳደረግን ነው።
  2. ከተወሰነ ጊዜ ክብደት ጋር የቬክተሮች ማጠቃለያ።
  3. ሸቀጦችን ከTF-IDF Coefficient ጋር መመዘን.

የገዢውን ቬክተር የመስመራዊ ክብደትን በተመለከተ፡ ተጠቃሚው ትናንት የገዛው ምርት ከስድስት ወራት በፊት ከገዛው ምርት የበለጠ በባህሪው ላይ ተጽእኖ ይኖረዋል ከሚለው መላምት እንቀጥላለን። ስለዚህ ያለፈውን የገዢውን ሳምንት በ 1 ጥምርታ እና በመቀጠል በ½ ፣ ⅓ ፣ ወዘተ ጥምርታ ምን እንደተፈጠረ እንመለከታለን።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ለ TF-IDF ጥምርታዎች ፣ በ TF-IDF ለጽሑፎች በትክክል አንድ አይነት ነገር እናደርጋለን ፣ እኛ ብቻ ገዥውን እንደ ሰነድ ፣ እና ደረሰኙ እንደ ቅናሽ ፣ በቅደም ተከተል ፣ ቃሉ ምርት ነው። ስለዚህ የተጠቃሚው ቬክተር ወደ ብርቅዬ እቃዎች ይሸጋገራል, እና ለገዢው በተደጋጋሚ እና የተለመዱ እቃዎች ብዙም አይቀይሩትም. ዘዴው እንደሚከተለው ሊገለጽ ይችላል-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

አሁን መለኪያዎቹን እንይ። የ ALS ውጤቶች ይህን ይመስላል፡-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
መለኪያዎች በ Item2Vec የገዢውን ቬክተር ግንባታ ከተለያዩ ልዩነቶች ጋር፡
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
በዚህ ሁኔታ, ልክ እንደ መሰረታዊ መስመራችን በትክክል ተመሳሳይ ሞዴል ጥቅም ላይ ይውላል. ብቸኛው ልዩነት የትኛውን k እንጠቀማለን. የትብብር ሞዴሎችን ብቻ ለመጠቀም ለእያንዳንዱ ደንበኛ ከ50-70 የሚጠጉ ምርቶችን መውሰድ አለብዎት።

እና የDSSM መለኪያዎች፡-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ሁሉንም ዘዴዎች እንዴት ማዋሃድ?

አሪፍ፣ ትላላችሁ፣ ግን እንደዚህ ባለ ትልቅ የእጩ ማስወጫ መሳሪያዎች ምን ይደረግ? ለመረጃዎ ጥሩውን ውቅር እንዴት መምረጥ ይቻላል? እዚህ ብዙ ችግሮች አሉብን:

  1. በእያንዳንዱ ዘዴ ለሃይፐርፓራሜትሮች የፍለጋ ቦታን በሆነ መንገድ መገደብ አስፈላጊ ነው. እሱ ፣ በእርግጥ ፣ በሁሉም ቦታ የተለየ ነው ፣ ግን ሊሆኑ የሚችሉ ነጥቦች ብዛት በጣም ትልቅ ነው።
  2. የተወሰኑ የልዩ ዘዴዎችን በመጠቀም ልዩ ልዩ መለኪያዎችን በመጠቀም ለሜትሪክዎ ምርጡን ውቅር እንዴት እንደሚመርጡ?

ለመጀመሪያው ጥያቄ ገና በማያሻማ ትክክለኛ መልስ አላገኘንም ፣ ስለዚህ ከሚከተለው እንቀጥላለን-ለእያንዳንዱ ዘዴ ፣ ባለን መረጃ ላይ በአንዳንድ ስታቲስቲክስ ላይ በመመርኮዝ የሃይፐርፓራሜትር ፍለጋ ቦታ ገደብ ይፃፋል ። ስለዚህ በሰዎች ግዢ መካከል ያለውን አማካይ ጊዜ በማወቅ "ቀድሞውኑ የተገዛውን" እና "ያለፈውን የረጅም ጊዜ ግዢ ጊዜ" ዘዴን በየትኛው ጊዜ እንደሚጠቀሙ መገመት እንችላለን.

እና አንዳንድ በቂ ቁጥር ያላቸውን የተለያዩ ዘዴዎች ልዩነቶች ካሳለፍን በኋላ የሚከተሉትን እናስተውላለን-እያንዳንዱ ትግበራ የተወሰኑ እጩዎችን ያወጣል እና ለእኛ ቁልፍ የሆነውን የመለኪያ (ማስታወስ) የተወሰነ እሴት አለው። በተፈቀደው የኮምፒዩተር ሃይላችን ላይ በመመስረት በጠቅላላው የተወሰነ የእጩዎችን ቁጥር ማግኘት እንፈልጋለን በተቻለ መጠን ከፍተኛ ልኬት። እዚህ ችግሩ በጥሩ ሁኔታ ወደ የኪስ ቦርሳ ችግር ውስጥ ወድቋል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

እዚህ የእጩዎች ቁጥር የኢንጎት ክብደት ነው, እና የማስታወስ ዘዴው ዋጋው ነው. ሆኖም ፣ አልጎሪዝምን በሚተገበሩበት ጊዜ ከግምት ውስጥ መግባት አለባቸው 2 ተጨማሪ ነጥቦች አሉ-

  • በመረጧቸው እጩዎች ውስጥ ዘዴዎች ሊደራረቡ ይችላሉ.
  • በአንዳንድ ሁኔታዎች አንድ ዘዴ ሁለት ጊዜ ከተለያዩ መለኪያዎች ጋር መወሰዱ ትክክል ይሆናል, እና በመጀመሪያው ውፅዓት ላይ ያሉ እጩዎች የሁለተኛው ንዑስ ክፍል አይሆኑም.

ለምሳሌ ፣ “ቀድሞውንም የተገዛውን” ዘዴን በተለያዩ ክፍተቶች ለማውጣት ከወሰድን ፣ የእጩዎቻቸው ስብስቦች እርስ በእርስ ይጣበቃሉ ። በተመሳሳይ ጊዜ, በመውጫው ላይ "በጊዜያዊ ግዢዎች" ውስጥ ያሉ የተለያዩ መመዘኛዎች የተሟላ መስቀለኛ መንገድ አይሰጡም. ስለዚህ የናሙና ዘዴዎችን ከተለያዩ መለኪያዎች ጋር ወደ ብሎኮች እንከፋፍላቸዋለን ስለዚህም ከእያንዳንዱ ብሎክ ቢበዛ አንድ የማውጣት ዘዴን በልዩ ሃይፐርፓራሜትሮች መውሰድ እንፈልጋለን። ይህንን ለማድረግ የ knapsack ችግርን በመተግበር ላይ ትንሽ ማታለል ያስፈልግዎታል, ነገር ግን አሲምፕቶቲክስ እና ውጤቱ ከዚህ አይለወጥም.

እንዲህ ዓይነቱ ብልህ ጥምረት በቀላሉ ከተባባሪ ሞዴሎች ጋር በማነፃፀር የሚከተሉትን መለኪያዎች እንድናገኝ ያስችለናል ።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
በመጨረሻዎቹ መለኪያዎች ላይ የሚከተለውን ምስል እናያለን-
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ሆኖም ግን, እዚህ ለንግድ ስራ ጠቃሚ ምክሮች አንድ ያልተሸፈነ ነጥብ እንዳለ ማየት ይችላሉ. አሁን ተጠቃሚው ምን እንደሚገዛ በቀዝቃዛ ሁኔታ መተንበይ እንደሚቻል ተምረናል ለምሳሌ በሚቀጥለው ሳምንት። ግን ለማንኛውም የሚገዛውን ቅናሽ መስጠት ብቻ በጣም አሪፍ አይደለም። ነገር ግን የሚጠበቀውን ነገር ከፍ ማድረግ ጥሩ ነው፣ ለምሳሌ ከሚከተሉት ልኬቶች፡

  1. በግል ምክሮች ላይ በመመስረት ህዳግ/ማዞሪያ።
  2. የገዢዎች አማካይ ቼክ።
  3. የመጎብኘት ድግግሞሽ.

ስለዚህ ያገኙትን ፕሮባቢሊቲዎች በተለያዩ አሃዞች እናባዛቸዋለን እና ከላይ ያሉትን መለኪያዎች የሚነኩ ምርቶችን እንዲያካትት በድጋሚ ደረጃ እንሰጣቸዋለን። እዚህ ምንም ዝግጁ የሆነ መፍትሄ የለም, የትኛውን አቀራረብ መጠቀም የተሻለ ነው. እኛ እንኳን እኛ በቀጥታ በማምረት ውስጥ እንደዚህ ባሉ ቅንጅቶች እየሞከርን ነው። ግን ብዙውን ጊዜ ጥሩ ውጤቶችን የሚሰጡን አንዳንድ አስደሳች ዘዴዎች እዚህ አሉ።

  1. በእቃው ዋጋ/ህዳግ ማባዛት።
  2. ምርቱ በሚከሰትበት አማካይ ቼክ ማባዛት። ስለዚህ እቃዎቹ ብዙውን ጊዜ ሌላ ነገር የሚወስዱበት ይወጣሉ.
  3. ይህ ምርት ለእሱ ብዙ ጊዜ ተመላሾችን ያስነሳል በሚለው መላምት ላይ በመመስረት የዚህ ምርት ገዢዎች በአማካኝ የጉብኝት ድግግሞሽ ማባዛት።

በቅንጅቶች ከሞከርን በኋላ፣ በምርት ውስጥ የሚከተሉትን መለኪያዎች አግኝተናል።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን
ይህ ነው አጠቃላይ የምርት መቀየር - እኛ ባፈጠርናቸው ምክሮች ውስጥ ከሁሉም ምርቶች የተገዙ ምርቶች ድርሻ።

በትኩረት የሚከታተል አንባቢ ከመስመር ውጭ እና በመስመር ላይ መለኪያዎች መካከል ከፍተኛ ልዩነትን ያስተውላል። ይህ ባህሪ የሚገለፀው ሞዴል በሚሰለጥኑበት ጊዜ ሊመከሩ የሚችሉ ምርቶች ሁሉም ተለዋዋጭ ማጣሪያዎች ሊወሰዱ እንደማይችሉ ነው. ከተመረጡት እጩዎች ውስጥ ግማሹን ማጣራት ሲቻል ለእኛ የተለመደ ታሪክ ነው, እንዲህ ዓይነቱ ልዩነት በእኛ ኢንዱስትሪ ውስጥ የተለመደ ነው.

ከገቢ አንፃር የሚከተለው ታሪክ ተገኝቷል ፣ ምክሮቹን ከጀመሩ በኋላ የፈተና ቡድን ገቢ በከፍተኛ ሁኔታ እያደገ መምጣቱ ግልፅ ነው ፣ አሁን በአስተያየታችን አማካይ የገቢ ጭማሪ 3-4% ነው ።
ከመስመር ውጭ ችርቻሮ ውስጥ የጥቆማዎችን ጥራት እንዴት በከፍተኛ ደረጃ እንዳሻሻልን

ለማጠቃለል ያህል ፣ የእውነተኛ ጊዜ ያልሆኑ ምክሮች ከፈለጉ ፣ በጣም ትልቅ የጥራት ጭማሪ ለምክር እጩዎችን በማውጣት ሙከራዎች ውስጥ ይገኛል ማለት እፈልጋለሁ ። እነሱን ለመፍጠር ከፍተኛ መጠን ያለው ጊዜ ብዙ ጥሩ ዘዴዎችን ለማጣመር ያስችላል, ይህም በአጠቃላይ ለንግድ ስራ ጥሩ ውጤት ያስገኛል.

ጽሑፉን አስደሳች ሆኖ ካገኙት ሁሉ ጋር በአስተያየቶቹ ውስጥ ማውራት ደስ ይለኛል። በአካል ተገኝተህ መጠየቅ ትችላለህ ቴሌግራም. እንዲሁም በ AI / ጅምር ላይ ሀሳቤን አካፍላለሁ። የቴሌግራም ቻናል - እንኳን ደህና መጣህ 🙂

ምንጭ: hab.com

አስተያየት ያክሉ