اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

هيلو سڀ! منهنجو نالو ساشا آهي، مان LoyaltyLab ۾ CTO ۽ ڪو-باني آهيان. ٻه سال اڳ، مان ۽ منهنجا دوست، سڀني غريب شاگردن وانگر، شام جو اسان جي گهر جي ڀرسان واري دڪان تي بيئر خريد ڪرڻ لاءِ ويا هئاسين. اسان ڏاڍا پريشان هئاسين ته پرچون ڪندڙ، ڄاڻي ٿو ته اسان بيئر لاء ايندا، چپس يا ڪڪڙين تي رعايت نه ڏني، جيتوڻيڪ اهو تمام منطقي هو! اسان کي سمجھ ۾ نه آيو ته هي صورتحال ڇو ٿي رهي آهي ۽ اسان جي پنهنجي ڪمپني شروع ڪرڻ جو فيصلو ڪيو. خير، بونس طور، هر جمعه تي انهن ساڳين چپس تي پنهنجو پاڻ کي رعايت ڏيو.

اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

۽ اهو سڀ ان نقطي تي پهچي ويو آهي جتي مان پيش ڪري رهيو آهيان مواد جي ٽيڪنيڪل پاسي تي NVIDIA GTC. اسان پنهنجي ڪم کي ڪميونٽي سان شيئر ڪرڻ ۾ خوش آهيون، تنهنڪري مان پنهنجي رپورٽ کي آرٽيڪل جي صورت ۾ شايع ڪري رهيو آهيان.

تعارف

سفر جي شروعات ۾ هر ڪنهن وانگر، اسان هڪ جائزو سان شروع ڪيو ته سفارش ڪندڙ سسٽم ڪيئن ٺهيل آهن. ۽ سڀ کان وڌيڪ مشهور فن تعمير هيٺ ڏنل قسم مان نڪرندو آهي:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

اهو ٻن حصن تي مشتمل آهي:

  1. هڪ سادي ۽ تيز ماڊل استعمال ڪندي سفارشن لاءِ اميدوارن جو نمونو، عام طور تي هڪ تعاون ڪندڙ.
  2. اميدوارن جي درجه بندي وڌيڪ پيچيده ۽ سست مواد واري ماڊل سان، ڊيٽا ۾ سڀني ممڪن خاصيتن کي مدنظر رکندي.

ھتان کان پوءِ مان ھيٺيان اصطلاح استعمال ڪندس:

  • سفارشن لاء اميدوار / اميدوار - هڪ صارف-پراڊڪٽ جوڙو جيڪو ممڪن طور تي پيداوار ۾ سفارشن ۾ شامل ٿي سگھي ٿو.
  • اميدوارن کي ڪڍڻ / ڪڍڻ وارو / اميدوار ڪڍڻ جو طريقو - دستياب ڊيٽا مان "سفارش اميدوارن" کي ڪڍڻ لاء هڪ عمل يا طريقو.

پهريون قدم عام طور تي گڏيل فلٽرنگ جي مختلف تبديلين کي استعمال ڪرڻ ۾ شامل آهي. سڀ کان وڌيڪ مشهور - ALS. اها حيرت انگيز آهي ته سفارش ڪندڙ سسٽم بابت اڪثر آرٽيڪل صرف پهرين اسٽيج تي بااختيار ماڊل ۾ مختلف سڌارا ظاهر ڪن ٿا، پر ڪو به ٻين نموني جي طريقن بابت گهڻو ڪجهه نه ڳالهائيندو آهي. اسان لاءِ، صرف تعاوني ماڊل استعمال ڪرڻ جو طريقو ۽ انھن سان گڏ مختلف اصلاحن ان معيار سان ڪم نه ڪيو جنھن جي اسان توقع ڪئي ھئي، تنھنڪري اسان خاص طور تي ھن حصي تي تحقيق ڪئي. ۽ آرٽيڪل جي آخر ۾ مان ڏيکاريندس ته اسان ڪيتري قدر ALS کي بهتر ڪرڻ جي قابل هئا، جيڪو اسان جو بنيادي بنياد هو.

ان کان اڳ جو مان اسان جي نقطه نظر کي بيان ڪرڻ لاءِ اڳتي وڌان، اهو نوٽ ڪرڻ ضروري آهي ته حقيقي وقت جي سفارشن ۾، جڏهن اسان لاءِ ضروري آهي ته 30 منٽ اڳ ٿيل ڊيٽا کي نظر ۾ رکون، حقيقت ۾ اهڙا ڪيترائي طريقا نه آهن جيڪي گهربل وقت ۾ ڪم ڪري سگهن. پر، اسان جي صورت ۾، اسان کي سفارشون گڏ ڪرڻ گهرجن هڪ ڏينهن کان وڌيڪ هڪ ڀيرو، ۽ اڪثر ڪيسن ۾ - هفتي ۾ هڪ ڀيرو، جيڪو اسان کي پيچيده ماڊل استعمال ڪرڻ ۽ معيار کي بهتر ڪرڻ جو موقعو ڏئي ٿو.

اچو ته هڪ بنيادي طور تي وٺون جيڪي ميٽرڪس صرف ALS اميدوارن کي ڪڍڻ جي ڪم تي ڏيکاري ٿو. اسان جي نگراني ڪندڙ اهم ميٽرڪ آهن:

  • درستي - نمونن مان صحيح چونڊيل اميدوارن جو تناسب.
  • ياد رهي ته اميدوارن جو تناسب جيڪو ٿيو انهن مان جيڪي اصل ۾ ٽارگيٽ وقفي ۾ هئا.
  • F1-score - F-ماپ اڳئين ٻن پوائنٽن تي ڳڻيو ويو.

اسان اضافي مواد جي خاصيتن سان ٽريننگ گريجوئيٽ بوسٽنگ کان پوءِ فائنل ماڊل جي ميٽرڪس کي به ڏسنداسين. هتي 3 مکيه ميٽرڪ پڻ آهن:

  • precision@5 - هر خريد ڪندڙ لاءِ امڪان جي لحاظ کان مٿين 5 مان پروڊڪٽس جو سراسري سيڪڙو.
  • Response-rate@5 - گراهڪ جي مٽاسٽا کان وٺي اسٽور جي دوري کان گهٽ ۾ گهٽ هڪ ذاتي آڇ جي خريداري تائين (هڪ آڇ ۾ 5 مصنوعات).
  • avg roc-auc في صارف - سراسري roc-auc هر خريد ڪندڙ لاء.

اهو نوٽ ڪرڻ ضروري آهي ته اهي سڀئي ميٽرڪ تي ماپيل آهن وقت جي سيريز ڪراس-تصديق، يعني، ٽريننگ پھرين k هفتن ۾ ٿيندي آھي، ۽ k+1 ھفتو ٽيسٽ ڊيٽا طور ورتو ويندو آھي. اهڙيء طرح، موسمي اپ ۽ هيٺيون ماڊل جي معيار جي تشريح تي گهٽ ۾ گهٽ اثر پيو. وڌيڪ سڀني گرافس تي، abscissa محور ڪراس-تصديق ۾ هفتي نمبر جي نشاندهي ڪندو، ۽ ترتيب وارو محور بيان ڪيل ميٽرڪ جي قيمت کي ظاهر ڪندو. سڀئي گراف هڪ ڪلائنٽ کان ٽرانزيڪشن ڊيٽا تي ٻڌل آهن انهي ڪري هڪ ٻئي جي وچ ۾ مقابلو صحيح آهن.

ان کان اڳ جو اسان اسان جي طريقي کي بيان ڪرڻ شروع ڪريون، اسان پھريون نظر رکون ٿا بيس لائين، جيڪو ھڪڙو ALS-تربيت ٿيل ماڊل آھي.
اميدوارن جي واپسي جي ماپ:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

آخري ماپ:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

مان الگورتھم جي سڀني عملن کي ڪجھ قسم جي ڪاروباري مفروضي وانگر سمجھان ٿو. اهڙيء طرح، تمام گهڻو، ڪنهن به تعاون واري نموني کي هڪ مفروضي طور سمجهي سگهجي ٿو ته "ماڻهو خريد ڪندا آهن جيڪي انهن سان ملندڙ ماڻهو خريد ڪندا آهن." جيئن ته مون اڳ ۾ ئي چيو آهي، اسان پاڻ کي اهڙين لفظن تائين محدود نه ڪيو، ۽ هتي ڪجهه مفروضا آهن جيڪي آف لائن پرچون ۾ ڊيٽا تي سٺو ڪم ڪن ٿا:

  1. جيڪو مون اڳ ۾ ئي خريد ڪيو آهي.
  2. ساڳي طرح جيڪو مون اڳ خريد ڪيو.
  3. هڪ ڊگهي ماضي جي خريداري جي مدت.
  4. درجه بندي/برانڊ طرفان مشهور.
  5. هفتي کان هفتي تائين مختلف سامان جي متبادل خريداري (مارڪوف زنجير).
  6. مختلف ماڊلز (Word2Vec، DSSM، وغيره).

توهان اڳي ڇا خريد ڪيو؟

سڀ کان وڌيڪ واضح هوريسٽ جيڪو ڪم ڪري ٿو تمام سٺو پسارڪو پرچون ۾. هتي اسان اهي سڀئي سامان کڻون ٿا جيڪي وفاداري ڪارڊ هولڊر گذريل K ڏينهن (عام طور تي 1-3 هفتا)، يا هڪ سال اڳ K ڏينهن ۾ خريد ڪيا. صرف هن طريقي کي لاڳو ڪندي، اسان هيٺ ڏنل ميٽرڪ حاصل ڪندا آهيون:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

هتي اها ڳالهه بلڪل واضح آهي ته جيترو ڊگهو عرصو اسين وٺون ٿا، اوترو وڌيڪ اسان کي ياد اچي ٿو ۽ اسان وٽ گهٽ درستگي آهي ۽ ان جي برعڪس. سراسري طور تي، "آخري 2 هفتا" گراهڪن لاءِ بهتر نتيجا ڏئي ٿو.

ساڳي طرح جيڪو مون اڳ خريد ڪيو

اها تعجب جي ڳالهه ناهي ته گروسري پرچون لاءِ ”جيڪو مون اڳ ۾ خريد ڪيو آهي“ سٺو ڪم ڪري ٿو، پر اميدوارن کي ڪڍڻ صرف ان مان آهي جيڪو صارف اڳ ۾ ئي خريد ڪري چڪو آهي تمام سٺو ناهي، ڇاڪاڻ ته اهو ممڪن ناهي ته خريد ڪندڙ کي ڪجهه نئين پراڊڪٽ سان حيران ڪري. تنهن ڪري، اسان کي ٿورو بهتر ڪرڻ جي تجويز آهي ته هن heuristic ساڳي تعاون ماڊلز استعمال ڪندي. ویکٹرن مان جيڪي اسان ALS ٽريننگ دوران حاصل ڪيا، اسان ساڳي پروڊڪٽس حاصل ڪري سگهون ٿا جيڪي صارف اڳ ۾ ئي خريد ڪري چڪو آهي. اهو خيال وڊيو مواد ڏسڻ لاءِ خدمتن ۾ ”ساڳئي وڊيوز“ سان تمام گهڻو ملندڙ جلندڙ آهي، پر جيئن ته اسان کي خبر ناهي ته صارف ڪنهن خاص لمحي ۾ ڇا کائي رهيو آهي/خريد ڪري رهيو آهي، ان ڪري اسان صرف ان سان ملندڙ جلندڙ ڳولي سگهون ٿا جيڪي هن اڳ ۾ ئي خريد ڪيا آهن، خاص ڪري جيئن ته اسان اڳ ۾ ئي ڄاڻون ٿا ته اهو ڪيئن ڪم ڪري ٿو. گذريل 2 هفتن دوران صارف جي ٽرانزيڪشن تي ھن طريقي کي لاڳو ڪندي، اسان ھيٺ ڏنل ميٽرڪ حاصل ڪندا آھيون:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

اهو آهي k - ساڳئي پروڊڪٽس جو تعداد جيڪي هر پراڊڪٽ لاءِ حاصل ڪيا ويا آهن خريد ڪندڙ طرفان گذريل 14 ڏينهن ۾.
اهو طريقو خاص طور تي اسان جي ڪلائنٽ لاءِ سٺو ڪم ڪيو، جنهن لاءِ اهو ضروري هو ته ڪنهن به شيءِ جي سفارش نه ڪئي وڃي جيڪا اڳ ۾ ئي صارف جي خريداري جي تاريخ ۾ هئي.

دير سان خريداري جي مدت

جيئن ته اسان اڳ ۾ ئي معلوم ڪيو آهي، خريداري سامان جي اعلي تعدد جي ڪري، پهريون طريقو اسان جي مخصوص ضرورتن لاء سٺو ڪم ڪري ٿو. پر سامان جي باري ۾ ڇا آهي جهڙوڪ واشنگ پائوڊر / شيمپو / وغيره. اهو آهي، پروڊڪٽس سان جيڪي ممڪن نه هوندا آهن هر هفتي يا ٻه گهربل آهن ۽ اهي پوئين طريقا ڪڍي نٿا سگهن. اهو هيٺ ڏنل خيال ڏانهن وٺي ٿو - اهو تجويز ڪيو ويو آهي ته هر پراڊڪٽ جي خريداري جي مدت کي ڳڻڻ لاءِ سراسري طور تي انهن گراهڪن لاءِ جن وڌيڪ پراڊڪٽ خريد ڪيو k هڪ دفعو. ۽ پوءِ ڪڍيو جيڪو خريد ڪندڙ گهڻو ڪري اڳي ئي ختم ٿي چڪو آهي. سامان لاءِ حساب ڪيل مدو توهان جي اکين سان چڪاس ڪري سگھجي ٿو مناسبيت لاءِ:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

۽ پوءِ اسان ڏسنداسين ته ڇا پراڊڪٽ جي مدت جو خاتمو وقت جي وقفي ۾ اچي ٿو جڏهن سفارشون پيداوار ۾ هونديون ۽ نمونو ڇا ٿيندو. طريقو هن طرح بيان ڪري سگهجي ٿو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

هتي اسان وٽ 2 مکيه ڪيس آهن جن کي سمجهي سگهجي ٿو:

  1. ڇا اهو ضروري آهي ته انهن گراهڪن کان پروڊڪٽس جو نمونو ڪجي جن خريد ڪيو آهي K وقت کان گهٽ پراڊڪٽ.
  2. ڇا اهو ضروري آهي ته هڪ پراڊڪٽ جو نمونو هجي جيڪڏهن ان جي مدت جي پڄاڻي ٽارگيٽ وقفي جي شروعات کان اڳ ٿئي ٿي.

هيٺ ڏنل گراف ڏيکاري ٿو ته هي طريقو مختلف هائپرپراميٽرن سان ڪهڙو نتيجو حاصل ڪري ٿو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
ft - صرف اهي گراهڪ وٺو جن پراڊڪٽ خريد ڪيو آهي گهٽ ۾ گهٽ K (هتي K = 5) ڀيرا
tm - صرف اميدوارن کي وٺو جيڪي ھدف جي وقفي ۾ اچن ٿا

اها تعجب جي ڳالهه ناهي ته هو قابل آهي (0، 0) وڏي ۾ وڏو ياد رکو ۽ سڀ کان ننڍو صحت, ڇاڪاڻ ته هن شرط تحت سڀ کان وڌيڪ اميدوارن کي ٻيهر حاصل ڪيو ويو آهي. بهرحال، بهترين نتيجا حاصل ٿيندا آهن جڏهن اسان انهن گراهڪن لاءِ پروڊڪٽس جو نمونو نه ٿا ڏيون جن هڪ خاص پراڊڪٽ کان گهٽ خريد ڪيو آهي k وقت ۽ ڪڍڻ، سامان سميت، مدت جي پڇاڙي جنهن جي حدف وقفي کان اڳ ٿئي ٿي.

درجي جي لحاظ کان مشهور

هڪ ٻيو واضح خيال آهي نمونو مشهور پروڊڪٽس کي مختلف قسمن يا برانڊن ۾. هتي اسان هر خريد ڪندڙ لاء حساب ڪريون ٿا مٿي-ڪ ”پسنديده“ زمرا/برانڊون ۽ ڪڍيو ”مقبول“ هن درجي/برانڊ مان. اسان جي صورت ۾، اسان "پسنديده" ۽ "مقبول" جو تعين ڪنداسين پراڊڪٽ جي خريداري جي تعداد طرفان. هن طريقي جو هڪ اضافي فائدو اهو آهي ته ان جي قابل اطلاق ٿڌي شروعاتي صورت ۾. اهو آهي، انهن گراهڪن لاءِ جن يا ته تمام گهٽ خريداريون ڪيون آهن، يا گهڻي وقت کان دڪان تي نه ويا آهن، يا صرف هڪ وفاداري ڪارڊ جاري ڪيو آهي. انھن لاءِ، اھو آسان ۽ بھتر آھي اسٽاڪ شيون جيڪي گراهڪن سان مشهور آھن ۽ ھڪڙي تاريخ آھي. نتيجن جي ماپ آهن:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
هتي لفظ ”ڪئٽيگوري“ کان پوءِ آيل انگ جو مطلب آهي ڪيٽيگريءَ جي nesting جي سطح.

مجموعي طور تي، اهو پڻ حيرت انگيز ناهي ته تنگ درجا بهتر نتيجا حاصل ڪن ٿا، ڇاڪاڻ ته اهي خريد ڪندڙن لاء وڌيڪ صحيح "پسنديده" پراڊڪٽ ڪڍندا آهن.

هفتي کان هفتي تائين مختلف سامان جي متبادل خريداري

هڪ دلچسپ طريقو جيڪو مون سفارش ڪندڙ سسٽم بابت مضمونن ۾ نه ڏٺو آهي اهو هڪ بلڪل سادو آهي ۽ ساڳئي وقت مارڪوف زنجيرن جو شمارياتي طريقو ڪم ڪري ٿو. هتي اسان 2 مختلف هفتا وٺون ٿا، پوءِ هر گراهڪ لاءِ اسان پروڊڪٽس جا جوڙا ٺاهيندا آهيون [هفتي ۾ خريد ڪيو ويو] - [هفتي ۾ خريد ڪيو j]، جتي j > i, ۽ ھتان کان اسين حساب ڪندا آھيون ھر پراڊڪٽ لاءِ ايندڙ ھفتي ٻي پراڊڪٽ ڏانھن مٽجڻ جو امڪان. اهو آهي، سامان جي هر هڪ جوڙي لاء پيداوار- پيداوار اسان انهن جي تعداد کي مليل جوڑوں ۾ شمار ڪريون ٿا ۽ انهن جوڙن جي تعداد سان ورهايون ٿا، جتي مصنوعات پهرين هفتي ۾ هو. اميدوارن کي ڪڍڻ لاء، اسان خريد ڪندڙ جي آخري رسيد ۽ ڪڍو ٿا مٿي-ڪ سڀ کان وڌيڪ امڪان ايندڙ پراڊڪٽس جيڪي اسان کي حاصل ڪيل ٽرانسشن ميٽرڪس مان. هڪ منتقلي ميٽرڪس جي تعمير جو عمل هن طرح نظر اچي ٿو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

حقيقي مثالن مان منتقلي جي امڪاني ميٽرڪس ۾ اسان هيٺ ڏنل دلچسپ رجحان ڏسون ٿا:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
هتي توهان دلچسپ انحصار کي نوٽيس ڪري سگهو ٿا جيڪي صارف جي رويي ۾ ظاهر ڪيا ويا آهن: مثال طور، ليمن ميون يا کير جو هڪ برانڊ جنهن مان اهي ٻئي ڏانهن تبديل ٿيڻ جو امڪان آهي. اهو پڻ حيرت انگيز ناهي ته پروڊڪٽس جي اعلي تعدد سان بار بار خريداري، جهڙوڪ مکڻ، پڻ هتي ختم ٿي ويندا آهن.

مارڪوف زنجيرن سان طريقي ۾ ميٽرڪ هن ريت آهن:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
k - پراڊڪٽس جو تعداد جيڪو خريد ڪندڙ جي آخري ٽرانزيڪشن مان هر خريد ڪيل پراڊڪٽ لاءِ حاصل ڪيو ويو آهي.
جيئن اسان ڏسي سگهون ٿا، بهترين نتيجو ڏيکاريو ويو آهي ترتيب سان ترتيب سان k = 4. هفتي 4 ۾ اسپيڪ موڪلن جي چوڌاري موسمي رويي جي وضاحت ڪري سگهجي ٿي. 

خريد ڪندڙن لاءِ ساڳيا پراڊڪٽس، مختلف ماڊلز پاران ٺهيل خاصيتن جي مطابق

ھاڻي اسان سڀ کان وڌيڪ مشڪل ۽ دلچسپ حصي تي آيا آھيون - ويجھي پاڙيسرين جي ڳولا ڪريو گراهڪن جي ویکٹر جي بنياد تي ۽ مختلف ماڊلز جي مطابق ٺاھيل مصنوعات. اسان جي ڪم ۾ اسان 3 اهڙي نموني استعمال ڪندا آهيون:

  • ALS
  • Word2Vec (Item2Vec اهڙن ڪمن لاءِ)
  • ڊي ايس ايم

اسان اڳ ۾ ئي ALS سان معاملو ڪيو آهي، توهان پڙهي سگهو ٿا ته اهو ڪيئن سکندو آهي هتي. Word2Vec جي صورت ۾، اسان استعمال ڪريون ٿا معروف عمل درآمد جي ماڊل مان جينسيم. نصوص سان قياس ڪندي، اسان آڇ کي وضاحت ڪريون ٿا خريداري جي رسيد جي طور تي. اهڙيءَ طرح، جڏهن هڪ پراڊڪٽ ویکٹر ٺاهيندي، ماڊل پراڊڪٽ لاءِ اڳڪٿي ڪرڻ سکي ٿو رسيد ۾ ان جي ”مقابلي“ (رسيد ۾ باقي پروڊڪٽس). اي ڪامرس ڊيٽا ۾، اهو بهتر آهي ته خريد ڪندڙ جي سيشن کي استعمال ڪرڻ بدران هڪ رسيد؛ ماڻهو کان اوزون. ۽ DSSM پارس ڪرڻ لاء وڌيڪ دلچسپ آهي. شروعات ۾، اهو لکيو ويو هو Microsoft جي ماڻهن پاران ڳولا لاء ماڊل طور، توهان پڙهي سگهو ٿا اصل تحقيقي مقالو هتي. ماڊل جي فن تعمير هن طرح ڏسڻ ۾ اچي ٿو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

اهو آهي Q - سوال، صارف جي ڳولا جو سوال، ڊي[i] - دستاويز، انٽرنيٽ صفحو. ماڊل جي ان پٽ ۾ ترتيب ڏنل درخواست ۽ صفحا جون خاصيتون آهن. هر ان پٽ پرت کان پوءِ مڪمل طور تي ڳنڍيل تہن جو تعداد آھي (ملٽي ليئر پرسيپٽرون). اڳيون، ماڊل ماڊل جي آخري تہن ۾ حاصل ڪيل ویکٹرز جي وچ ۾ ڪوسائن کي گھٽائڻ سکي ٿو.
سفارش جا ڪم بلڪل ساڳيا فن تعمير کي استعمال ڪن ٿا، رڳو ھڪڙي درخواست جي بدران ھڪڙو صارف آھي، ۽ صفحن جي بدران مصنوعات آھن. ۽ اسان جي صورت ۾، هن فن تعمير کي هيٺين ۾ تبديل ڪيو ويو آهي:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

ھاڻي، نتيجن کي جانچڻ لاءِ، اھو رھجي ٿو آخري نقطي کي ڍڪڻ لاءِ - جيڪڏھن ALS ۽ DSSM جي صورت ۾ اسان واضح طور تي استعمال ڪندڙ ویکٹر جي وضاحت ڪئي آھي، ته پوءِ Word2Vec جي صورت ۾ اسان وٽ صرف پراڊڪٽ ویکٹر آھن. هتي، يوزر ویکٹر ٺاهڻ لاءِ، اسان 3 مکيه طريقا بيان ڪيا آهن:

  1. بس ویکٹر شامل ڪريو، پوءِ ڪوسائن جي فاصلي لاءِ اهو ظاهر ٿئي ٿو ته اسان صرف خريداري جي تاريخ ۾ پروڊڪٽس جو اوسط ڪيو.
  2. ويڪر جو مجموعو ڪجهه وقت جي وزن سان.
  3. TF-IDF کوٽائي سان وزني سامان.

خريدار ویکٹر جي لڪير وزن جي صورت ۾، اسان هن مفروضي کان اڳتي وڌون ٿا ته صارف جيڪو پراڊڪٽ ڪالهه خريد ڪيو ان جي رويي تي ان پيداوار کان وڌيڪ اثر آهي جيڪو هن ڇهه مهينا اڳ خريد ڪيو هو. تنهن ڪري اسان غور ڪريون ٿا خريدار جي پوئين هفتي کي 1 جي اختلافن سان، ۽ اڳتي ڇا ٿيو ½، ⅓، وغيره.
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

TF-IDF coefficients لاءِ، اسان بلڪل ائين ئي ڪندا آهيون جيئن TF-IDF ۾ نصوص لاءِ، رڳو اسان خريد ڪندڙ کي هڪ دستاويز سمجهون ٿا، ۽ چيڪ کي آفر طور، ترتيب سان، لفظ هڪ پيداوار آهي. هن طريقي سان، صارف جو ویکٹر نادر سامان ڏانهن وڌيڪ منتقل ڪندو، جڏهن ته خريد ڪندڙ لاء بار بار ۽ واقف سامان ان کي گهڻو تبديل نه ڪندو. طريقو هن طرح بيان ڪري سگهجي ٿو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

هاڻي اچو ته ميٽرڪ تي نظر وجهون. هي اهو آهي جيڪو ALS جا نتيجا نظر اچن ٿا:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
خريدار ویکٹر جي تعمير جي مختلف تبديلين سان Item2Vec لاءِ ميٽرڪس:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
انهي حالت ۾، بلڪل ساڳيو نموني استعمال ڪيو ويندو آهي جيئن اسان جي بنيادي طور تي. فرق صرف اھو آھي ته ڪھڙو ڪ استعمال ڪنداسين. صرف تعاون ڪندڙ ماڊل استعمال ڪرڻ لاءِ، توھان کي وٺڻو پوندو 50-70 ويجھي پروڊڪٽس ھر ڪسٽمر لاءِ.

۽ ڊي ايس ايس ايم جي مطابق ميٽرڪ:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

سڀني طريقن کي ڪيئن گڏ ڪرڻ؟

چڱو، توهان چئو ٿا، پر اميدوارن کي ڪڍڻ واري اوزار جي اهڙي وڏي سيٽ سان ڇا ڪجي؟ توهان جي ڊيٽا لاء بهترين ترتيب ڪيئن چونڊيو؟ هتي اسان وٽ ڪيترائي مسئلا آهن:

  1. اهو ضروري آهي ته ڪنهن به طريقي سان هر طريقي ۾ هائپرپراميٽرز لاء ڳولا جي جڳهه کي محدود ڪرڻ. اهو، يقينا، هر جڳهه ڌار ڌار آهي، پر ممڪن نقطي جو تعداد تمام وڏو آهي.
  2. مخصوص هائپرپراميٽرز سان مخصوص طريقن جو هڪ ننڍڙو محدود نمونو استعمال ڪندي، توهان پنهنجي ميٽرڪ لاءِ بهترين ترتيب ڪيئن چونڊي سگهو ٿا؟

اسان کي اڃان تائين پھرين سوال جو صحيح جواب نه مليو آھي، تنھنڪري اسان ھيٺ ڏنل طريقي سان اڳتي وڌون ٿا: ھر طريقي لاءِ، ھڪ ھائيپرپيراميٽر سرچ اسپيس محدود ڪندڙ لکيو ويو آھي، جيڪو اسان وٽ موجود ڊيٽا تي ڪجھ انگن اکرن تي منحصر آھي. اهڙيء طرح، ماڻهن کان خريداري جي وچ ۾ اوسط مدت کي ڄاڻڻ، اسان اندازو لڳائي سگهون ٿا ته ڪهڙي عرصي سان استعمال ڪيو وڃي "جيڪو اڳ ۾ ئي خريد ڪيو ويو آهي" ۽ "ڊگهي ماضي جي خريداري جي مدت" جو طريقو.

۽ بعد ۾ اسان مختلف طريقن جي مختلف تبديلين جي هڪ خاص تعداد مان گذري چڪا آهيون، اسان هيٺيون ياد رکون ٿا: هر عمل درآمد اميدوارن جي هڪ خاص تعداد کي ڪڍي ٿو ۽ اسان جي لاء اهم ميٽرڪ جي هڪ خاص قدر آهي (ياد ڪرڻ). اسان اميدوارن جو مجموعي تعداد حاصل ڪرڻ چاهيون ٿا، اسان جي قابل اجازت ڪمپيوٽنگ پاور تي منحصر ڪري، سڀ کان وڌيڪ ممڪن ميٽرڪ سان. هتي مسئلو خوبصورتي سان پٺتي پيل مسئلي ۾ اچي ٿو.
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

هتي اميدوارن جو تعداد انگ جو وزن آهي، ۽ ياد ڪرڻ جو طريقو ان جي قيمت آهي. تنهن هوندي، اتي 2 وڌيڪ نقطا آهن جن کي غور ڪرڻ گهرجي جڏهن الگورتھم کي لاڳو ڪرڻ:

  • طريقا شايد انهن اميدوارن ۾ اوورليپ هوندا جيڪي اهي حاصل ڪندا آهن.
  • ڪجهه حالتن ۾، اهو صحيح ٿيندو ته هڪ طريقو ٻه ڀيرا مختلف پيٽرولن سان وٺي، ۽ پهرين کان اميدوار جي پيداوار سيڪنڊ جو ذيلي سيٽ نه هوندو.

مثال طور، جيڪڏهن اسان "جيڪو مون اڳ ۾ ئي خريد ڪيو آهي" جي طريقيڪار کي ٻيهر حاصل ڪرڻ لاءِ مختلف وقفن سان عمل ۾ آڻيون، ته پوءِ انهن جي اميدوارن جا سيٽ هڪ ٻئي جي اندر اندر رکيا ويندا. ساڳئي وقت، ٻاهر نڪرڻ تي "دوري خريداري" ۾ مختلف پيٽرولر مڪمل چونڪ مهيا نٿا ڪن. تنهن ڪري، اسان نمونن جي طريقن کي مختلف پيرا ميٽرن سان بلاڪن ۾ ورهائيندا آهيون جيئن ته هر بلاڪ مان اسان چاهيون ٿا وڌ ۾ وڌ هڪ ڪڍڻ واري طريقي سان مخصوص هائپرپراميٽرز سان. هن کي ڪرڻ لاءِ، توهان کي ضرورت آهي ٿوري هوشياريءَ سان عمل ڪرڻ ۾ نفيس جو مسئلو، پر علامتون ۽ نتيجا تبديل نه ٿيندا.

هي سمارٽ ميلاپ اسان کي اجازت ڏئي ٿو ته هيٺ ڏنل ميٽرڪس حاصل ڪرڻ جي مقابلي ۾ صرف تعاون واري ماڊل سان:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
فائنل ميٽرڪ ۾ اسان هيٺ ڏنل تصوير ڏسون ٿا:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

تنهن هوندي، هتي توهان نوٽيس ڪري سگهو ٿا ته سفارشن لاء هڪ اڻ کليل نقطو آهي جيڪي ڪاروبار لاء ڪارائتو آهن. هاڻي اسان صرف اهو سکيو آهي ته هڪ بهترين ڪم ڪيئن ڪجي اڳڪٿي ڪرڻ جو صارف ڇا خريد ڪندو، مثال طور، ايندڙ هفتي. پر صرف ڪنهن شيءِ تي رعايت ڏيڻ جيڪا هو اڳ ۾ ئي خريد ڪندو اهو تمام سٺو ناهي. پر اميد کي وڌائڻ لاءِ اهو ٿڌو آهي، مثال طور، هيٺين ميٽرڪس مان:

  1. مارجن / ٽرن اوور ذاتي سفارشن جي بنياد تي.
  2. سراسري ڪسٽمر چيڪ.
  3. زيارتن جي تعدد.

تنهن ڪري اسان حاصل ڪيل امڪانن کي مختلف ڳڻپيوڪر سان ضرب ڪريون ٿا ۽ انهن کي ٻيهر ترتيب ڏيون ٿا ته جيئن اهي پراڊڪٽس جيڪي مٿين ميٽرڪس کي متاثر ڪن ٿا مٿين تائين پهچي وڃن. ڪو به تيار ٿيل حل ناهي جنهن لاءِ استعمال ڪرڻ بهتر آهي. اسان کي به اهڙي coefficients سان سڌو سنئون پيداوار ۾ تجربو. پر هتي دلچسپ ٽيڪنالاجيون آهن جيڪي اڪثر ڪري اسان کي بهترين نتيجا ڏين ٿيون:

  1. پيداوار جي قيمت / مارجن سان ضرب ڪريو.
  2. سراسري رسيد سان ضرب ڪريو جنهن ۾ پيداوار ظاهر ٿئي ٿي. پوءِ سامان به مٿي اچي ويندو، جنهن سان هو عام طور تي ٻيو ڪجهه وٺندا آهن.
  3. هن پراڊڪٽ جي خريد ڪندڙن جي دوري جي سراسري تعدد سان ضرب ڪريو، هن مفروضي جي بنياد تي ته هي پراڊڪٽ ماڻهن کي ان لاءِ گهڻو موٽڻ لاءِ اڀاري ٿو.

coefficients سان تجربا ڪرڻ کان پوء، اسان پيداوار ۾ هيٺين ميٽرڪ حاصل ڪيو:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي
اهو آهي مجموعي مصنوعات جي تبديلي - سڀني شين مان خريد ڪيل شين جو حصو انهن سفارشن ۾ جيڪي اسان ٺاهيا آهن.

ڌيان ڏيڻ وارو پڙهندڙ آف لائن ۽ آن لائن ميٽرڪ جي وچ ۾ هڪ اهم فرق محسوس ڪندو. اهو رويو انهي حقيقت جي وضاحت ڪري ٿو ته مصنوعات لاءِ سڀئي متحرڪ فلٽر نه آهن جيڪي سفارش ڪري سگھجن ٿيون جڏهن ماڊل ٽريننگ ڪرڻ وقت حساب ۾ ورتو وڃي. اسان لاءِ، اها هڪ عام ڪهاڻي آهي جڏهن اڌ حاصل ڪيل اميدوارن کي فلٽر ڪري سگهجي ٿو؛ اها خاصيت اسان جي صنعت ۾ عام آهي.

آمدني جي لحاظ کان، هيٺين ڪهاڻي حاصل ڪئي وئي آهي، اهو واضح آهي ته سفارشون شروع ٿيڻ کان پوء، ٽيسٽ گروپ جي آمدني تيزي سان وڌي رهي آهي، هاڻي اسان جي سفارشن سان آمدني ۾ اوسط اضافو 3-4٪ آهي:
اسان ڪيئن ڊرامائي طور تي آف لائن پرچون ۾ سفارشن جي معيار کي بهتر ڪيو آهي

آخر ۾، مان اهو چوڻ چاهيان ٿو ته جيڪڏهن توهان کي غير حقيقي سفارشن جي ضرورت آهي، ته پوء معيار ۾ هڪ تمام وڏو واڌارو حاصل ڪري سگهجي ٿو تجربن ۾ اميدوارن کي ڪڍڻ سان سفارشون. انهن جي نسل لاء وقت جو هڪ وڏو مقدار اهو ممڪن بڻائي ٿو ڪيترن ئي سٺي طريقن کي گڏ ڪرڻ، جيڪو مجموعي طور تي ڪاروبار لاء بهترين نتيجا ڏيندو.

مان هر ڪنهن سان تبصرن ۾ چيٽ ڪرڻ ۾ خوش ٿيندس جيڪو مواد دلچسپ ڳولي ٿو. توهان مون کان ذاتي طور تي سوال پڇي سگهو ٿا ٽيليگرام. مان پڻ AI / startups بابت پنهنجا خيال حصيداري ڪريان ٿو منهنجي ٽيليگرام چينل - ڀلي ڪري آيا :)

جو ذريعو: www.habr.com

تبصرو شامل ڪريو