Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Сайн уу! Намайг Саша гэдэг, би LoyaltyLab-ийн CTO, хамтран үүсгэн байгуулагч. Хоёр жилийн өмнө найзууд бид хоёр бүх ядуу оюутнуудын адил орой гэрийнхээ ойролцоох дэлгүүрээс шар айраг авахаар явсан. Жижиглэнгийн худалдаачин биднийг шар айраг авахаар ирэхийг мэдээд чипс, жигнэмэг дээр хөнгөлөлт үзүүлээгүйд бид маш их бухимдсан, гэхдээ энэ нь үнэхээр логик юм! Бид яагаад ийм нөхцөл байдал үүссэнийг ойлгоогүй бөгөөд өөрийн компанийг байгуулахаар шийдсэн. Урамшууллын хувьд Баасан гараг бүр ижил чипс дээрээ хямдрал хийгээрэй.

Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Энэ бүхэн нь би бүтээгдэхүүний техникийн талын материалыг танилцуулах хэмжээнд хүрсэн NVIDIA GTC. Бид хийсэн ажлаа олон нийттэй хуваалцахдаа баяртай байгаа тул тайлангаа нийтлэл хэлбэрээр нийтэлж байна.

Танилцуулга

Аяллын эхэнд бусад хүмүүсийн нэгэн адил бид зөвлөмж өгөх системийг хэрхэн бүтээдэг талаар тоймлон үзсэн. Хамгийн алдартай архитектур нь дараахь төрөл байв.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Энэ нь хоёр хэсгээс бүрдэнэ:

  1. Энгийн бөгөөд хурдан, ихэвчлэн хамтын загвар ашиглан зөвлөмж өгөх нэр дэвшигчдийг түүвэрлэх.
  2. Өгөгдөл дэх боломжит бүх боломжуудыг харгалзан илүү төвөгтэй, удаан агуулгын загвар бүхий нэр дэвшигчдийн зэрэглэл.

Цаашид би дараах нэр томъёог ашиглах болно.

  • зөвлөмж авах нэр дэвшигч/нэр дэвшигч - Үйлдвэрлэлийн зөвлөмжид оруулах боломжтой хэрэглэгч-бүтээгдэхүүний хос.
  • нэр дэвшигчид олборлох/олборлогч/нэр дэвшигчийг олборлох арга - боломжтой өгөгдлөөс "зөвлөмжийн нэр дэвшигчдийг" гаргаж авах үйл явц эсвэл арга.

Эхний алхам нь ихэвчлэн хамтарсан шүүлтүүрийн янз бүрийн хувилбаруудыг ашиглах явдал юм. Хамгийн алдартай - ALS. Зөвлөмжийн системийн талаархи ихэнх нийтлэлүүд эхний шатанд хамтарсан загваруудын янз бүрийн сайжруулалтыг илчилсэн нь гайхмаар зүйл боловч бусад түүвэрлэлтийн аргуудын талаар хэн ч ярьдаггүй. Бидний хувьд зөвхөн хамтарсан загвар, янз бүрийн оновчлолыг ашиглах хандлага нь бидний хүлээж байсан чанарт нийцэхгүй байсан тул бид энэ хэсэгт тусгайлан судалгаа хийсэн. Өгүүллийн төгсгөлд би бидний суурь болсон ALS-ийг хэр зэрэг сайжруулж чадсаныг харуулах болно.

Бидний арга барилыг тайлбарлахаасаа өмнө 30 минутын өмнө гарсан өгөгдлийг харгалзан үзэх нь чухал үед бодит цагийн зөвлөмжид шаардлагатай хугацаанд ажиллах боломжтой олон арга байдаггүй гэдгийг анхаарах нь чухал юм. Гэхдээ манай тохиолдолд бид зөвлөмжийг өдөрт нэгээс илүүгүй удаа, ихэнх тохиолдолд долоо хоногт нэг удаа цуглуулдаг бөгөөд энэ нь нарийн төвөгтэй загваруудыг ашиглах, чанарыг хэд хэдэн удаа сайжруулах боломжийг бидэнд олгодог.

Нэр дэвшигчдийг тодруулах ажилд зөвхөн ALS ямар хэмжигдэхүүнийг харуулж байгааг үндэс болгон авч үзье. Бидний хянадаг гол хэмжүүрүүд нь:

  • Нарийвчлал - түүвэрлэсэн хүмүүсээс зөв сонгогдсон нэр дэвшигчдийн эзлэх хувь.
  • Эргэн сануулах гэдэг нь зорилтот интервалд байсан нэр дэвшигчдээс гарсан нэр дэвшигчдийн эзлэх хувь юм.
  • F1 оноо - F-хэмжийг өмнөх хоёр цэг дээр тооцсон.

Мөн бид нэмэлт агуулгын функцээр градиентийг нэмэгдүүлэх сургалтанд хамрагдсаны дараа эцсийн загварын хэмжүүрүүдийг авч үзэх болно. Энд бас 3 үндсэн хэмжүүр байдаг:

  • precision@5 - худалдан авагч бүрийн магадлалын хувьд эхний 5-д багтсан бүтээгдэхүүний дундаж хувь.
  • хариултын хувь @ 5 - үйлчлүүлэгчдийг дэлгүүрт зочлохдоо дор хаяж нэг хувийн санал (нэг саналд 5 бүтээгдэхүүн) худалдан авах болгон хувиргах.
  • Хэрэглэгчид ногдох avg roc-auc - дундаж roc-auc худалдан авагч бүрийн хувьд.

Эдгээр бүх хэмжүүрүүд дээр хэмжигддэг гэдгийг анхаарах нь чухал юм цаг хугацааны цуврал хөндлөн баталгаажуулалт, өөрөөр хэлбэл сургалт эхний k долоо хоногт явагддаг бөгөөд k+1 долоо хоногийг тестийн өгөгдөл болгон авдаг. Тиймээс улирлын чанартай өсөлт, бууралт нь загваруудын чанарыг тайлбарлахад хамгийн бага нөлөө үзүүлсэн. Цаашид бүх график дээр абсцисса тэнхлэг нь хөндлөн баталгаажуулалтын долоо хоногийн тоог, ордны тэнхлэг нь заасан хэмжүүрийн утгыг заана. Бүх графикууд нь нэг үйлчлүүлэгчийн гүйлгээний өгөгдөл дээр үндэслэсэн тул бие биентэйгээ харьцуулах нь зөв болно.

Бид өөрсдийн арга барилаа тайлбарлахаасаа өмнө ALS-д сургагдсан загвар болох суурь үзүүлэлтийг харна.
Нэр дэвшигчийг олж авах хэмжүүр:
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Эцсийн хэмжүүр:
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Би алгоритмын бүх хэрэгжилтийг бизнесийн таамаглал гэж үздэг. Тиймээс, барагцаагаар аливаа хамтын ажиллагааны загварыг "хүмүүс өөртэйгөө ижил төстэй хүмүүсийн худалдаж авсан зүйлийг худалдаж авах хандлагатай байдаг" гэсэн таамаглал гэж үзэж болно. Би аль хэдийн хэлсэнчлэн, бид ийм семантикаар өөрсдийгөө хязгаарлаагүй бөгөөд офлайн худалдааны өгөгдөл дээр сайн ажилладаг зарим таамаглалууд энд байна:

  1. Үүнийг би аль хэдийн худалдаж авсан.
  2. Өмнө нь худалдаж авсан зүйлтэй төстэй.
  3. Урт хугацааны худалдан авалтын хугацаа.
  4. Ангилал/брэндээр алдартай.
  5. Долоо хоног бүр өөр өөр бараа худалдаж авах (Марковын сүлжээ).
  6. Янз бүрийн загваруудаар (Word2Vec, DSSM гэх мэт) бүтээсэн шинж чанарын дагуу худалдан авагчдад ижил төстэй бүтээгдэхүүнүүд.

Та өмнө нь юу худалдаж авсан бэ?

Хүнсний жижиглэнгийн худалдаанд маш сайн ажилладаг хамгийн тод эвристик. Энд бид үнэнч карт эзэмшигчийн сүүлийн К өдөр (ихэвчлэн 1-3 долоо хоног) эсвэл жилийн өмнө K өдрийн дотор худалдаж авсан бүх барааг авдаг. Зөвхөн энэ аргыг хэрэглэснээр бид дараах хэмжүүрүүдийг олж авна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Эндээс харахад бид хугацааг уртасгах тусам санах ой улам ихсэж, нарийвчлал багасч, эсрэгээрээ байх нь тодорхой байна. Дунджаар "сүүлийн 2 долоо хоног" нь үйлчлүүлэгчдэд илүү сайн үр дүнг өгдөг.

Өмнө нь худалдаж авсан зүйлтэй төстэй

Хүнсний жижиглэнгийн худалдааны хувьд "миний өмнө нь худалдаж авсан зүйл" нь сайн ажилладаг нь гайхах зүйл биш юм, гэхдээ зөвхөн хэрэглэгчийн худалдаж авсан зүйлээс нэр дэвшигчдийг гаргаж авах нь тийм ч таатай биш юм, учир нь энэ нь худалдан авагчийг ямар нэгэн шинэ бүтээгдэхүүнээр гайхшруулах магадлал багатай юм. Тиймээс бид ижил хамтарсан загваруудыг ашиглан энэхүү эвристикийг бага зэрэг сайжруулахыг санал болгож байна. ALS-ийн сургалтын үеэр хүлээн авсан векторуудаас бид хэрэглэгчийн аль хэдийн худалдаж авсан бүтээгдэхүүнтэй ижил төстэй бүтээгдэхүүнийг авах боломжтой. Энэ санаа нь видео контентыг үзэх үйлчилгээнүүдийн "ижил төстэй видео"-той маш төстэй боловч тухайн хэрэглэгч тухайн мөчид юу идэж/худалдан авч байгааг мэдэхгүй байгаа тул бид зөвхөн түүний худалдаж авсан зүйлтэй ижил төстэй бичлэгүүдийг хайж олох боломжтой. Учир нь бид энэ нь хэр сайн ажилладагийг аль хэдийн мэддэг болсон. Сүүлийн 2 долоо хоногийн хэрэглэгчийн гүйлгээнд энэ аргыг хэрэглэснээр бид дараах хэмжүүрүүдийг олж авна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

энд k - сүүлийн 14 хоногийн хугацаанд худалдан авагчийн худалдан авсан бүтээгдэхүүн тус бүрээр олж авсан ижил төстэй бүтээгдэхүүний тоо.
Энэ арга нь ялангуяа хэрэглэгчийн худалдан авалтын түүхэнд байсан зүйлийг санал болгохгүй байх нь чухал байсан манай үйлчлүүлэгчийн хувьд маш сайн ажилласан.

Худалдан авах хугацаа хожуу

Бид аль хэдийн олж мэдсэнээр бараа худалдан авах давтамж өндөр байдаг тул эхний арга нь бидний тодорхой хэрэгцээнд сайнаар нөлөөлдөг. Харин угаалгын нунтаг/шампунь/ гэх мэт барааг яах вэ. Өөрөөр хэлбэл, долоо хоногт эсвэл хоёр удаа шаардлагагүй, өмнөх аргуудыг гаргаж авах боломжгүй бүтээгдэхүүнтэй. Энэ нь дараахь санааг бий болгодог - бүтээгдэхүүнийг илүү их худалдан авсан үйлчлүүлэгчдийн хувьд бүтээгдэхүүн бүрийн худалдан авах хугацааг дунджаар тооцохыг санал болгож байна. k нэг удаа. Дараа нь худалдан авагч аль хэдийн дууссан байх магадлалтай зүйлийг гаргаж аваарай. Барааны тооцоолсон хугацааг таны нүдээр хангалттай эсэхийг шалгаж болно.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Дараа нь бид бүтээгдэхүүний эцсийн хугацаа нь зөвлөмж үйлдвэрлэлд байх хугацааны интервалд багтаж байгаа эсэхийг судалж, юу тохиолдохыг түүвэрлэх болно. Арга барилыг дараах байдлаар дүрсэлж болно.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Энд бид авч үзэх боломжтой 2 үндсэн тохиолдол байна:

  1. Бүтээгдэхүүнээ K дахин бага худалдан авсан үйлчлүүлэгчдээс дээж авах шаардлагатай юу?
  2. Бүтээгдэхүүний хугацаа дуусах хугацаа нь зорилтот интервал эхлэхээс өмнө байвал дээж авах шаардлагатай юу?

Энэ арга нь өөр өөр гиперпараметрээр ямар үр дүнд хүрч байгааг дараах графикаас харж болно.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
ft — Бүтээгдэхүүнийг хамгийн багадаа K (энд K=5) удаа худалдаж авсан хэрэглэгчдийг л авна уу
tm - Зөвхөн зорилтот интервалд багтах нэр дэвшигчдийг авна уу

Тэр чадвартай байх нь гайхах зүйл биш юм (0, 0) хамгийн том санах ба хамгийн жижиг нарийвчлал, учир нь энэ нөхцөлд хамгийн олон нэр дэвшигчийг татаж авдаг. Гэсэн хэдий ч, бид тодорхой бүтээгдэхүүнээс бага худалдан авсан хэрэглэгчдэд бүтээгдэхүүнээс дээж авахгүй бол хамгийн сайн үр дүнд хүрдэг k удаа ба олборлолт, түүний дотор бараа, хугацааны төгсгөл нь зорилтот интервалаас өмнө унадаг.

Ангилалаараа алдартай

Өөр нэг тодорхой санаа бол янз бүрийн категори эсвэл брендийн алдартай бүтээгдэхүүнийг дээж авах явдал юм. Энд бид худалдан авагч тус бүрээр тооцдог top-k "дуртай" категори/брэндүүдийг сонгоод, энэ ангилал/брэндээс "алдартай"-г гаргаж авна уу. Манай тохиолдолд бид "дуртай" ба "алдартай" гэдгийг тухайн бүтээгдэхүүний худалдан авалтын тоогоор тодорхойлно. Энэ аргын нэмэлт давуу тал нь хүйтэн эхлэх тохиолдолд хэрэглэх боломжтой юм. Энэ нь маш цөөхөн худалдан авалт хийсэн, эсвэл дэлгүүрт удаан хугацаагаар ороогүй эсвэл үнэнч карт гаргасан үйлчлүүлэгчдэд зориулагдсан болно. Тэдний хувьд үйлчлүүлэгчдэд таалагдсан, түүхтэй зүйлсийг нөөцлөх нь илүү хялбар бөгөөд илүү дээр юм. Үр дүнгийн үзүүлэлтүүд нь:
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
Энд "категори" гэсэн үгийн ард байгаа тоо нь тухайн ангиллын үүрлэх түвшинг илэрхийлнэ.

Ерөнхийдөө нарийхан ангилал нь худалдан авагчдад илүү үнэн зөв "дуртай" бүтээгдэхүүнийг гаргаж авдаг тул илүү сайн үр дүнд хүрдэг нь гайхмаар зүйл биш юм.

Долоо хоногоос долоо хоногт өөр өөр бараа худалдан авах

Зөвлөмжийн системийн талаархи нийтлэлүүдээс олж хараагүй сонирхолтой арга бол Марковын гинжин хэлхээний нэлээд энгийн бөгөөд нэгэн зэрэг ажилладаг статистик арга юм. Энд бид 2 өөр долоо хоног зарцуулдаг бөгөөд дараа нь үйлчлүүлэгч бүрт хос бүтээгдэхүүн үйлдвэрлэдэг [i долоо хоногт худалдаж авсан]-[j долоо хоногт худалдаж авсан], энд j > i, мөн эндээс бид бүтээгдэхүүн тус бүрээр дараагийн долоо хоногт өөр бүтээгдэхүүн рүү шилжих магадлалыг тооцдог. Энэ нь хос бараа бүрийн хувьд бүтээгдэхүүн-бүтээгдэхүүнj Бид олсон хосуудын тоог тоолж, хосуудын тоонд хуваана, хаана бүтээгдэхүүн эхний долоо хоногт байсан. Нэр дэвшигчдийг гаргаж авахын тулд бид худалдан авагчийн сүүлчийн баримтыг авч, гаргаж авдаг top-k Бидний хүлээн авсан шилжилтийн матрицаас дараагийн бүтээгдэхүүнүүд. Шилжилтийн матрицыг бүтээх үйл явц дараах байдалтай байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Шилжилтийн магадлалын матрицын бодит жишээнүүдээс бид дараах сонирхолтой үзэгдлүүдийг харж байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
Эндээс та хэрэглэгчийн зан төлөвт илэрсэн сонирхолтой хамаарлыг анзаарч болно: жишээлбэл, цитрус жимс эсвэл өөр сүүнд шилжих магадлалтай брэнд сүүг хайрлагчид. Цөцгийн тос гэх мэт давтан худалдан авалт ихтэй бүтээгдэхүүн энд дуусдаг нь гайхмаар зүйл биш юм.

Марковын гинж бүхий аргын хэмжүүрүүд дараах байдалтай байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
k - худалдан авагчийн сүүлийн гүйлгээнээс худалдан авсан бүтээгдэхүүн тус бүрээс олж авсан бүтээгдэхүүний тоо.
Бидний харж байгаагаар хамгийн сайн үр дүнг k=4 гэсэн тохиргоогоор харуулав. 4 дэх долоо хоногт огцом өсөлтийг амралтын өдрүүдийн улирлын шинж чанартайгаар тайлбарлаж болно. 

Янз бүрийн загвараар бүтээгдсэн шинж чанаруудын дагуу худалдан авагчдад ижил төстэй бүтээгдэхүүнүүд

Одоо бид хамгийн хэцүү бөгөөд сонирхолтой хэсэгт ирлээ - янз бүрийн загваруудын дагуу бүтээгдсэн үйлчлүүлэгчдийн векторууд болон бүтээгдэхүүнүүд дээр үндэслэн хамгийн ойрын хөршүүдийг хайх. Бид ажилдаа ийм 3 загварыг ашигладаг.

  • ALS
  • Word2Vec (Ийм ажлуудад зориулсан Item2Vec)
  • DSSM

Бид аль хэдийн ALS-тай тулгарсан тул энэ нь хэрхэн сурдаг талаар уншиж болно энд. Word2Vec-ийн хувьд бид сайн мэддэг загварчлалыг ашигладаг gensim. Тексттэй адилтгахдаа бид саналыг худалдан авалтын баримт гэж тодорхойлдог. Тиймээс, бүтээгдэхүүний векторыг бүтээхдээ загвар нь баримт дээрх бүтээгдэхүүний "контекст" (баримт бичигт үлдсэн бүтээгдэхүүн) -ийг урьдчилан таамаглаж сурдаг. Цахим худалдааны өгөгдөлд төлбөрийн баримтын оронд худалдан авагчийн сессийг ашиглах нь дээр. Озон. Мөн DSSM нь задлан шинжлэхэд илүү сонирхолтой байдаг. Эхэндээ үүнийг Microsoft-ын залуус хайлтын загвар болгон бичсэн. Та судалгааны эх сурвалжийг эндээс уншиж болно. Загварын архитектур нь дараах байдалтай байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

энд Q - асуулга, хэрэглэгчийн хайлтын асуулга, D[i] - баримт бичиг, интернет хуудас. Загварын оролт нь хүсэлт болон хуудасны шинж чанарууд юм. Оролтын давхарга бүрийн дараа бүрэн холбогдсон хэд хэдэн давхаргууд байдаг (олон давхаргат перцептрон). Дараа нь загвар нь загварын сүүлийн давхаргад олж авсан векторуудын хоорондох косинусыг багасгаж сурдаг.
Зөвлөмжийн даалгавар нь яг ижил архитектурыг ашигладаг, зөвхөн хүсэлтийн оронд хэрэглэгч, хуудасны оронд бүтээгдэхүүн байдаг. Мөн манай тохиолдолд энэ архитектурыг дараахь байдлаар өөрчилсөн болно.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Одоо үр дүнг шалгахын тулд сүүлийн цэгийг авч үзэх хэрэгтэй - хэрэв ALS болон DSSM-ийн хувьд бид хэрэглэгчийн векторуудыг тодорхой тодорхойлсон бол Word2Vec-ийн хувьд бид зөвхөн бүтээгдэхүүний векторуудтай болно. Энд хэрэглэгчийн векторыг бий болгохын тулд бид 3 үндсэн хандлагыг тодорхойлсон.

  1. Зүгээр л векторуудыг нэмээд косинусын зайны хувьд бид худалдан авалтын түүхэн дэх бүтээгдэхүүнийг дунджаар тооцсон болно.
  2. Хэсэг хугацааны жинтэй вектор нийлбэр.
  3. TF-IDF коэффициент бүхий барааг жинлэх.

Худалдан авагчийн векторын шугаман жингийн хувьд хэрэглэгчийн өчигдөр худалдаж авсан бүтээгдэхүүн нь зургаан сарын өмнө худалдаж авсан бүтээгдэхүүнээс илүү түүний зан төлөвт илүү их нөлөөлсөн гэсэн таамаглалыг үндэслэнэ. Тиймээс бид худалдан авагчийн өмнөх долоо хоногийг 1-ийн харьцаатай, дараа нь юу болсныг ½, ⅓ гэх мэт магадлалаар авч үзье.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

TF-IDF коэффициентүүдийн хувьд бид текстийн хувьд TF-IDF-тэй яг ижил зүйлийг хийдэг, зөвхөн бид худалдан авагчийг баримт бичиг, чекийг санал гэж үздэг тул үг нь бүтээгдэхүүн юм. Ингэснээр хэрэглэгчийн вектор нь ховор бараа руу илүү шилжих бөгөөд худалдан авагчийн байнгын, танил бараа нь үүнийг нэг их өөрчлөхгүй. Арга барилыг дараах байдлаар дүрсэлж болно.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Одоо хэмжүүрүүдийг харцгаая. ALS-ийн үр дүн дараах байдалтай байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
Худалдан авагчийн векторыг бүтээх өөр өөр хувилбар бүхий Item2Vec-ийн хэмжүүрүүд:
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
Энэ тохиолдолд манай үндсэн загвартай яг ижил загварыг ашигладаг. Ганц ялгаа нь бид алийг нь ашиглах вэ? Зөвхөн хамтарсан загваруудыг ашиглахын тулд та үйлчлүүлэгч бүрт хамгийн ойрын 50-70 бүтээгдэхүүнийг авах ёстой.

Мөн DSSM-ийн дагуу хэмжүүрүүд:
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Бүх аргыг хэрхэн хослуулах вэ?

Гайхалтай гэж та хэлж байна, гэхдээ ийм их хэмжээний нэр дэвшигчийг олборлох хэрэгслийг яах вэ? Өгөгдлийнхөө оновчтой тохиргоог хэрхэн сонгох вэ? Энд бид хэд хэдэн асуудалтай байна:

  1. Арга тус бүрт гиперпараметр хайх зайг ямар нэгэн байдлаар хязгаарлах шаардлагатай. Энэ нь мэдээжийн хэрэг хаа сайгүй салангид байдаг, гэхдээ боломжит цэгүүдийн тоо маш их байдаг.
  2. Тодорхой гиперпараметр бүхий тодорхой аргуудын жижиг хязгаарлагдмал дээжийг ашигласнаар та өөрийн хэмжигдэхүүндээ хамгийн сайн тохиргоог хэрхэн сонгох вэ?

Бид эхний асуултын тодорхой зөв хариултыг хараахан олоогүй байгаа тул бид дараахь зүйлийг үргэлжлүүлнэ: арга тус бүрийн хувьд гиперпараметр хайлтын зай хязгаарлагчийг бичсэн бөгөөд энэ нь бидэнд байгаа өгөгдлийн зарим статистик тоо баримтаас хамаарна. Тиймээс, хүмүүсийн худалдан авалтын хоорондох дундаж хугацааг мэдэж байгаа тул бид "аль хэдийн худалдаж авсан зүйл" болон "өнгөрсөн худалдан авалтын хугацаа" аргыг аль хугацаанд ашиглахыг тааж чадна.

Бид янз бүрийн аргуудын хангалттай тооны өөрчлөлтийг даван туулсны дараа бид дараахь зүйлийг тэмдэглэж байна: хэрэгжилт бүр нь тодорхой тооны нэр дэвшигчдийг гаргаж авдаг бөгөөд бидний хувьд гол хэмжүүрийн тодорхой утгатай байдаг (санах). Бид зөвшөөрөгдөх тооцооллын хүчин чадлаасаа хамааран тодорхой тооны нэр дэвшигчдийг хамгийн өндөр хэмжүүрээр авахыг хүсч байна. Энд асуудал нь үүргэвчний асуудал руу сайхан унав.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Энд нэр дэвшигчдийн тоо нь ембүүний жин, эргүүлэн татах арга нь түүний үнэ цэнэ юм. Гэсэн хэдий ч алгоритмыг хэрэгжүүлэхдээ анхаарах ёстой өөр 2 зүйл бий.

  • Тэдний олж авсан нэр дэвшигчдэд аргууд нь давхцаж болно.
  • Зарим тохиолдолд өөр өөр параметртэй нэг аргыг хоёр удаа авах нь зөв байх бөгөөд эхнийх нь нэр дэвшигчийн гаралт нь хоёр дахь хэсгийн дэд хэсэг болохгүй.

Жишээлбэл, хэрэв бид "би аль хэдийн худалдаж авсан зүйл" аргын хэрэгжилтийг өөр өөр интервалтайгаар авах юм бол тэдний нэр дэвшигчдийн багц бие биендээ үүрлэх болно. Үүний зэрэгцээ гарц дахь "үе үе худалдан авалт" -ын өөр өөр параметрүүд нь бүрэн огтлолцлыг хангадаггүй. Тиймээс бид өөр өөр параметр бүхий түүвэрлэлтийн аргуудыг блок болгон хуваадаг бөгөөд ингэснээр блок бүрээс тодорхой гиперпараметр бүхий хамгийн ихдээ нэг хандлах аргыг ашиглахыг хүсдэг. Үүнийг хийхийн тулд та үүргэвчний асуудлыг хэрэгжүүлэхэд бага зэрэг ухаалаг байх хэрэгтэй, гэхдээ асимптотик ба үр дүн өөрчлөгдөхгүй.

Энэхүү ухаалаг хослол нь энгийн хамтын загвартай харьцуулахад дараах хэмжүүрүүдийг авах боломжийг бидэнд олгодог.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
Эцсийн хэмжүүр дээр бид дараах зургийг харж байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Гэсэн хэдий ч, эндээс та бизнест хэрэгтэй зөвлөмжүүдийн нэг нууц цэг байгааг анзаарч болно. Одоо бид хэрэглэгч ирэх долоо хоногт юу худалдаж авахыг урьдчилан таамаглах гайхалтай ажлыг хэрхэн хийхийг дөнгөж сая сурлаа. Гэхдээ тэр аль хэдийн худалдаж авсан зүйлдээ хөнгөлөлт үзүүлэх нь тийм ч сайхан биш юм. Гэхдээ жишээлбэл, дараах үзүүлэлтүүдийн хүлээлтийг нэмэгдүүлэх нь гайхалтай юм.

  1. Хувийн зөвлөмжид үндэслэсэн ашиг / эргэлт.
  2. Хэрэглэгчийн дундаж шалгалт.
  3. Айлчлалын давтамж.

Тиймээс бид олж авсан магадлалыг өөр өөр коэффициентээр үржүүлж, дээрх хэмжигдэхүүнүүдэд нөлөөлөх бүтээгдэхүүнүүд дээд цэгт гарахын тулд тэдгээрийг дахин эрэмбэлдэг. Аль аргыг ашиглах нь дээр бэлэн шийдэл байдаггүй. Ийм коэффициентийг бид шууд үйлдвэрлэлд туршиж хүртэл хийдэг. Гэхдээ энд хамгийн сайн үр дүнг өгдөг сонирхолтой аргууд байдаг:

  1. Бүтээгдэхүүний үнэ/маржингаар үржүүлнэ.
  2. Бүтээгдэхүүн гарч ирсэн дундаж баримтаар үржүүлнэ. Тиймээс бараа гарч ирэх бөгөөд тэд ихэвчлэн өөр зүйлийг авдаг.
  3. Энэ бүтээгдэхүүн нь хүмүүсийг илүү олон удаа буцааж авахыг өдөөдөг гэсэн таамаглал дээр үндэслэн энэ бүтээгдэхүүнийг худалдан авагчдын зочлох дундаж давтамжийг үржүүл.

Коэффициенттэй туршилт хийсний дараа бид үйлдвэрлэлд дараах хэмжүүрүүдийг олж авсан.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ
энд нийт бүтээгдэхүүний хувиргалт - бидний боловсруулсан зөвлөмжид бүх бүтээгдэхүүнээс худалдаж авсан бүтээгдэхүүний эзлэх хувь.

Анхааралтай уншигч офлайн болон онлайн хэмжүүрүүдийн хооронд мэдэгдэхүйц ялгаа байгааг анзаарах болно. Загварыг сургахдаа санал болгож болох бүх бүтээгдэхүүний динамик шүүлтүүрийг анхаарч үзэх боломжгүй тул энэ зан үйлийг тайлбарлаж байна. Бидний хувьд олж авсан нэр дэвшигчдийн тал хувийг шүүж болно гэдэг бол ердийн түүх бөгөөд энэ онцлог нь манай салбарт байдаг.

Орлогын хувьд дараахь түүхийг олж авсан бөгөөд зөвлөмжийг гаргасны дараа туршилтын бүлгийн орлого эрс нэмэгдэж байгаа нь тодорхой байна, одоо бидний зөвлөмжийн дагуу орлогын дундаж өсөлт 3-4% байна.
Бид офлайн худалдааны зөвлөмжийн чанарыг хэрхэн эрс сайжруулсан бэ

Эцэст нь хэлэхэд, хэрэв танд бодит цагийн бус зөвлөмж хэрэгтэй бол зөвлөмж өгөх нэр дэвшигчдийг гаргаж авах туршилтаас чанарын маш их өсөлтийг олж болно гэдгийг хэлмээр байна. Тэдний үеийнхэнд маш их цаг хугацаа зарцуулах нь олон сайн аргуудыг нэгтгэх боломжийг олгодог бөгөөд энэ нь нийтдээ бизнест маш сайн үр дүнг өгөх болно.

Материалыг сонирхолтой гэж үзсэн хүн бүртэй сэтгэгдэл дээр чатлахдаа баяртай байх болно. Та надаас асуулт асууж болно цахилгаан мэдээ. Би мөн өөрийн AI/стартапуудын талаар санал бодлоо хуваалцдаг телеграм суваг - тавтай морил :)

Эх сурвалж: www.habr.com

сэтгэгдэл нэмэх