Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Sveiki visiem! Mani sauc SaÅ”a, es esmu LoyaltyLab CTO un lÄ«dzdibinātājs. Pirms diviem gadiem mēs ar draugiem, kā jau visi nabaga studenti, vakarā devāmies pēc alus uz tuvāko veikalu pie mājas. Bijām ļoti apbēdināti, ka mazumtirgotājs, zinot, ka nāksim pēc alus, nepiedāvāja atlaidi ne čipsiem, ne krekeriem, lai gan tas ir tik loÄ£iski! Mēs nesapratām, kāpēc Ŕāda situācija notiek, un nolēmām izveidot savu uzņēmumu. Nu bonusā izrakstiet sev atlaides katru piektdienu tiem paÅ”iem čipsiem.

Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Un viss nonāca tiktāl, ka es runāju ar materiālu par produkta tehnisko pusi NVIDIA GTC. Mēs esam priecīgi dalīties ar savu darbu ar sabiedrību, tāpēc es ievietoju savu ziņojumu raksta veidā.

Ievads

Tāpat kā visi ceļojuma sākumā, mēs sākām ar pārskatu par to, kā tiek veidotas ieteikumu sistēmas. Un vispopulārākā izrādÄ«jās Ŕāda veida arhitektÅ«ra:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Tas sastāv no divām daļām:

  1. Kandidātu atlase ieteikumiem, izmantojot vienkārŔu un ātru modeli, parasti sadarbojoties.
  2. Kandidātu ranžēŔana pēc sarežģītāka un lēnāka satura modeļa, ņemot vērā visas iespējamās pazÄ«mes datos.

Šeit un tālāk es izmantoŔu Ŕādus terminus:

  • kandidāts / kandidāts rekomendācijām - lietotāja-produktu pāris, kas potenciāli var iekļūt ieteikumos ražoÅ”anā.
  • kandidātu ekstrakcijas/ekstraktora/kandidātu ekstrakcijas metode ā€” process vai metode ā€œieteikumu kandidātuā€ iegÅ«Å”anai no pieejamajiem datiem.

Pirmajā posmā parasti tiek izmantotas dažādas sadarbÄ«bas filtrÄ“Å”anas variācijas. Vispopulārākais - ALS. PārsteidzoÅ”i, ka lielākā daļa rakstu par ieteikumu sistēmām tikai pirmajā posmā atklāj dažādus sadarbÄ«bas modeļu uzlabojumus, bet neviens nerunā par citām izlases metodēm. Mums pieeja izmantot tikai sadarbÄ«bas modeļus un dažādas optimizācijas ar tiem nedarbojās tik kvalitātē, kā mēs gaidÄ«jām, tāpēc mēs iedziļinājāmies izpētē tieÅ”i par Å”o daļu. Un raksta beigās es parādÄ«Å”u, cik daudz mēs varējām uzlabot ALS, kas bija mÅ«su bāzes stāvoklis.

Pirms pārietu uz mÅ«su pieejas aprakstu, ir svarÄ«gi atzÄ«mēt, ka ar reāllaika ieteikumiem, kad mums ir svarÄ«gi ņemt vērā datus, kas notikuÅ”i pirms 30 minÅ«tēm, patieŔām nav daudz pieeju, kas varētu darboties Ä«stajā laikā. Taču mÅ«su gadÄ«jumā ieteikumi ir jāvāc ne biežāk kā reizi dienā un vairumā gadÄ«jumu ā€“ reizi nedēļā, kas dod iespēju izmantot sarežģītus modeļus un vairot kvalitāti.

Ņemsim par bāzes lÄ«niju, kādus rādÄ«tājus tikai ALS parāda kandidātu iegÅ«Å”anas uzdevumā. Galvenie rādÄ«tāji, kurus mēs uzraugām, ir:

  • Precizitāte - pareizi atlasÄ«to kandidātu Ä«patsvars no atlasÄ«tajiem.
  • Atsaukt ā€” to kandidātu Ä«patsvars, kuri faktiski atradās mērÄ·a intervālā.
  • F1-score ā€” F-rezultāts, kas aprēķināts par iepriekŔējiem diviem punktiem.

Mēs arÄ« apskatÄ«sim galÄ«gā modeļa rādÄ«tājus pēc gradienta palielināŔanas apmācÄ«bas ar papildu satura funkcijām. Ir arÄ« 3 galvenie rādÄ«tāji:

  • precision@5 ā€” vidējais trāpÄ«jumu procentuālais daudzums no 5 labākajiem pēc varbÅ«tÄ«bas katram klientam.
  • response-rate@5 ā€” pircēju pārvērÅ”ana no veikala apmeklējuma vismaz viena personÄ«gā piedāvājuma iegādē (vienā piedāvājumā ir 5 preces).
  • vid. roc-auc vienam lietotājam ā€” vidējs roc-auc katram pircējam.

Ir svarÄ«gi atzÄ«mēt, ka visi Å”ie rādÄ«tāji tiek mērÄ«ti laika rindu savstarpēja validācija, tas ir, apmācÄ«ba notiek pirmajās k nedēļās, un k + 1 nedēļas tiek ņemtas par testa datiem. Tādējādi sezonālie kāpumi/kritumi modeļu kvalitātes interpretāciju ietekmēja minimāli. Turklāt visās diagrammās abscisu ass norādÄ«s nedēļas numuru savstarpējā validācijā, bet ordinātu ass norāda norādÄ«tās metrikas vērtÄ«bu. Visi grafiki ir balstÄ«ti uz viena klienta darÄ«jumu datiem, lai to salÄ«dzinājums bÅ«tu pareizs.

Pirms sākam aprakstīt savu pieeju, vispirms apskatīsim bāzes līniju, kas ir ALS apmācītais modelis.
Kandidātu ieguves metrika:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Galīgie rādītāji:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Visas algoritmu ievieÅ”anas es uztveru kā sava veida biznesa hipotēzi. Tādējādi, ļoti aptuveni, jebkurus sadarbÄ«bas modeļus var uzskatÄ«t par hipotēzi, ka "cilvēki mēdz pirkt to, ko pērk cilvēki, kas viņiem patÄ«k". Kā jau teicu, mēs neaprobežojāmies ar Ŕādu semantiku, un Å”eit ir dažas hipotēzes, kas joprojām lieliski darbojas attiecÄ«bā uz datiem bezsaistes mazumtirdzniecÄ«bā:

  1. Ko jūs iepriekŔ esat iegādājies.
  2. Līdzīgi tam, ko iegādājos iepriekŔ.
  3. Sen pagātnes pirkuma periods.
  4. Populārs pēc kategorijas/zīmola.
  5. Alternatīva dažādu preču iegāde no nedēļas uz nedēļu (Markova ķēdes).
  6. Pircējiem lÄ«dzÄ«gi produkti pēc dažādu modeļu (Word2Vec, DSSM uc) Ä«paŔībām.

Ko jūs iepriekŔ iegādājāties

AcÄ«mredzamākā heiristika, kas ļoti labi darbojas pārtikas preču mazumtirdzniecÄ«bā. Å eit mēs ņemam visas preces, kuras lojalitātes kartes Ä«paÅ”nieks iegādājās pēdējās K dienās (parasti 1-3 nedēļas), vai K dienā pirms gada. Izmantojot tikai Å”o metodi, mēs iegÅ«stam Ŕādus rādÄ«tājus:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Å eit ir pilnÄ«gi skaidrs, ka jo vairāk mēs uztveram periodu, jo vairāk atceramies un mazāk precizitāti, un otrādi. Labāki rezultāti vidēji klientiem ir ā€œpēdējās 2 nedēļasā€.

Līdzīgi tam, ko iegādājos iepriekŔ

Nav pārsteidzoÅ”i, ka pārtikas preču mazumtirdzniecÄ«bā labi darbojas ā€œpirmais pirktsā€, taču izvilkt kandidātus tikai no tā, ko lietotājs jau ir iegādājies, nav Ä«paÅ”i forÅ”i, jo diez vai pircēju izdosies pārsteigt ar kādu jaunu preci. Tāpēc mēs ierosinām nedaudz uzlabot Å”o heiristisku informāciju, izmantojot tos paÅ”us sadarbÄ«bas modeļus. No vektoriem, ko saņēmām ALS apmācÄ«bu laikā, jÅ«s varat iegÅ«t lÄ«dzÄ«gus produktus tiem, ko lietotājs jau ir iegādājies. Å Ä« ideja ir ļoti lÄ«dzÄ«ga ā€œlÄ«dzÄ«gajiem videoā€ video satura skatÄ«Å”anās servisos, taču, tā kā mēs nezinām, ko lietotājs konkrētajā brÄ«dÄ« ēd/pērk, varam meklēt tikai kaut ko lÄ«dzÄ«gu tikai tam, ko viņŔ jau ir iegādājies, jo Ä«paÅ”i tāpēc, ka mēs jau zinām, cik labi tas darbojas. Lietojot Å”o metodi lietotāju darÄ«jumiem pēdējo 2 nedēļu laikā, mēs iegÅ«stam Ŕādus rādÄ«tājus:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Šeit k - līdzīgu preču skaits, kas tiek izgūtas par katru pircēja iegādāto preci pēdējo 14 dienu laikā.
Å Ä« pieeja mums darbojās Ä«paÅ”i labi klientam, kurÅ” bija kritisks, lai vispār neieteiktu to, kas jau bija lietotāja pirkumu vēsturē.

Sen pagājis pirkŔanas periods

Kā jau esam noskaidrojuÅ”i, lielā preču pirkÅ”anas biežuma dēļ mÅ«su specifikai labi der pirmā pieeja. Bet kā ar tādām precēm kā veļas pulveris/Å”ampÅ«ns/utt. Tas ir, ar produktiem, kas, visticamāk, nebÅ«s vajadzÄ«gi reizi nedēļā vai divās un kurus nevar iegÅ«t ar iepriekŔējām metodēm. Tas nozÄ«mē Ŕādu domu - tiek piedāvāts aprēķināt katras preces iegādes periodu vidēji tiem pircējiem, kuri iegādājās preci vairāk k vienreiz. Un pēc tam izvelciet to, kas, visticamāk, pircējam jau ir beidzies. Aprēķināto preču periodu atbilstÄ«bu var pārbaudÄ«t ar acÄ«m:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Un tad mēs redzēsim, vai produkta perioda beigas iekrÄ«t laika intervālā, kad ieteikumi bÅ«s ražoÅ”anā, un izlasÄ«sim, kas iekrÄ«t. Å o pieeju var ilustrēt Ŕādi:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Šeit ir 2 galvenie gadījumi, ko var apsvērt:

  1. Vai izvēlēties produktus klientiem, kuri iegādājās produktu mazāk nekā K reizes.
  2. Norāda, vai ņemt produkta paraugu, ja tā perioda beigas iekrīt pirms mērķa intervāla sākuma.

SekojoŔā diagramma parāda, kādus rezultātus Ŕāda metode sasniedz ar dažādiem hiperparametriem:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
ft - Ņemiet tikai tos pircējus, kuri iegādājās preci vismaz K (Å”eit K = 5) reizes
tm ā€” Ņemiet tikai tos kandidātus, kuri ietilpst mērÄ·a intervālā

Nav pārsteidzoÅ”i, spējÄ«gs (0, 0) lielākais atgādināt un mazākais precizitāte, jo saskaņā ar Å”o nosacÄ«jumu tiek iegÅ«ts visvairāk kandidātu. Tomēr vislabākie rezultāti tiek iegÅ«ti, ja mēs neņemam produktu paraugus klientiem, kuri iegādājās konkrēto preci mazāk nekā k reizes un izvelciet, cita starpā, preces, kuru perioda beigas iekrÄ«t pirms mērÄ·a intervāla.

Populārs pēc kategorijas

Vēl viena diezgan acÄ«mredzama ideja ir atlasÄ«t populārus produktus dažādās kategorijās vai zÄ«molos. Å eit mēs aprēķinām katram klientam top-k ā€œiecienÄ«tākāsā€ kategorijas/zÄ«moli un izvelciet ā€œpopulārosā€ no Ŕīs kategorijas/zÄ«mola. MÅ«su gadÄ«jumā mēs definējam ā€œmīļākoā€ un ā€œpopulāroā€ pēc preču pirkumu skaita. Å Ä«s pieejas papildu priekÅ”rocÄ«ba ir tās pielietojamÄ«ba aukstās palaiÅ”anas gadÄ«jumā. Tas ir, klientiem, kuri ir veikuÅ”i vai nu ļoti maz pirkumu, vai nav bijuÅ”i veikalā ilgu laiku, vai vispār ir izsnieguÅ”i tikai lojalitātes karti. Viņiem vieglāk un vislabāk ir iemest preces no pircēju iecienÄ«tām precēm ar jau esoÅ”u vēsturi. RādÄ«tāji ir Ŕādi:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Å eit skaitlis aiz vārda ā€œkategorijaā€ nozÄ«mē kategorijas ligzdoÅ”anas lÄ«meni.

Kopumā nav arÄ« pārsteidzoÅ”i, ka Å”aurākās kategorijās sasniedz labākus rezultātus, jo tās izvelk precÄ«zākus pircēju ā€œmīļākāsā€ preces.

Alternatīva dažādu preču iegāde no nedēļas uz nedēļu

Interesanta pieeja, ko neesmu redzējis rakstos par ieteikuma sistēmām, ir diezgan vienkārÅ”a un tajā paŔā laikā strādājoÅ”a Markova ķēžu statistiskā metode. Å eit mēs paņemam 2 dažādas nedēļas, pēc tam katram klientam veidojam produktu pārus [pirkts i nedēļā]-[pirkts j nedēļā], kur j > i, un no Å”ejienes mēs aprēķinām katrai precei varbÅ«tÄ«bu nākamnedēļ pāriet uz citu produktu. Tas ir, katram preču pārim producti-productj saskaitÄ«t to skaitu atrastajos pāros un dalÄ«t ar pāru skaitu, kur produkti bija pirmajā nedēļā. Lai iegÅ«tu kandidātus, mēs paņemam pēdējo pircēja čeku un saņemam top-k visticamāk nākamie produkti no pārejas matricas, ko mēs saņēmām. Pārejas matricas veidoÅ”anas process izskatās Ŕādi:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

No reāliem piemēriem pārejas varbÅ«tÄ«bu matricā mēs redzam Ŕādas interesantas parādÄ«bas:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Å eit var pamanÄ«t interesantas atkarÄ«bas, kas atklājas patērētāju uzvedÄ«bā: piemēram, citrusaugļu mīļotāji vai piena zÄ«mols, no kura viņi, visticamāk, pāriet uz citu. Nav arÄ« pārsteidzoÅ”i, ka Å”eit nonāk arÄ« preces ar lielu atkārtotu pirkumu skaitu, piemēram, sviests.

Metodes ar Markova ķēdēm metrika ir Ŕāda:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
k - preču skaits, kas tiek izgūtas katrai precei, kas iegādāta no pircēja pēdējā darījuma.
Kā redzam, konfigurācija ar k=4 parāda labāko rezultātu. Pieaugums 4. nedēļā ir izskaidrojams ar sezonālu uzvedÄ«bu brÄ«vdienu laikā. 

Pircējiem lÄ«dzÄ«gi produkti pēc dažādu modeļu Ä«paŔībām

Tā nu mēs nonākam pie grÅ«tākās un interesantākās daļas - tuvāko kaimiņu meklÄ“Å”anas pircēju vektoros un pēc dažādiem modeļiem bÅ«vētās produkcijas. Savā darbā mēs izmantojam 3 Ŕādus modeļus:

  • ALS
  • Word2Vec (Item2Vec Ŕādiem uzdevumiem)
  • DSSM

Mēs jau esam tikuÅ”i galā ar ALS, varat lasÄ«t par to, kā tas mācās Å”eit. Word2Vec gadÄ«jumā mēs izmantojam labi zināmo modeļa ievieÅ”anu no gensim. Pēc analoÄ£ijas ar tekstiem piedāvājumu definējam kā pirkuma čeku. Tādējādi, konstruējot preces vektoru, modelis mācās paredzēt tā ā€œkontekstuā€ precei čekā (pārējām precēm čekā). E-komercijas datos labāk ir izmantot pircēja sesiju, nevis kvÄ«ti, puiÅ”i no Ozons. Un DSSM ir interesantāk izjaukt. Sākotnēji to rakstÄ«ja Microsoft puiÅ”i kā meklÄ“Å”anas modeli, oriÄ£inālo pētniecisko darbu varat izlasÄ«t Å”eit. Modeļa arhitektÅ«ra izskatās Ŕādi:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Å eit Q - vaicājums, lietotāja meklÄ“Å”anas vaicājums, D[i] - dokuments, tÄ«mekļa lapa. Modeļa ievade saņem attiecÄ«gi pieprasÄ«juma zÄ«mes un lapas. Katram ievades slānim seko vairāki pilnÄ«bā savienoti slāņi (daudzslāņu perceptrons). Tālāk modelis mācās minimizēt kosinusu starp vektoriem, kas iegÅ«ti modeļa pēdējos slāņos.
Ieteikuma uzdevumos tiek izmantota tieŔi tāda pati arhitektūra, taču pieprasījuma vietā ir lietotājs, bet lapu vietā ir produkti. Un mūsu gadījumā Ŕī arhitektūra tiek pārveidota par Ŕādu:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Tagad, lai pārbaudÄ«tu rezultātus, atliek aptvert pēdējo punktu - ja ALS un DSSM gadÄ«jumā mums ir skaidri definēti lietotāju vektori, tad Word2Vec gadÄ«jumā mums ir tikai produktu vektori. Å eit, lai izveidotu lietotāja vektoru, mēs esam identificējuÅ”i 3 galvenās pieejas:

  1. VienkārÅ”i pievienojiet vektorus, tad kosinusa attālumam izrādās, ka mēs vienkārÅ”i aprēķinājām iepirkÅ”anās vēsturē esoÅ”os produktus.
  2. Vektoru summÄ“Å”ana ar noteiktu laika svērumu.
  3. Preču svērÅ”ana ar TF-IDF koeficientu.

Pircēja vektora lineārā svēruma gadÄ«jumā mēs izejam no hipotēzes, ka precei, kuru lietotājs iegādājās vakar, ir lielāka ietekme uz viņa uzvedÄ«bu nekā precei, kuru viņŔ iegādājās pirms seÅ”iem mēneÅ”iem. Tātad mēs uzskatām pircēja iepriekŔējo nedēļu ar koeficientu 1 un to, kas notika tālāk, ar koeficientiem Ā½, ā…“ utt.:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

AttiecÄ«bā uz TF-IDF koeficientiem mēs darām tieÅ”i to paÅ”u, ko TF-IDF tekstiem, tikai mēs uzskatām pircēju par dokumentu, un kvÄ«ti par piedāvājumu, attiecÄ«gi vārds ir prece. Tātad lietotāja vektors vairāk novirzÄ«sies uz retām precēm, un preces, kas ir biežas un pircējam pazÄ«stamas, to daudz nemainÄ«s. Å o pieeju var ilustrēt Ŕādi:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Tagad apskatīsim rādītājus. Lūk, kā izskatās ALS rezultāti:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Item2Vec metrika ar dažādām pircēja vektora konstruÄ“Å”anas variācijām:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Å ajā gadÄ«jumā tiek izmantots tieÅ”i tāds pats modelis kā mÅ«su bāzlÄ«nijai. VienÄ«gā atŔķirÄ«ba ir tā, kuru k mēs izmantosim. Lai izmantotu tikai sadarbÄ«bas modeļus, katram klientam ir jāņem aptuveni 50-70 tuvākie produkti.

Un DSSM metrika:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Kā apvienot visas metodes?

ForÅ”i, jÅ«s sakāt, bet ko darÄ«t ar tik lielu kandidātu ieguves rÄ«ku komplektu? Kā izvēlēties optimālo konfigurāciju saviem datiem? Å eit mums ir vairākas problēmas:

  1. Katrā metodē ir nepiecieÅ”ams kaut kā ierobežot hiperparametru meklÄ“Å”anas vietu. Tas, protams, visur ir diskrēts, bet iespējamo punktu skaits ir ļoti liels.
  2. Kā izvēlēties labāko metrikas konfigurāciju, izmantojot nelielu ierobežotu konkrētu metožu paraugu ar konkrētiem hiperparametriem?

Mēs vēl neesam atraduÅ”i viennozÄ«mÄ«gi pareizu atbildi uz pirmo jautājumu, tāpēc mēs rÄ«kojamies no sekojoŔā: katrai metodei tiek uzrakstÄ«ts hiperparametra meklÄ“Å”anas telpas ierobežotājs atkarÄ«bā no mÅ«su rÄ«cÄ«bā esoÅ”ajiem datiem. Tādējādi, zinot vidējo periodu starp pirkumiem no cilvēkiem, varam uzminēt, ar kādu periodu izmantot metodi ā€œkas jau ir nopirktsā€ un ā€œsen pagātnes pirkuma periodsā€.

Un pēc tam, kad esam izpētÄ«juÅ”i adekvātu skaitu dažādu metožu variantu, mēs atzÄ«mējam sekojoÅ”o: katra ievieÅ”ana izvelk noteiktu skaitu kandidātu un tai ir noteikta metrika (atsaukt) vērtÄ«ba, kas mums ir svarÄ«ga. Mēs vēlamies iegÅ«t noteiktu skaitu kandidātu kopā atkarÄ«bā no mÅ«su pieļaujamās skaitļoÅ”anas jaudas ar visaugstāko iespējamo metriku. Å eit problēma labi sabrÅ«k mugursomas problēmā.
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Å eit kandidātu skaits ir lietņa svars, un metodes atsaukÅ”ana ir tā vērtÄ«ba. Tomēr ir vēl 2 punkti, kas jāņem vērā, ievieÅ”ot algoritmu:

  • Metodes var pārklāties kandidātos, kurus viņi izvelk.
  • Dažos gadÄ«jumos bÅ«s pareizi lietot vienu metodi divas reizes ar dažādiem parametriem, un kandidāti pirmās izvadē nebÅ«s otrās apakÅ”kopa.

Piemēram, ja mēs izmantojam metodes ā€œjau nopirktaisā€ ievieÅ”anu ar dažādiem ekstrakcijas intervāliem, tad to kandidātu kopas tiks ligzdotas viena otrā. Tajā paŔā laikā dažādi parametri "periodiskajos pirkumos" pie izejas nedod pilnÄ«gu krustojumu. Tāpēc mēs sadalām izlases metodes ar dažādiem parametriem blokos, lai no katra bloka mēs vēlamies izmantot ne vairāk kā vienu ekstrakcijas pieeju ar konkrētiem hiperparametriem. Lai to izdarÄ«tu, jums ir nedaudz jāmānās, Ä«stenojot mugursomas problēmu, taču asimptotika un rezultāts no tā nemainÄ«sies.

Šāda gudra kombinācija ļauj iegūt Ŕādus rādītājus salīdzinājumā ar vienkārŔiem sadarbības modeļiem:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Pēdējā rādÄ«tājā mēs redzam Ŕādu attēlu:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Tomēr Å”eit var redzēt, ka ir viens neatsegts punkts ieteikumiem, kas ir noderÄ«gi biznesam. Tagad mēs tikko uzzinājām, kā forÅ”i paredzēt, ko lietotājs pirks, piemēram, nākamajā nedēļā. Bet tikai dot atlaidi par to, ka viņŔ tik un tā nopirks, nav Ä«paÅ”i forÅ”i. Taču ir lieliski palielināt cerÄ«bas, piemēram, Ŕādus rādÄ«tājus:

  1. Marža/apgrozījums balstās uz personīgiem ieteikumiem.
  2. Vidējā pircēju pārbaude.
  3. apmeklējumu biežums.

Tātad iegÅ«tās varbÅ«tÄ«bas reizinām ar dažādiem koeficientiem un pārkārtojam tās, lai augÅ”pusē bÅ«tu produkti, kas ietekmē iepriekÅ” minētos rādÄ«tājus. Å eit nav gatavu risinājumu, kuru pieeju labāk izmantot. Pat mēs eksperimentējam ar Ŕādiem koeficientiem tieÅ”i ražoÅ”anā. Bet Å”eit ir daži interesanti triki, kas visbiežāk sniedz vislabākos rezultātus:

  1. Reiziniet ar preces cenu/peļņu.
  2. Reiziniet ar vidējo pārbaudi, kurā produkts tiek izmantots. Tātad iznāks preces, ar kurām viņi parasti ņem kaut ko citu.
  3. Reiziniet ar vidējo Ŕī produkta pircēju apmeklējumu biežumu, pamatojoties uz hipotēzi, ka Ŕī prece izraisa biežāku atgrieÅ”anos.

Pēc eksperimentÄ“Å”anas ar koeficientiem ražoÅ”anā ieguvām Ŕādus rādÄ«tājus:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā
Šeit kopējā produkta konversija - iegādāto produktu īpatsvars no visiem produktiem mūsu ģenerētajos ieteikumos.

UzmanÄ«gs lasÄ«tājs pamanÄ«s bÅ«tisku atŔķirÄ«bu starp bezsaistes un tieÅ”saistes metriku. Šāda rÄ«cÄ«ba ir izskaidrojama ar to, ka, apmācot modeli, nevar ņemt vērā visus produktu dinamiskos filtrus, kurus var ieteikt. Mums normāls stāsts, kad pusi no izvilktajiem kandidātiem var atfiltrēt, tāda specifika mÅ«su nozarē ir raksturÄ«ga.

Ieņēmumu ziņā tiek iegÅ«ts Ŕāds stāsts, skaidrs, ka pēc ieteikumu palaiÅ”anas testa grupas ieņēmumi strauji aug, Å”obrÄ«d vidējais ieņēmumu pieaugums ar mÅ«su ieteikumiem ir 3-4%:
Kā mēs ievērojami uzlabojām ieteikumu kvalitāti bezsaistes mazumtirdzniecībā

Nobeigumā es gribu teikt, ka, ja jums ir nepiecieÅ”ami ieteikumi, kas nav reāllaika ieteikumi, tad ļoti liels kvalitātes pieaugums tiek konstatēts eksperimentos ar ieteikumu kandidātu ieguvi. Liels laiks to Ä£enerÄ“Å”anai ļauj apvienot daudzas labas metodes, kas kopumā dos lieliskus rezultātus biznesam.

PriecāŔos komentāros tērzēt ar visiem, kam materiāls Ŕķiet interesants. JÅ«s varat uzdot man jautājumus personÄ«gi telegramma. Es arÄ« dalos savās pārdomās par AI/jaunajiem uzņēmumiem savā telegrammas kanāls ā€” laipni lÅ«dzam šŸ™‚

Avots: www.habr.com

Pievieno komentāru