Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hi kollha! Jisimni Sasha, jien CTO u Ko-Fundatur ta' LoyaltyLab. Sentejn ilu jien u sħabi, bħall-istudenti foqra kollha, morna filgħaxija nixtru l-birra fl-eqreb ħanut ħdejn id-dar tagħna. Konna mdejqa ħafna li l-bejjiegħ bl-imnut, li kien jaf li se niġu għall-birra, ma offrax skont fuq ċipep jew crackers, għalkemm dan kien tant loġiku! Ma fhimniex għalfejn kienet qed tiġri din is-sitwazzjoni u ddeċidejna li nibdew il-kumpanija tagħna stess. Ukoll, bħala bonus, agħti lilek innifsek roħs kull nhar ta 'Ġimgħa fuq dawk l-istess ċipep.

Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

U kollox wasal sal-punt fejn qed nippreżenta materjal fuq in-naħa teknika tal-prodott fuq NVIDIA GTC. Aħna kuntenti li naqsmu x-xogħol tagħna mal-komunità, għalhekk qed nippubblika r-rapport tiegħi fil-forma ta 'artiklu.

Introduzzjoni

Bħal kulħadd fil-bidu tal-vjaġġ, bdejna b'ħarsa ġenerali ta' kif isiru s-sistemi ta' rakkomandazzjoni. U l-aktar arkitettura popolari rriżulta li kienet it-tip li ġej:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Tikkonsisti f'żewġ partijiet:

  1. Teħid ta' kampjuni ta' kandidati għal rakkomandazzjonijiet bl-użu ta' mudell sempliċi u veloċi, ġeneralment wieħed kollaborattiv.
  2. Klassifikazzjoni ta 'kandidati b'mudell ta' kontenut aktar kumpless u bil-mod, b'kont meħud tal-karatteristiċi kollha possibbli fid-dejta.

Minn hawn 'il quddiem ser nuża t-termini li ġejjin:

  • kandidat/kandidat għal rakkomandazzjonijiet — par utent-prodott li potenzjalment jista' jiġi inkluż fir-rakkomandazzjonijiet fil-produzzjoni.
  • metodu ta’ estrazzjoni/estrazzjoni tal-kandidati/estrazzjoni tal-kandidati — proċess jew metodu għall-estrazzjoni ta’ “kandidati ta’ rakkomandazzjoni” mid-dejta disponibbli.

L-ewwel pass normalment jinvolvi l-użu ta 'varjazzjonijiet differenti ta' filtrazzjoni kollaborattiva. L-aktar popolari - ALS. Huwa sorprendenti li l-biċċa l-kbira tal-artikoli dwar is-sistemi ta’ rakkomandazzjoni jiżvelaw biss diversi titjib fil-mudelli kollaborattivi fl-ewwel stadju, iżda ħadd ma jitkellem ħafna dwar metodi oħra ta’ teħid ta’ kampjuni. Għalina, l-approċċ li nużaw biss mudelli kollaborattivi u ottimizzazzjonijiet varji magħhom ma ħadmux mal-kwalità li stennejna, għalhekk aħna ħaffer fir-riċerka speċifikament fuq din il-parti. U fl-aħħar tal-artiklu ser nuri kemm stajna ntejbu l-ALS, li kienet il-linja bażi tagħna.

Qabel ma ngħaddi biex niddeskrivi l-approċċ tagħna, huwa importanti li ninnota li fir-rakkomandazzjonijiet f'ħin reali, meta huwa importanti għalina li nqisu d-dejta li seħħet 30 minuta ilu, verament m'hemmx ħafna approċċi li jistgħu jaħdmu fiż-żmien meħtieġ. Iżda, fil-każ tagħna, irridu niġbru rakkomandazzjonijiet mhux aktar minn darba kuljum, u f'ħafna każijiet - darba fil-ġimgħa, li tagħtina l-opportunità li nużaw mudelli kumplessi u ntejbu l-kwalità diversi drabi.

Ejja nieħdu bħala linja bażi liema metriċi turi biss l-ALS dwar il-kompitu tal-estrazzjoni tal-kandidati. Il-metriċi ewlenin li nissorveljaw huma:

  • Preċiżjoni - il-proporzjon ta 'kandidati magħżula b'mod korrett minn dawk meħuda bħala kampjun.
  • Recall huwa l-proporzjon ta 'kandidati li ġara minn dawk li fil-fatt kienu fl-intervall fil-mira.
  • Punteġġ F1 - Miżura F ikkalkulata fuq iż-żewġ punti preċedenti.

Se nħarsu wkoll lejn il-metriċi tal-mudell finali wara t-taħriġ tal-gradjent spinta b'karatteristiċi ta 'kontenut addizzjonali. Hemm ukoll 3 metriċi ewlenin hawnhekk:

  • precision@5 - il-persentaġġ medju ta 'prodotti mill-aqwa 5 f'termini ta' probabbiltà għal kull xerrej.
  • response-rate@5 - konverżjoni tal-klijenti minn żjara fil-maħżen għax-xiri ta 'mill-inqas offerta personali waħda (5 prodotti f'offerta waħda).
  • medja roc-auc għal kull utent - medja roc-auc għal kull xerrej.

Huwa importanti li wieħed jinnota li dawn il-metriċi kollha huma mkejla fuq cross-validation ta' serje ta' ħin, jiġifieri, it-taħriġ iseħħ fl-ewwel k ġimgħat, u k+1 ġimgħa jittieħed bħala data tat-test. Għalhekk, it-tlugħ u l-inżul staġjonali kellhom impatt minimu fuq l-interpretazzjoni tal-kwalità tal-mudelli. Aktar fuq il-graffs kollha, l-assi ascissa se jindika n-numru tal-ġimgħa fil-validazzjoni inkroċjata, u l-assi ordinati se jindika l-valur tal-metrika speċifikata. Il-graffs kollha huma bbażati fuq data tat-tranżazzjonijiet minn klijent wieħed sabiex il-paraguni bejn xulxin ikunu korretti.

Qabel ma nibdew niddeskrivu l-approċċ tagħna, l-ewwel inħarsu lejn il-linja bażi, li hija mudell imħarreġ bl-ALS.
Metriċi tal-irkupru tal-kandidati:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Metriċi finali:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Nitratta l-implimentazzjonijiet kollha ta 'algoritmi bħala xi tip ta' ipoteżi tan-negozju. Għalhekk, bejn wieħed u ieħor, kwalunkwe mudell kollaborattiv jista 'jitqies bħala ipoteżi li "in-nies għandhom it-tendenza li jixtru dak li jixtru nies simili għalihom." Kif diġà għedt, ma llimitajniex ruħna għal semantika bħal din, u hawn xi ipoteżi li jaħdmu tajjeb fuq id-dejta fil-bejgħ bl-imnut offline:

  1. Li diġà xtrajt qabel.
  2. Simili għal dak li xtrajt qabel.
  3. Perjodu ta 'xiri tal-passat twil.
  4. Popolari skond il-kategorija/marka.
  5. Xiri alternattiv ta 'oġġetti differenti minn ġimgħa għal ġimgħa (ktajjen Markov).
  6. Prodotti simili għax-xerrejja, skond il-karatteristiċi mibnija minn mudelli differenti (Word2Vec, DSSM, eċċ.).

X xtrajt qabel?

L-ewristika l-aktar ovvja li taħdem tajjeb ħafna fil-bejgħ bl-imnut tal-merċa. Hawnhekk nieħdu l-oġġetti kollha li d-detentur tal-karta ta 'lealtà xtara fl-aħħar K ijiem (ġeneralment 1-3 ġimgħat), jew K ijiem sena ilu. Billi napplikaw dan il-metodu biss, niksbu l-metriċi li ġejjin:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hawnhekk huwa pjuttost ovvju li aktar ma nieħdu l-perjodu, aktar ikollna recall u inqas preċiżjoni għandna u viċi versa. Bħala medja, "l-aħħar ġimgħatejn" tagħti riżultati aħjar għall-klijenti.

Simili għal dak li xtrajt qabel

Mhuwiex sorprendenti li għall-bejgħ bl-imnut tal-merċa "dak li xtrajt qabel" jaħdem tajjeb, iżda l-estrazzjoni ta 'kandidati biss minn dak li l-utent diġà xtara mhix sabiħa ħafna, minħabba li mhux probabbli li tissorprendi lix-xerrej b'xi prodott ġdid. Għalhekk, nipproponu li ntejbu xi ftit din l-euristika billi tuża l-istess mudelli kollaborattivi. Mill-vettori li rċevejna waqt it-taħriġ ALS, nistgħu niksbu prodotti simili għal dak li l-utent diġà xtara. Din l-idea hija simili ħafna għal "videos simili" fis-servizzi għall-wiri tal-kontenut tal-vidjow, iżda peress li ma nafux x'qed jiekol/jixtri l-utent f'mument partikolari, nistgħu biss infittxu oħrajn simili għal dak li diġà xtara, speċjalment peress li aħna Diġà nafu kemm jaħdem tajjeb. Meta napplikaw dan il-metodu fuq tranżazzjonijiet tal-utent matul l-aħħar ġimgħatejn, niksbu l-metriċi li ġejjin:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hawnhekk k — in-numru ta' prodotti simili li jiġu rkuprati għal kull prodott mixtri mix-xerrej matul l-aħħar 14-il jum.
Dan l-approċċ ħadem speċjalment tajjeb għall-klijent tagħna, li għalih kien kritiku li ma jirrakkomanda xejn li kien diġà fl-istorja tax-xiri tal-utent.

Perjodu tax-xiri tard

Kif diġà skoprejna, minħabba l-frekwenza għolja ta 'xiri ta' oġġetti, l-ewwel approċċ jaħdem tajjeb għall-bżonnijiet speċifiċi tagħna. Imma xi ngħidu dwar oġġetti bħal trab tal-ħasil / xampù / eċċ. Jiġifieri, bi prodotti li x'aktarx ma jkunux meħtieġa kull ġimgħa jew tnejn u li metodi preċedenti ma jistgħux jiġu estratti. Dan iwassal għall-idea li ġejja - huwa propost li jiġi kkalkulat il-perjodu tax-xiri ta 'kull prodott bħala medja għall-klijenti li xtraw il-prodott aktar k darba. U mbagħad estratt dak li x-xerrej x'aktarx diġà spiċċa. Il-perjodi kkalkulati għall-oġġetti jistgħu jiġu ċċekkjati b'għajnejk għall-adegwatezza:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

U mbagħad se nħarsu lejn jekk it-tmiem tal-perjodu tal-prodott jaqax fl-intervall ta 'żmien meta r-rakkomandazzjonijiet se jkunu fil-produzzjoni u kampjun dak li jiġri. L-approċċ jista' jiġi illustrat bħal dan:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hawnhekk għandna 2 każijiet ewlenin li jistgħu jiġu kkunsidrati:

  1. Huwa meħtieġ li jittieħdu kampjuni ta 'prodotti minn klijenti li xtraw il-prodott inqas minn K darbiet.
  2. Huwa meħtieġ li jittieħed kampjun ta' prodott jekk it-tmiem tal-perjodu tiegħu jaqa' qabel il-bidu tal-intervall fil-mira.

Il-graff li ġej turi x'riżultati jikseb dan il-metodu b'iperparametri differenti:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
ft — Ħu biss klijenti li jkunu xtraw il-prodott mill-inqas K (hawnhekk K=5) darbiet
tm — Ħu biss kandidati li jaqgħu fl-intervall fil-mira

Mhuwiex sorprendenti li hu kapaċi (0, 0) l-ikbar recall u l-iżgħar preċiżjoni, peress li taħt din il-kundizzjoni l-aktar kandidati jiġu rkuprati. Madankollu, l-aħjar riżultati jinkisbu meta ma nieħdux kampjuni ta 'prodotti għal klijenti li xtraw prodott partikolari inqas minn k ħinijiet u estratt, inklużi oġġetti, li t-tmiem tal-perjodu tagħhom jaqa' qabel l-intervall fil-mira.

Popolari skond il-kategorija

Idea oħra pjuttost ovvja hija li tieħu kampjun ta 'prodotti popolari f'kategoriji jew marki differenti. Hawnhekk nikkalkulaw għal kull xerrej top-k kategoriji/marki “favoriti” u estratt “popolari” minn din il-kategorija/marka. Fil-każ tagħna, aħna se niddeterminaw "favoriti" u "popolari" bin-numru ta 'xiri tal-prodott. Vantaġġ addizzjonali ta 'dan l-approċċ huwa l-applikabilità tiegħu fil-każ tal-bidu kiesaħ. Jiġifieri, għal klijenti li jew għamlu ftit xiri, jew ma ilhomx il-maħżen, jew għadhom kemm ħarġu karta ta 'lealtà. Għalihom, huwa aktar faċli u aħjar li jaħżnu oġġetti li huma popolari mal-klijenti u li għandhom storja. Il-metriċi li jirriżultaw huma:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
Hawnhekk in-numru wara l-kelma "kategorija" ifisser il-livell ta 'bejta tal-kategorija.

B'mod ġenerali, mhuwiex sorprendenti wkoll li kategoriji idjaq jiksbu riżultati aħjar, peress li estratt prodotti "favoriti" aktar preċiżi għax-xerrejja.

Xiri alternattiv ta' oġġetti differenti minn ġimgħa għal ġimgħa

Approċċ interessanti li ma rajtx f'artikoli dwar sistemi ta 'rakkomandazzjoni huwa metodu statistiku pjuttost sempliċi u fl-istess ħin ta' ħidma tal-ktajjen ta 'Markov. Hawnhekk nieħdu 2 ġimgħat differenti, imbagħad għal kull klijent nibnu pari ta 'prodotti [mixtrija fil-ġimgħa i]-[mixtrija fil-ġimgħa j], fejn j > i, u minn hawn nikkalkulaw għal kull prodott il-probabbiltà li jaqilbu għal prodott ieħor il-ġimgħa d-dieħla. Jiġifieri għal kull par ta 'merkanzija producti-productj Aħna ngħoddu n-numru tagħhom fil-pari misjuba u naqsmu bin-numru ta 'pari, fejn prodotti kien fl-ewwel ġimgħa. Biex niġbdu kandidati, nieħdu l-aħħar irċevuta u estratt tax-xerrej top-k l-aktar prodotti probabbli li jmiss mill-matriċi ta 'tranżizzjoni li rċevejna. Il-proċess tal-kostruzzjoni ta 'matriċi ta' tranżizzjoni jidher bħal dan:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Minn eżempji reali fil-matriċi tal-probabbiltà tat-tranżizzjoni naraw il-fenomeni interessanti li ġejjin:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
Hawnhekk tista 'tinnota dipendenzi interessanti li huma żvelati fl-imġieba tal-konsumatur: pereżempju, min iħobb il-frott taċ-ċitru jew marka ta' ħalib li minnha x'aktarx jaqilbu għal ieħor. Mhuwiex sorprendenti wkoll li prodotti bi frekwenza għolja ta 'xiri ripetut, bħall-butir, ukoll jispiċċaw hawn.

Il-metriċi fil-metodu bil-ktajjen Markov huma kif ġej:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
k — in-numru ta’ prodotti li jiġu rkuprati għal kull prodott mixtri mill-aħħar tranżazzjoni tax-xerrej.
Kif nistgħu naraw, l-aħjar riżultat huwa muri mill-konfigurazzjoni b'k=4. Iż-żieda fil-ġimgħa 4 tista 'tiġi spjegata mill-imġieba staġjonali madwar il-vaganzi. 

Prodotti simili għax-xerrejja, skond il-karatteristiċi mibnija minn mudelli differenti

Issa wasalna għall-aktar parti diffiċli u interessanti - infittxu l-eqreb ġirien ibbażati fuq vettori ta 'klijenti u prodotti mibnija skond diversi mudelli. Fix-xogħol tagħna nużaw 3 mudelli bħal dawn:

  • ALS
  • Word2Vec (Item2Vec għal kompiti bħal dawn)
  • DSSM

Aħna diġà trattajna l-ALS, tista 'taqra dwar kif titgħallem hawn. Fil-każ ta 'Word2Vec, nużaw l-implimentazzjoni magħrufa tal-mudell minn gensim. B'analoġija mat-testi, aħna niddefinixxu l-offerta bħala rċevuta tax-xiri. Għalhekk, meta jibni vettur tal-prodott, il-mudell jitgħallem ibassar għall-prodott fl-irċevuta "il-kuntest" tiegħu (il-prodotti li jifdal fl-irċevuta). Fid-dejta tal-kummerċ elettroniku, huwa aħjar li tuża s-sessjoni tax-xerrej minflok irċevuta; il-ġuvini minn Ozon. U DSSM huwa aktar interessanti biex jiġi analizzat. Inizjalment, inkiteb mill-ġuvni minn Microsoft bħala mudell għat-tfittxija, Tista' taqra d-dokument ta' riċerka oriġinali hawn. L-arkitettura tal-mudell tidher bħal din:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hawnhekk Q — mistoqsija, mistoqsija ta' tfittxija għall-utent, D[i] — dokument, paġna tal-internet. L-input għall-mudell huwa l-attributi tat-talba u l-paġni, rispettivament. Wara kull saff ta 'input hemm numru ta' saffi kompletament konnessi (perceptron b'ħafna saffi). Sussegwentement, il-mudell jitgħallem jimminimizza l-cosine bejn il-vettori miksuba fl-aħħar saffi tal-mudell.
Il-kompiti ta 'rakkomandazzjoni jużaw eżattament l-istess arkitettura, biss minflok talba hemm utent, u minflok paġni hemm prodotti. U fil-każ tagħna, din l-arkitettura tinbidel f'dan li ġej:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Issa, biex tiċċekkja r-riżultati, għad irid ikopri l-aħħar punt - jekk fil-każ ta 'ALS u DSSM għandna vettori tal-utent definiti b'mod espliċitu, allura fil-każ ta' Word2Vec għandna biss vettori tal-prodott. Hawnhekk, biex nibnu l-vector tal-utent, iddefinijna 3 approċċi ewlenin:

  1. Żid biss il-vettori, imbagħad għad-distanza tal-cosine jirriżulta li sempliċement għamilna medja tal-prodotti fl-istorja tax-xiri.
  2. Sommazzjoni tal-vettur b'xi piż tal-ħin.
  3. Użin ta 'merkanzija b'koeffiċjent TF-IDF.

Fil-każ tal-ippeżar lineari tal-vettur tax-xerrej, nipproċedu mill-ipoteżi li l-prodott li l-utent xtara lbieraħ għandu influwenza akbar fuq l-imġieba tiegħu mill-prodott li xtara sitt xhur ilu. Allura nqisu l-ġimgħa ta 'qabel tax-xerrej b'odds ta' 1, u dak li ġara wara b'odds ta '½, ⅓, eċċ.:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Għall-koeffiċjenti TF-IDF, nagħmlu eżattament l-istess bħal f'TF-IDF għal testi, biss aħna nqisu lix-xerrej bħala dokument, u l-kontroll bħala offerta, rispettivament, il-kelma hija prodott. Dan il-mod, il-vettur tal-utent se jmur aktar lejn oġġetti rari, filwaqt li oġġetti frekwenti u familjari għax-xerrej ma jbiddlux ħafna. L-approċċ jista' jiġi illustrat bħal dan:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Issa ejja nħarsu lejn il-metriċi. Hekk jidhru r-riżultati tal-ALS:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
Metriċi għal Item2Vec b'varjazzjonijiet differenti tal-kostruzzjoni tal-vettur tax-xerrej:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
F'dan il-każ, jintuża eżattament l-istess mudell bħal fil-linja bażi tagħna. L-unika differenza hija liema k se nużaw. Sabiex tuża biss mudelli kollaborattivi, trid tieħu madwar 50-70 l-eqreb prodott għal kull klijent.

U metriċi skond DSSM:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Kif tgħaqqad il-metodi kollha?

Kessaħ, tgħid, imma x'għandek tagħmel b'sett daqshekk kbir ta 'għodod ta' estrazzjoni kandidati? Kif tagħżel l-aħjar konfigurazzjoni għad-dejta tiegħek? Hawnhekk għandna diversi problemi:

  1. Huwa meħtieġ li b'xi mod jiġi limitat l-ispazju ta 'tfittxija għall-iperparametri f'kull metodu. Huwa, ovvjament, diskreti kullimkien, iżda n-numru ta 'punti possibbli huwa kbir ħafna.
  2. Bl-użu ta 'kampjun żgħir limitat ta' metodi speċifiċi b'iperparametri speċifiċi, kif tista 'tagħżel l-aħjar konfigurazzjoni għall-metrika tiegħek?

Għadna ma sibniex tweġiba definittivament korretta għall-ewwel mistoqsija, għalhekk nipproċedu minn dan li ġej: għal kull metodu, jinkiteb limitatur ta 'spazju ta' tfittxija ta 'iperparametri, skont xi statistika fuq id-dejta li għandna. Għalhekk, meta nkunu nafu l-perjodu medju bejn ix-xiri mingħand in-nies, nistgħu naħsbu b'liema perjodu nużaw il-metodu "dak li diġà nxtara" u "perjodu ta 'xiri tal-passat twil".

U wara li għaddejna minn ċertu numru adegwat ta 'varjazzjonijiet ta' metodi differenti, ninnotaw dan li ġej: kull implimentazzjoni estratti ċertu numru ta 'kandidati u għandha ċertu valur tal-metrika ewlenija għalina (recall). Irridu nġibu total ta 'ċertu numru ta' kandidati, skont is-saħħa tal-kompjuter permissibbli tagħna, bl-ogħla metrika possibbli. Hawnhekk il-problema tiġġarraf b'mod sabiħ fil-problema tal-backpack.
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Hawnhekk in-numru ta 'kandidati huwa l-piż tal-ingott, u l-metodu ta' sejħa lura huwa l-valur tiegħu. Madankollu, hemm 2 punti oħra li għandhom jitqiesu meta jiġi implimentat l-algoritmu:

  • Il-metodi jista' jkollhom jikkoinċidu fil-kandidati li jirkupraw.
  • F'xi każijiet, ikun korrett li jittieħed metodu wieħed darbtejn b'parametri differenti, u l-output tal-kandidat mill-ewwel mhux se jkun subsett tat-tieni.

Pereżempju, jekk nieħdu l-implimentazzjoni tal-metodu "dak li diġà xtrajt" b'intervalli differenti għall-irkupru, allura s-settijiet tagħhom ta 'kandidati jkunu mdaħħla f'xulxin. Fl-istess ħin, parametri differenti f'"xiri perjodiku" fil-ħruġ ma jipprovdux intersezzjoni sħiħa. Għalhekk, naqsmu l-approċċi ta 'kampjunar b'parametri differenti fi blokki b'tali mod li minn kull blokka rridu nieħdu l-aktar approċċ wieħed ta' estrazzjoni b'iperparametri speċifiċi. Biex tagħmel dan, għandek bżonn tikseb ftit għaqlija fl-implimentazzjoni tal-problema ta 'knapsack, iżda l-asintotiċi u r-riżultat mhux se jinbidlu.

Din il-kombinazzjoni intelliġenti tippermettilna niksbu l-metriċi li ġejjin meta mqabbla ma 'mudelli sempliċiment kollaborattivi:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
Fil-metriċi finali naraw l-istampa li ġejja:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Madankollu, hawnhekk tista 'tinnota li hemm punt wieħed mikxuf għal rakkomandazzjonijiet li huma utli għan-negozju. Issa għadna kemm tgħallimna kif nagħmlu xogħol tajjeb biex nipprevedu x'se jixtri l-utent, pereżempju, il-ġimgħa d-dieħla. Iżda sempliċiment li jagħti skont fuq xi ħaġa li diġà se jixtri ma tantx jibred. Iżda huwa tajjeb li timmassimizza l-aspettattiva, pereżempju, tal-metriċi li ġejjin:

  1. Marġni/fatturat ibbażat fuq rakkomandazzjonijiet personali.
  2. Iċċekkja medja tal-klijent.
  3. Frekwenza taż-żjarat.

Allura aħna mmultiplika l-probabbiltajiet miksuba b'koeffiċjenti differenti u nikklassifikahom mill-ġdid sabiex il-prodotti li jaffettwaw il-metriċi ta 'hawn fuq jaslu fil-quċċata. M'hemm l-ebda soluzzjoni lesta għal liema approċċ huwa l-aħjar li tuża. Aħna anke nesperimentaw b'koeffiċjenti bħal dawn direttament fil-produzzjoni. Iżda hawn tekniki interessanti li ħafna drabi jagħtuna l-aħjar riżultati:

  1. Immoltiplika bil-prezz/marġini tal-prodott.
  2. Immoltiplika bl-irċevuta medja li fiha jidher il-prodott. Allura l-merkanzija se toħroġ, li normalment jieħdu xi ħaġa oħra.
  3. Immoltiplika bil-frekwenza medja taż-żjarat minn xerrejja ta 'dan il-prodott, ibbażata fuq l-ipoteżi li dan il-prodott jipprovoka lin-nies biex jirritornaw għalih aktar spiss.

Wara li wettaqna esperimenti b'koeffiċjenti, ksibna l-metriċi li ġejjin fil-produzzjoni:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline
Hawnhekk konverżjoni tal-prodotti ġenerali — is-sehem tal-prodotti mixtrija mill-prodotti kollha fir-rakkomandazzjonijiet li ġġenerajna.

Il-qarrej attent se jinnota differenza sinifikanti bejn metriċi offline u online. Din l-imġieba hija spjegata mill-fatt li mhux il-filtri dinamiċi kollha għall-prodotti li jistgħu jiġu rrakkomandati jistgħu jitqiesu meta jitħarreġ il-mudell. Għalina, hija storja normali meta nofs il-kandidati rkuprati jistgħu jiġu ffiltrati; din l-ispeċifiċità hija tipika fl-industrija tagħna.

F'termini ta 'dħul, tinkiseb l-istorja li ġejja, huwa ċar li wara t-tnedija tar-rakkomandazzjonijiet, id-dħul tal-grupp tat-test qed jikber b'mod qawwi, issa ż-żieda medja fid-dħul bir-rakkomandazzjonijiet tagħna hija 3-4%:
Kif tjiebna b'mod drammatiku l-kwalità tar-rakkomandazzjonijiet fil-bejgħ bl-imnut offline

Bħala konklużjoni, irrid ngħid li jekk għandek bżonn rakkomandazzjonijiet mhux f'ħin reali, allura tista 'tinstab żieda kbira ħafna fil-kwalità f'esperimenti bl-estrazzjoni ta' kandidati għal rakkomandazzjonijiet. Ammont kbir ta 'żmien għall-ġenerazzjoni tagħhom jagħmilha possibbli li jgħaqqdu ħafna metodi tajbin, li b'kollox se jagħtu riżultati kbar għan-negozju.

Inkun ferħan nitkellem fil-kummenti ma' kull min isib il-materjal interessanti. Tista' tistaqsuni mistoqsijiet personalment fuq telegramma. Jiena naqsam ukoll il-ħsibijiet tiegħi dwar l-AI/startups fi tiegħi kanal tat-telegramma — merħba :)

Sors: www.habr.com

Żid kumment