Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Hai semua! Nama saya Sasha, saya CTO & Pengasas Bersama di LoyaltyLab. Dua tahun lalu, saya dan rakan-rakan, seperti semua pelajar miskin, pergi pada waktu petang untuk membeli bir di kedai terdekat berhampiran rumah kami. Kami sangat kecewa kerana peruncit, mengetahui bahawa kami akan datang untuk membeli bir, tidak menawarkan diskaun untuk kerepek atau keropok, walaupun ini sangat logik! Kami tidak faham mengapa keadaan ini berlaku dan memutuskan untuk memulakan syarikat kami sendiri. Nah, sebagai bonus, berikan diri anda diskaun setiap hari Jumaat untuk cip yang sama.

Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Dan semuanya sampai ke tahap di mana saya membentangkan bahan di bahagian teknikal produk NVIDIA GTC. Kami gembira untuk berkongsi kerja kami dengan masyarakat, jadi saya menerbitkan laporan saya dalam bentuk artikel.

Pengenalan

Seperti orang lain pada permulaan perjalanan, kami bermula dengan gambaran keseluruhan tentang cara sistem pengesyor dibuat. Dan seni bina yang paling popular ternyata jenis berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Ia terdiri daripada dua bahagian:

  1. Persampelan calon untuk cadangan menggunakan model yang ringkas dan pantas, biasanya model kolaboratif.
  2. Kedudukan calon dengan model kandungan yang lebih kompleks dan perlahan, dengan mengambil kira semua kemungkinan ciri dalam data.

Selepas ini saya akan menggunakan istilah berikut:

  • calon/calon untuk cadangan β€” pasangan produk pengguna yang mungkin boleh disertakan dalam pengesyoran dalam pengeluaran.
  • kaedah pengekstrakan/pengekstrak calon β€” proses atau kaedah untuk mengekstrak "calon cadangan" daripada data yang tersedia.

Langkah pertama biasanya melibatkan penggunaan variasi penapisan kolaboratif yang berbeza. Yang paling popular - ALS. Adalah menghairankan bahawa kebanyakan artikel tentang sistem pengesyor hanya mendedahkan pelbagai penambahbaikan pada model kolaboratif pada peringkat pertama, tetapi tiada siapa yang bercakap banyak tentang kaedah pensampelan lain. Bagi kami, pendekatan menggunakan hanya model kolaboratif dan pelbagai pengoptimuman dengannya tidak berfungsi dengan kualiti yang kami jangkakan, jadi kami menyelidiki secara khusus mengenai bahagian ini. Dan pada akhir artikel saya akan menunjukkan sejauh mana kami dapat meningkatkan ALS, yang merupakan garis dasar kami.

Sebelum saya meneruskan untuk menerangkan pendekatan kami, adalah penting untuk ambil perhatian bahawa dalam pengesyoran masa nyata, apabila penting untuk kami mengambil kira data yang berlaku 30 minit yang lalu, sebenarnya tidak banyak pendekatan yang boleh berfungsi dalam masa yang diperlukan. Tetapi, dalam kes kami, kami perlu mengumpul cadangan tidak lebih daripada sekali sehari, dan dalam kebanyakan kes - sekali seminggu, yang memberi kami peluang untuk menggunakan model yang kompleks dan meningkatkan kualiti beberapa kali ganda.

Mari kita ambil sebagai garis dasar apakah metrik yang hanya ditunjukkan oleh ALS tentang tugas mengekstrak calon. Metrik utama yang kami pantau ialah:

  • Ketepatan - perkadaran calon yang dipilih dengan betul daripada yang disampel.
  • Ingat semula ialah nisbah calon yang berlaku daripada mereka yang sebenarnya berada dalam selang sasaran.
  • F1-skor - F-ukuran dikira pada dua mata sebelumnya.

Kami juga akan melihat metrik model akhir selepas meningkatkan kecerunan latihan dengan ciri kandungan tambahan. Terdapat juga 3 metrik utama di sini:

  • precision@5 - purata peratusan produk daripada 5 teratas dari segi kebarangkalian bagi setiap pembeli.
  • response-rate@5 - penukaran pelanggan daripada lawatan ke kedai kepada pembelian sekurang-kurangnya satu tawaran peribadi (5 produk dalam satu tawaran).
  • purata roc-auc bagi setiap pengguna - purata roc-auc untuk setiap pembeli.

Adalah penting untuk ambil perhatian bahawa semua metrik ini diukur pada pengesahan silang siri masa, iaitu, latihan berlaku dalam k minggu pertama, dan k+1 minggu diambil sebagai data ujian. Oleh itu, turun naik bermusim mempunyai kesan yang minimum terhadap tafsiran kualiti model. Selanjutnya pada semua graf, paksi absis akan menunjukkan nombor minggu dalam pengesahan silang, dan paksi ordinat akan menunjukkan nilai metrik yang ditentukan. Semua graf adalah berdasarkan data transaksi daripada satu pelanggan supaya perbandingan antara satu sama lain adalah betul.

Sebelum kita mula menerangkan pendekatan kita, kita mula-mula melihat garis dasar, yang merupakan model terlatih ALS.
Metrik pengambilan calon:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Metrik akhir:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Saya menganggap semua pelaksanaan algoritma sebagai sejenis hipotesis perniagaan. Oleh itu, secara kasarnya, mana-mana model kolaboratif boleh dianggap sebagai hipotesis bahawa "orang ramai cenderung untuk membeli apa yang dibeli oleh orang yang serupa dengan mereka." Seperti yang telah saya katakan, kami tidak mengehadkan diri kami kepada semantik sedemikian, dan berikut ialah beberapa hipotesis yang berfungsi dengan baik pada data dalam runcit luar talian:

  1. Yang saya sudah beli sebelum ini.
  2. Sama seperti yang saya beli sebelum ini.
  3. Tempoh pembelian yang telah lama berlalu.
  4. Popular mengikut kategori/jenama.
  5. Pembelian ganti barangan berbeza dari minggu ke minggu (rantaian Markov).
  6. Produk yang serupa dengan pembeli, mengikut ciri yang dibina oleh model yang berbeza (Word2Vec, DSSM, dll.).

Apa yang anda beli sebelum ini?

Heuristik paling jelas yang berfungsi dengan baik dalam runcit runcit. Di sini kami mengambil semua barangan yang dibeli oleh pemegang kad kesetiaan dalam K hari terakhir (biasanya 1-3 minggu), atau K hari setahun yang lalu. Menggunakan kaedah ini sahaja, kami memperoleh metrik berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Di sini agak jelas bahawa semakin lama kita mengambil tempoh, semakin banyak ingatan yang kita ada dan semakin kurang ketepatan yang kita ada dan sebaliknya. Secara purata, "2 minggu lepas" memberikan hasil yang lebih baik untuk pelanggan.

Sama seperti yang saya beli sebelum ini

Tidak menghairankan bahawa untuk runcit runcit "apa yang saya beli sebelum ini" berfungsi dengan baik, tetapi mengekstrak calon hanya daripada apa yang telah dibeli oleh pengguna tidak begitu hebat, kerana ia tidak mungkin mengejutkan pembeli dengan beberapa produk baharu. Oleh itu, kami mencadangkan untuk menambah baik sedikit heuristik ini menggunakan model kolaboratif yang sama. Daripada vektor yang kami terima semasa latihan ALS, kami boleh mendapatkan produk yang serupa dengan produk yang telah dibeli oleh pengguna. Idea ini sangat serupa dengan "video serupa" dalam perkhidmatan untuk melihat kandungan video, tetapi kerana kami tidak tahu apa yang pengguna makan/beli pada masa tertentu, kami hanya boleh mencari yang serupa dengan apa yang telah dia beli, terutamanya kerana kita Kita sudah tahu sejauh mana ia berfungsi. Menggunakan kaedah ini pada transaksi pengguna sepanjang 2 minggu yang lalu, kami memperoleh metrik berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

ia adalah k β€” bilangan produk serupa yang diambil untuk setiap produk yang dibeli oleh pembeli sepanjang 14 hari yang lalu.
Pendekatan ini berkesan terutamanya untuk pelanggan kami, yang penting untuk tidak mengesyorkan apa-apa yang sudah ada dalam sejarah pembelian pengguna.

Tempoh pembelian lewat

Seperti yang telah kita ketahui, disebabkan kekerapan pembelian barangan yang tinggi, pendekatan pertama berfungsi dengan baik untuk keperluan khusus kita. Tetapi bagaimana pula dengan barangan seperti serbuk pencuci/syampu/dll. Iaitu, dengan produk yang tidak mungkin diperlukan setiap minggu atau dua dan kaedah sebelumnya tidak dapat mengekstrak. Ini membawa kepada idea berikut - adalah dicadangkan untuk mengira tempoh pembelian setiap produk secara purata untuk pelanggan yang membeli produk lebih banyak k sekali. Dan kemudian ekstrak apa yang pembeli kemungkinan besar telah kehabisan. Tempoh yang dikira untuk barangan boleh disemak dengan mata anda untuk kecukupan:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Dan kemudian kita akan melihat sama ada akhir tempoh produk jatuh dalam selang masa apabila pengesyoran akan berada dalam pengeluaran dan sampel apa yang berlaku. Pendekatan boleh digambarkan seperti ini:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Di sini kami mempunyai 2 kes utama yang boleh dipertimbangkan:

  1. Adakah perlu mengambil sampel produk daripada pelanggan yang telah membeli produk kurang daripada K kali.
  2. Adakah perlu mengambil sampel produk jika akhir tempohnya jatuh sebelum permulaan selang sasaran.

Graf berikut menunjukkan hasil yang dicapai oleh kaedah ini dengan hiperparameter yang berbeza:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
ft β€” Ambil hanya pelanggan yang telah membeli produk sekurang-kurangnya K (di sini K=5) kali
tm β€” Ambil hanya calon yang berada dalam selang sasaran

Tidak hairanlah dia mampu (0, 0) yang terbesar ingat dan yang terkecil ketepatan, memandangkan di bawah syarat ini kebanyakan calon diambil semula. Walau bagaimanapun, hasil terbaik dicapai apabila kami tidak mencuba produk untuk pelanggan yang membeli produk tertentu kurang daripada k masa dan ekstrak, termasuk barangan, yang akhir tempohnya jatuh sebelum selang sasaran.

Popular mengikut kategori

Idea lain yang agak jelas ialah mencuba produk popular merentas kategori atau jenama yang berbeza. Di sini kami mengira untuk setiap pembeli atas-k kategori/jenama "kegemaran" dan ekstrak "popular" daripada kategori/jenama ini. Dalam kes kami, kami akan menentukan "kegemaran" dan "popular" dengan bilangan pembelian produk. Kelebihan tambahan pendekatan ini ialah kebolehgunaannya dalam kes permulaan sejuk. Iaitu, untuk pelanggan yang sama ada membuat pembelian yang sangat sedikit, atau sudah lama tidak ke kedai, atau baru sahaja mengeluarkan kad kesetiaan. Bagi mereka, lebih mudah dan lebih baik untuk menyimpan barangan yang popular dengan pelanggan dan mempunyai sejarah. Metrik yang terhasil ialah:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
Di sini nombor selepas perkataan "kategori" bermaksud tahap sarang kategori.

Secara keseluruhannya, tidaklah menghairankan bahawa kategori yang lebih sempit mencapai hasil yang lebih baik, kerana mereka mengekstrak produk "kegemaran" yang lebih tepat untuk pembeli.

Pembelian ganti barangan berbeza dari minggu ke minggu

Pendekatan menarik yang saya tidak lihat dalam artikel mengenai sistem pengesyorkan adalah kaedah statistik rantai Markov yang agak mudah dan pada masa yang sama berfungsi. Di sini kami mengambil masa 2 minggu berbeza, kemudian untuk setiap pelanggan kami membina pasangan produk [dibeli dalam minggu i]-[dibeli dalam minggu j], di mana j > i, dan dari sini kami mengira untuk setiap produk kebarangkalian bertukar kepada produk lain minggu depan. Iaitu, untuk setiap pasangan barang produk-produkj Kami mengira bilangan mereka dalam pasangan yang ditemui dan membahagikan dengan bilangan pasangan, di mana produk berada pada minggu pertama. Untuk mengeluarkan calon, kami mengambil resit dan ekstrak terakhir pembeli atas-k kemungkinan besar produk seterusnya daripada matriks peralihan yang kami terima. Proses membina matriks peralihan kelihatan seperti ini:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Daripada contoh sebenar dalam matriks kebarangkalian peralihan kita melihat fenomena menarik berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
Di sini anda boleh melihat kebergantungan menarik yang didedahkan dalam tingkah laku pengguna: sebagai contoh, pencinta buah sitrus atau jenama susu yang mereka mungkin bertukar kepada yang lain. Ia juga tidak menghairankan bahawa produk dengan kekerapan pembelian berulang yang tinggi, seperti mentega, juga berakhir di sini.

Metrik dalam kaedah dengan rantai Markov adalah seperti berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
k β€” bilangan produk yang diambil untuk setiap produk yang dibeli daripada transaksi terakhir pembeli.
Seperti yang dapat kita lihat, hasil terbaik ditunjukkan oleh konfigurasi dengan k=4. Lonjakan pada minggu ke-4 boleh dijelaskan oleh tingkah laku bermusim sekitar cuti. 

Produk yang serupa dengan pembeli, mengikut ciri yang dibina oleh model yang berbeza

Kini kami telah sampai ke bahagian yang paling sukar dan menarik - mencari jiran terdekat berdasarkan vektor pelanggan dan produk yang dibina mengikut pelbagai model. Dalam kerja kami, kami menggunakan 3 model sedemikian:

  • ALS
  • Word2Vec (Item2Vec untuk tugasan sedemikian)
  • DSSM

Kami telah berurusan dengan ALS, anda boleh membaca tentang cara ia belajar di sini. Dalam kes Word2Vec, kami menggunakan pelaksanaan model yang terkenal daripada gensim. Dengan analogi dengan teks, kami mentakrifkan tawaran sebagai resit pembelian. Oleh itu, apabila membina vektor produk, model belajar untuk meramalkan untuk produk dalam resit "konteks"nya (selebihnya produk dalam resit). Dalam data e-dagang, lebih baik menggunakan sesi pembeli dan bukannya resit; lelaki dari ozon. Dan DSSM lebih menarik untuk dihuraikan. Pada mulanya, ia ditulis oleh lelaki dari Microsoft sebagai model untuk carian, Anda boleh membaca kertas penyelidikan asal di sini. Seni bina model kelihatan seperti ini:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

ia adalah Q β€” pertanyaan, pertanyaan carian pengguna, D[i] β€” dokumen, halaman internet. Input kepada model ialah atribut permintaan dan halaman, masing-masing. Selepas setiap lapisan input terdapat beberapa lapisan bersambung sepenuhnya (perceptron berbilang lapisan). Seterusnya, model belajar untuk meminimumkan kosinus antara vektor yang diperoleh dalam lapisan terakhir model.
Tugas pengesyoran menggunakan seni bina yang sama, hanya sebagai ganti permintaan terdapat pengguna, dan bukannya halaman terdapat produk. Dan dalam kes kami, seni bina ini diubah menjadi yang berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Sekarang, untuk menyemak keputusan, ia masih meliputi perkara terakhir - jika dalam kes ALS dan DSSM kami telah mentakrifkan vektor pengguna secara eksplisit, maka dalam kes Word2Vec kami hanya mempunyai vektor produk. Di sini, untuk membina vektor pengguna, kami telah menentukan 3 pendekatan utama:

  1. Hanya tambahkan vektor, kemudian untuk jarak kosinus ternyata kami hanya purata produk dalam sejarah pembelian.
  2. Penjumlahan vektor dengan beberapa pemberat masa.
  3. Menimbang barang dengan pekali TF-IDF.

Dalam kes pemberat linear vektor pembeli, kami meneruskan dari hipotesis bahawa produk yang dibeli oleh pengguna semalam mempunyai pengaruh yang lebih besar pada tingkah lakunya berbanding produk yang dibelinya enam bulan lalu. Oleh itu, kami menganggap minggu sebelumnya pembeli dengan kemungkinan 1, dan apa yang berlaku seterusnya dengan kemungkinan Β½, β…“, dsb.:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Untuk pekali TF-IDF, kami melakukan perkara yang sama seperti dalam TF-IDF untuk teks, hanya kami menganggap pembeli sebagai dokumen, dan cek sebagai tawaran, masing-masing, perkataan itu adalah produk. Dengan cara ini, vektor pengguna akan beralih lebih kepada barangan nadir, manakala barangan yang kerap dan biasa untuk pembeli tidak akan banyak mengubahnya. Pendekatan boleh digambarkan seperti ini:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Sekarang mari kita lihat metrik. Inilah rupa keputusan ALS:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
Metrik untuk Item2Vec dengan variasi yang berbeza untuk membina vektor pembeli:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
Dalam kes ini, model yang sama digunakan seperti dalam garis dasar kami. Cuma bezanya k yang akan kita gunakan. Untuk menggunakan model kolaboratif sahaja, anda perlu mengambil kira-kira 50-70 produk terdekat untuk setiap pelanggan.

Dan metrik mengikut DSSM:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Bagaimana untuk menggabungkan semua kaedah?

Sejuk, kata anda, tetapi apa yang perlu dilakukan dengan set alat pengekstrakan calon yang begitu besar? Bagaimana untuk memilih konfigurasi optimum untuk data anda? Di sini kita mempunyai beberapa masalah:

  1. Adalah perlu untuk mengehadkan ruang carian untuk hiperparameter dalam setiap kaedah. Ia, sudah tentu, diskret di mana-mana, tetapi bilangan mata yang mungkin adalah sangat besar.
  2. Menggunakan sampel terhad kecil kaedah khusus dengan hiperparameter khusus, bagaimana anda boleh memilih konfigurasi terbaik untuk metrik anda?

Kami masih belum menemui jawapan yang pasti betul kepada soalan pertama, jadi kami meneruskan daripada yang berikut: untuk setiap kaedah, pengehad ruang carian hiperparameter ditulis, bergantung pada beberapa statistik pada data yang kami ada. Oleh itu, mengetahui tempoh purata antara pembelian daripada orang, kita boleh meneka dengan tempoh apa untuk menggunakan kaedah "apa yang telah dibeli" dan "tempoh pembelian yang telah lama berlalu".

Dan selepas kami melalui beberapa variasi yang mencukupi bagi kaedah berbeza, kami perhatikan perkara berikut: setiap pelaksanaan mengekstrak bilangan calon tertentu dan mempunyai nilai tertentu metrik utama untuk kami (recall). Kami ingin mendapatkan sejumlah calon tertentu, bergantung pada kuasa pengkomputeran kami yang dibenarkan, dengan metrik tertinggi yang mungkin. Di sini masalah itu runtuh dengan indah ke dalam masalah beg galas.
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Di sini bilangan calon ialah berat jongkong, dan kaedah panggil semula ialah nilainya. Walau bagaimanapun, terdapat 2 lagi perkara yang perlu diambil kira semasa melaksanakan algoritma:

  • Kaedah mungkin mempunyai pertindihan dalam calon yang mereka dapatkan.
  • Dalam sesetengah kes, adalah betul untuk mengambil satu kaedah dua kali dengan parameter yang berbeza, dan output calon daripada yang pertama tidak akan menjadi subset kedua.

Sebagai contoh, jika kita mengambil pelaksanaan kaedah "apa yang saya telah beli" dengan selang masa yang berbeza untuk mendapatkan semula, maka set calon mereka akan bersarang di antara satu sama lain. Pada masa yang sama, parameter yang berbeza dalam "pembelian berkala" di pintu keluar tidak menyediakan persimpangan yang lengkap. Oleh itu, kami membahagikan pendekatan pensampelan dengan parameter berbeza ke dalam blok supaya daripada setiap blok kami ingin mengambil paling banyak satu pendekatan pengekstrakan dengan hiperparameter tertentu. Untuk melakukan ini, anda perlu sedikit bijak dalam melaksanakan masalah ransel, tetapi asimptotik dan hasilnya tidak akan berubah.

Gabungan pintar ini membolehkan kami mendapatkan metrik berikut berbanding dengan model kolaboratif semata-mata:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
Dalam metrik akhir kita melihat gambar berikut:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Walau bagaimanapun, di sini anda dapat melihat bahawa terdapat satu perkara yang tidak diketahui untuk pengesyoran yang berguna untuk perniagaan. Kini kami baru sahaja belajar cara melakukan kerja yang hebat untuk meramalkan perkara yang akan dibeli oleh pengguna, sebagai contoh, minggu depan. Tetapi hanya memberi diskaun pada sesuatu yang dia akan beli adalah tidak begitu hebat. Tetapi adalah bagus untuk memaksimumkan jangkaan, sebagai contoh, metrik berikut:

  1. Margin/perolehan berdasarkan cadangan peribadi.
  2. Cek pelanggan purata.
  3. Kekerapan lawatan.

Oleh itu, kami mendarabkan kebarangkalian yang diperolehi dengan pekali yang berbeza dan menyusunnya semula supaya produk yang mempengaruhi metrik di atas mendapat ke atas. Tiada penyelesaian siap sedia untuk pendekatan mana yang terbaik untuk digunakan. Kami juga bereksperimen dengan pekali sedemikian secara langsung dalam pengeluaran. Tetapi berikut adalah teknik menarik yang paling kerap memberi kita hasil terbaik:

  1. Darab dengan harga/margin produk.
  2. Darab dengan purata resit di mana produk muncul. Jadi barangan akan datang, yang biasanya mereka mengambil sesuatu yang lain.
  3. Darab dengan purata kekerapan lawatan oleh pembeli produk ini, berdasarkan hipotesis bahawa produk ini mencetuskan orang ramai untuk kembali membeli produk ini dengan lebih kerap.

Selepas menjalankan eksperimen dengan pekali, kami memperoleh metrik berikut dalam pengeluaran:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian
ia adalah penukaran produk keseluruhan β€” bahagian produk yang dibeli daripada semua produk dalam pengesyoran yang kami hasilkan.

Pembaca yang penuh perhatian akan melihat perbezaan yang ketara antara metrik luar talian dan dalam talian. Tingkah laku ini dijelaskan oleh fakta bahawa tidak semua penapis dinamik untuk produk yang boleh disyorkan boleh diambil kira semasa melatih model. Bagi kami, ini adalah cerita biasa apabila separuh daripada calon yang diambil boleh ditapis keluar; kekhususan ini adalah tipikal dalam industri kami.

Dari segi hasil, cerita berikut diperoleh, jelas bahawa selepas pelancaran pengesyoran, hasil kumpulan ujian berkembang dengan kukuh, kini purata peningkatan hasil dengan pengesyoran kami ialah 3-4%:
Cara kami telah meningkatkan kualiti pengesyoran secara mendadak dalam runcit luar talian

Sebagai kesimpulan, saya ingin mengatakan bahawa jika anda memerlukan pengesyoran bukan masa nyata, maka peningkatan yang sangat besar dalam kualiti boleh didapati dalam eksperimen dengan mengekstrak calon untuk pengesyoran. Sebilangan besar masa untuk generasi mereka memungkinkan untuk menggabungkan banyak kaedah yang baik, yang secara keseluruhan akan memberikan hasil yang hebat untuk perniagaan.

Saya akan gembira untuk berbual dalam komen dengan sesiapa sahaja yang mendapati bahan itu menarik. Anda boleh bertanya soalan kepada saya secara peribadi di telegram. Saya juga berkongsi pendapat saya tentang AI/permulaan dalam saya saluran telegram - selamat datang :)

Sumber: www.habr.com

Tambah komen