ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

அனைவருக்கும் வணக்கம்! எனது பெயர் சாஷா, நான் CTO & LoyaltyLab இன் இணை நிறுவனர். இரண்டு ஆண்டுகளுக்கு முன்பு, நானும் எனது நண்பர்களும், எல்லா ஏழை மாணவர்களைப் போலவே, மாலையில் எங்கள் வீட்டிற்கு அருகிலுள்ள கடையில் பீர் வாங்கச் சென்றோம். நாங்கள் பீருக்கு வருவோம் என்று தெரிந்தும் சில்லறை விற்பனையாளர் சிப்ஸ் அல்லது பட்டாசுகளுக்கு தள்ளுபடி வழங்காததால் நாங்கள் மிகவும் வருத்தப்பட்டோம், இது மிகவும் தர்க்கரீதியானது! இந்த நிலைமை ஏன் நடக்கிறது என்று எங்களுக்குப் புரியவில்லை, எங்கள் சொந்த நிறுவனத்தைத் தொடங்க முடிவு செய்தோம். சரி, போனஸாக, ஒவ்வொரு வெள்ளிக்கிழமையும் அதே சில்லுகளுக்கு நீங்களே தள்ளுபடிகளை வழங்குங்கள்.

ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

தயாரிப்பின் தொழில்நுட்பப் பக்கத்தில் உள்ள பொருளை நான் வழங்கும் நிலைக்கு இவை அனைத்தும் வந்துள்ளன என்விடியா ஜிடிசி. எங்கள் வேலையை சமூகத்துடன் பகிர்ந்து கொள்வதில் நாங்கள் மகிழ்ச்சியடைகிறோம், எனவே எனது அறிக்கையை ஒரு கட்டுரை வடிவில் வெளியிடுகிறேன்.

அறிமுகம்

பயணத்தின் தொடக்கத்தில் எல்லோரையும் போலவே, பரிந்துரை அமைப்புகள் எவ்வாறு உருவாக்கப்படுகின்றன என்பதைப் பற்றிய கண்ணோட்டத்துடன் தொடங்கினோம். மிகவும் பிரபலமான கட்டிடக்கலை பின்வரும் வகையாக மாறியது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இது இரண்டு பகுதிகளைக் கொண்டுள்ளது:

  1. எளிமையான மற்றும் வேகமான மாதிரியைப் பயன்படுத்தி, பொதுவாக ஒரு கூட்டுப்பணியைப் பயன்படுத்தி, பரிந்துரைகளுக்கான வேட்பாளர்களை மாதிரியாக்குதல்.
  2. தரவுகளில் சாத்தியமான அனைத்து அம்சங்களையும் கணக்கில் எடுத்துக்கொண்டு, மிகவும் சிக்கலான மற்றும் மெதுவான உள்ளடக்க மாதிரியைக் கொண்ட வேட்பாளர்களின் தரவரிசை.

இனி பின்வரும் விதிமுறைகளைப் பயன்படுத்துவேன்:

  • பரிந்துரைகளுக்கான வேட்பாளர்/வேட்பாளர் — தயாரிப்பில் உள்ள பரிந்துரைகளில் சேர்க்கப்படக்கூடிய ஒரு பயனர்-தயாரிப்பு ஜோடி.
  • வேட்பாளர்கள் பிரித்தெடுத்தல் / பிரித்தெடுத்தல் / வேட்பாளர் பிரித்தெடுத்தல் முறை — கிடைக்கக்கூடிய தரவுகளிலிருந்து "பரிந்துரைக்கான வேட்பாளர்களை" பிரித்தெடுப்பதற்கான ஒரு செயல்முறை அல்லது முறை.

முதல் படி பொதுவாக கூட்டு வடிகட்டலின் வெவ்வேறு மாறுபாடுகளைப் பயன்படுத்துகிறது. மிகவும் பிரபலமான - ஏ.எல்.எஸ். பரிந்துரை அமைப்புகளைப் பற்றிய பெரும்பாலான கட்டுரைகள் முதல் கட்டத்தில் கூட்டு மாதிரிகளில் பல்வேறு மேம்பாடுகளை வெளிப்படுத்துவது ஆச்சரியமாக இருக்கிறது, ஆனால் மற்ற மாதிரி முறைகளைப் பற்றி யாரும் அதிகம் பேசுவதில்லை. எங்களைப் பொறுத்தவரை, கூட்டு மாதிரிகள் மற்றும் அவற்றுடன் பல்வேறு மேம்படுத்தல்களை மட்டுமே பயன்படுத்துவதற்கான அணுகுமுறை நாங்கள் எதிர்பார்த்த தரத்துடன் வேலை செய்யவில்லை, எனவே இந்த பகுதியில் குறிப்பாக ஆராய்ச்சியில் தோண்டினோம். கட்டுரையின் முடிவில், எங்களின் அடிப்படையான ALS ஐ எவ்வளவு மேம்படுத்த முடிந்தது என்பதைக் காண்பிப்பேன்.

எங்கள் அணுகுமுறையை விவரிப்பதற்கு முன், நிகழ்நேரப் பரிந்துரைகளில், 30 நிமிடங்களுக்கு முன்பு நிகழ்ந்த தரவைக் கணக்கில் எடுத்துக்கொள்வது நமக்கு முக்கியமானதாக இருக்கும்போது, ​​தேவையான நேரத்தில் வேலை செய்யக்கூடிய பல அணுகுமுறைகள் உண்மையில் இல்லை என்பதைக் கவனத்தில் கொள்ள வேண்டும். ஆனால், எங்கள் விஷயத்தில், நாங்கள் ஒரு நாளைக்கு ஒரு முறைக்கு மேல் பரிந்துரைகளை சேகரிக்க வேண்டும், பெரும்பாலான சந்தர்ப்பங்களில் - வாரத்திற்கு ஒரு முறை, இது சிக்கலான மாதிரிகளைப் பயன்படுத்துவதற்கும் தரத்தை பல மடங்கு மேம்படுத்துவதற்கும் எங்களுக்கு வாய்ப்பளிக்கிறது.

வேட்பாளர்களைப் பிரித்தெடுக்கும் பணியில் ALS மட்டும் என்ன அளவீடுகளைக் காட்டுகிறது என்பதை அடிப்படையாக எடுத்துக்கொள்வோம். நாங்கள் கண்காணிக்கும் முக்கிய அளவீடுகள்:

  • துல்லியம் - மாதிரியில் இருந்து சரியாக தேர்ந்தெடுக்கப்பட்ட வேட்பாளர்களின் விகிதம்.
  • ரீகால் என்பது உண்மையில் இலக்கு இடைவெளியில் இருந்த வேட்பாளர்களின் விகிதமாகும்.
  • F1-ஸ்கோர் - F-அளவீடு முந்தைய இரண்டு புள்ளிகளில் கணக்கிடப்பட்டது.

கூடுதல் உள்ளடக்க அம்சங்களுடன் சாய்வு அதிகரிப்பு பயிற்சிக்குப் பிறகு இறுதி மாதிரியின் அளவீடுகளையும் பார்ப்போம். இங்கே 3 முக்கிய அளவீடுகளும் உள்ளன:

  • துல்லியமான @5 - ஒவ்வொரு வாங்குபவருக்கும் நிகழ்தகவு அடிப்படையில் முதல் 5 தயாரிப்புகளின் சராசரி சதவீதம்.
  • response-rate@5 - வாடிக்கையாளர்களை கடைக்குச் சென்றதிலிருந்து குறைந்தபட்சம் ஒரு தனிப்பட்ட சலுகையை வாங்குவதற்கு மாற்றுதல் (ஒரு சலுகையில் 5 தயாரிப்புகள்).
  • ஒரு பயனருக்கு சராசரி roc-auc - சராசரி roc-auc ஒவ்வொரு வாங்குபவருக்கும்.

இந்த அளவீடுகள் அனைத்தும் அளவிடப்படுகின்றன என்பதை கவனத்தில் கொள்ள வேண்டும் நேர-தொடர் குறுக்கு சரிபார்ப்பு, அதாவது, முதல் k வாரங்களில் பயிற்சி நிகழ்கிறது, மேலும் k+1 வாரம் சோதனைத் தரவாக எடுத்துக் கொள்ளப்படுகிறது. இதனால், பருவகால ஏற்ற தாழ்வுகள் மாதிரிகளின் தரத்தின் விளக்கத்தில் குறைந்த தாக்கத்தை ஏற்படுத்தியது. மேலும் அனைத்து வரைபடங்களிலும், abscissa அச்சு குறுக்கு சரிபார்ப்பில் வார எண்ணைக் குறிக்கும், மேலும் ஆர்டினேட் அச்சு குறிப்பிட்ட அளவீட்டின் மதிப்பைக் குறிக்கும். அனைத்து வரைபடங்களும் ஒரு கிளையண்டின் பரிவர்த்தனை தரவை அடிப்படையாகக் கொண்டவை, இதனால் ஒருவருக்கொருவர் ஒப்பிடுவது சரியாக இருக்கும்.

எங்கள் அணுகுமுறையை விவரிக்கத் தொடங்கும் முன், முதலில் ALS-பயிற்சி பெற்ற மாதிரியான அடிப்படையைப் பார்க்கிறோம்.
வேட்பாளர் மீட்டெடுப்பு அளவீடுகள்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இறுதி அளவீடுகள்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

அல்காரிதம்களின் அனைத்து செயலாக்கங்களையும் ஒருவித வணிகக் கருதுகோளாக நான் கருதுகிறேன். எனவே, மிகவும் தோராயமாக, எந்தவொரு கூட்டு மாதிரியும் "அவர்களைப் போன்றவர்கள் வாங்குவதை மக்கள் வாங்க முனைகிறார்கள்" என்ற கருதுகோளாகக் கருதலாம். நான் ஏற்கனவே கூறியது போல், இதுபோன்ற சொற்பொருள்களுக்கு நாங்கள் நம்மை கட்டுப்படுத்திக் கொள்ளவில்லை, மேலும் ஆஃப்லைன் சில்லறை விற்பனையில் தரவுகளில் சிறப்பாக செயல்படும் சில கருதுகோள்கள் இங்கே:

  1. நான் ஏற்கனவே வாங்கியது.
  2. நான் முன்பு வாங்கியதைப் போன்றது.
  3. நீண்ட கடந்த கொள்முதல் காலம்.
  4. வகை/பிராண்டு அடிப்படையில் பிரபலமானது.
  5. வாரம் முதல் வாரம் வெவ்வேறு பொருட்களின் மாற்று கொள்முதல் (மார்கோவ் சங்கிலிகள்).
  6. வெவ்வேறு மாடல்களால் (Word2Vec, DSSM, முதலியன) கட்டமைக்கப்பட்ட பண்புகளின்படி, வாங்குபவர்களுக்கு ஒத்த தயாரிப்புகள்.

நீங்கள் முன்பு என்ன வாங்கினீர்கள்?

மளிகை சில்லறை விற்பனையில் நன்றாக வேலை செய்யும் மிகவும் வெளிப்படையான ஹூரிஸ்டிக். லாயல்டி கார்டு வைத்திருப்பவர் கடந்த K நாட்களில் (பொதுவாக 1-3 வாரங்கள்) அல்லது ஒரு வருடத்திற்கு முன்பு K நாட்களில் வாங்கிய அனைத்துப் பொருட்களையும் இங்கே எடுத்துக்கொள்கிறோம். இந்த முறையைப் பயன்படுத்துவதன் மூலம், பின்வரும் அளவீடுகளைப் பெறுகிறோம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

நாம் எவ்வளவு காலம் காலத்தை எடுத்துக்கொள்கிறோமோ, அவ்வளவு அதிகமாக நினைவுபடுத்துவதும், குறைவான துல்லியமும் நம்மிடம் உள்ளது என்பதும் இங்கே தெளிவாகத் தெரிகிறது. சராசரியாக, "கடந்த 2 வாரங்கள்" வாடிக்கையாளர்களுக்கு சிறந்த முடிவுகளை அளிக்கிறது.

நான் முன்பு வாங்கியதைப் போன்றது

மளிகை சில்லறை விற்பனைக்கு “நான் முன்பு வாங்கியது” நன்றாக வேலை செய்வதில் ஆச்சரியமில்லை, ஆனால் பயனர் ஏற்கனவே வாங்கியவற்றிலிருந்து மட்டுமே வேட்பாளர்களைப் பிரித்தெடுப்பது மிகவும் அருமையாக இல்லை, ஏனெனில் சில புதிய தயாரிப்புகளுடன் வாங்குபவரை ஆச்சரியப்படுத்த வாய்ப்பில்லை. எனவே, அதே கூட்டு மாதிரிகளைப் பயன்படுத்தி இந்த ஹூரிஸ்டிக்கை சற்று மேம்படுத்த நாங்கள் முன்மொழிகிறோம். ALS பயிற்சியின் போது நாங்கள் பெற்ற திசையன்களிலிருந்து, பயனர் ஏற்கனவே வாங்கியதைப் போன்ற தயாரிப்புகளைப் பெறலாம். இந்த யோசனை வீடியோ உள்ளடக்கத்தைப் பார்ப்பதற்கான சேவைகளில் உள்ள "ஒத்த வீடியோக்கள்" போலவே உள்ளது, ஆனால் பயனர் ஒரு குறிப்பிட்ட நேரத்தில் என்ன சாப்பிடுகிறார்/வாங்குகிறார் என்பது எங்களுக்குத் தெரியாததால், அவர் ஏற்கனவே வாங்கியதைப் போன்றவற்றை மட்டுமே நாம் தேட முடியும், குறிப்பாக. ஏனெனில் இது எவ்வளவு நன்றாக வேலை செய்கிறது என்பதை நாங்கள் ஏற்கனவே அறிவோம். கடந்த 2 வாரங்களில் பயனர் பரிவர்த்தனைகளில் இந்த முறையைப் பயன்படுத்துவதன் மூலம், பின்வரும் அளவீடுகளைப் பெறுகிறோம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இது k - கடந்த 14 நாட்களில் வாங்குபவர் வாங்கிய ஒவ்வொரு தயாரிப்புக்கும் ஒரே மாதிரியான தயாரிப்புகளின் எண்ணிக்கை.
இந்த அணுகுமுறை எங்கள் வாடிக்கையாளருக்கு சிறப்பாகச் செயல்பட்டது, பயனரின் கொள்முதல் வரலாற்றில் ஏற்கனவே உள்ள எதையும் பரிந்துரைக்காதது மிகவும் முக்கியமானது.

தாமதமான கொள்முதல் காலம்

நாங்கள் ஏற்கனவே கண்டுபிடித்தபடி, பொருட்களை வாங்குவதற்கான அதிக அதிர்வெண் காரணமாக, முதல் அணுகுமுறை எங்கள் குறிப்பிட்ட தேவைகளுக்கு நன்றாக வேலை செய்கிறது. ஆனால் வாஷிங் பவுடர் / ஷாம்பு / போன்ற பொருட்கள் பற்றி என்ன. அதாவது, ஒவ்வொரு வாரமும் அல்லது இரண்டு வாரமும் தேவையில்லாத தயாரிப்புகளுடன், முந்தைய முறைகள் பிரித்தெடுக்க முடியாது. இது பின்வரும் யோசனைக்கு இட்டுச் செல்கிறது - ஒவ்வொரு பொருளையும் அதிகமாக வாங்கிய வாடிக்கையாளர்களுக்கு சராசரியாக ஒவ்வொரு தயாரிப்பு வாங்கும் காலத்தையும் கணக்கிட முன்மொழியப்பட்டது. k ஒருமுறை. பின்னர் வாங்குபவர் ஏற்கனவே முடிந்துவிட்டதைப் பிரித்தெடுக்கவும். பொருட்களுக்கான கணக்கிடப்பட்ட காலங்கள் போதுமானதாக உங்கள் கண்களால் சரிபார்க்கப்படலாம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

பின்னர் தயாரிப்புக் காலத்தின் முடிவு, பரிந்துரைகள் தயாரிப்பில் இருக்கும் கால இடைவெளியில் வருமா என்பதைப் பார்த்து, என்ன நடக்கிறது என்பதைப் பார்ப்போம். அணுகுமுறையை இவ்வாறு விளக்கலாம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இங்கே நாம் கருத்தில் கொள்ளக்கூடிய 2 முக்கிய வழக்குகள் உள்ளன:

  1. K மடங்குக்கு குறைவாக தயாரிப்பு வாங்கிய வாடிக்கையாளர்களிடமிருந்து தயாரிப்புகளை மாதிரி செய்வது அவசியமா.
  2. ஒரு பொருளின் காலத்தின் முடிவு இலக்கு இடைவெளியின் தொடக்கத்திற்கு முன் விழுந்தால் அதை மாதிரி செய்வது அவசியமா?

பின்வரும் வரைபடம் பல்வேறு ஹைபர்பாராமீட்டர்களுடன் இந்த முறை என்ன முடிவுகளை அடைகிறது என்பதைக் காட்டுகிறது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
ft - குறைந்தபட்சம் K (இங்கே K=5) முறை தயாரிப்பு வாங்கிய வாடிக்கையாளர்களை மட்டும் எடுத்துக் கொள்ளுங்கள்
tm - இலக்கு இடைவெளிக்குள் வரும் வேட்பாளர்களை மட்டும் எடுத்துக் கொள்ளுங்கள்

அவரால் முடியும் என்பதில் ஆச்சரியமில்லை (0, 0) மிகப்பெரியது நினைவுகூர்வது மற்றும் சிறியது துல்லிய, இந்த நிபந்தனையின் கீழ் பெரும்பாலான வேட்பாளர்கள் மீட்டெடுக்கப்படுகின்றனர். எவ்வாறாயினும், ஒரு குறிப்பிட்ட தயாரிப்பை குறைவாக வாங்கிய வாடிக்கையாளர்களுக்கு நாங்கள் தயாரிப்புகளை மாதிரி செய்யாதபோது சிறந்த முடிவுகளை அடைய முடியும் k பொருட்கள் உட்பட நேரங்கள் மற்றும் சாறு, இலக்கு இடைவெளிக்கு முன் வரும் காலத்தின் முடிவு.

வகை வாரியாக பிரபலமானது

வெவ்வேறு வகைகள் அல்லது பிராண்டுகளில் பிரபலமான தயாரிப்புகளை மாதிரியாக்குவது மற்றொரு தெளிவான யோசனையாகும். இங்கே நாம் ஒவ்வொரு வாங்குபவருக்கும் கணக்கிடுகிறோம் மேல்-k "பிடித்த" வகைகள்/பிராண்டுகள் மற்றும் இந்த வகை/பிராண்டிலிருந்து "பிரபலமானவை" பிரித்தெடுக்கவும். எங்கள் விஷயத்தில், தயாரிப்பின் கொள்முதல் எண்ணிக்கையால் "பிடித்த" மற்றும் "பிரபலமானவை" என்பதை நாங்கள் தீர்மானிப்போம். இந்த அணுகுமுறையின் கூடுதல் நன்மை குளிர் தொடக்க வழக்கில் அதன் பொருந்தக்கூடியது. அதாவது, மிகக் குறைவான கொள்முதல் செய்த, அல்லது நீண்ட காலமாக கடைக்குச் செல்லாத அல்லது லாயல்டி கார்டை வழங்கிய வாடிக்கையாளர்களுக்கு. அவர்களுக்கு, வாடிக்கையாளர்களிடையே பிரபலமான மற்றும் வரலாற்றைக் கொண்ட பொருட்களை சேமித்து வைப்பது எளிதானது மற்றும் சிறந்தது. இதன் விளைவாக வரும் அளவீடுகள்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
இங்கே "வகை" என்ற சொல்லுக்குப் பின் வரும் எண் வகையின் கூடு கட்டும் நிலை என்று பொருள்.

ஒட்டுமொத்தமாக, குறுகிய பிரிவுகள் சிறந்த முடிவுகளை அடைவதில் ஆச்சரியமில்லை, ஏனெனில் அவை கடைக்காரர்களுக்கு மிகவும் துல்லியமான "பிடித்த" தயாரிப்புகளைப் பிரித்தெடுக்கின்றன.

வாரத்திற்கு வாரம் வெவ்வேறு பொருட்களின் மாற்று கொள்முதல்

பரிந்துரை அமைப்புகளைப் பற்றிய கட்டுரைகளில் நான் காணாத ஒரு சுவாரஸ்யமான அணுகுமுறை மிகவும் எளிமையானது மற்றும் அதே நேரத்தில் மார்கோவ் சங்கிலிகளின் புள்ளிவிவர முறை ஆகும். இங்கே நாங்கள் 2 வெவ்வேறு வாரங்களை எடுத்துக்கொள்கிறோம், பின்னர் ஒவ்வொரு வாடிக்கையாளருக்கும் நாங்கள் ஜோடி தயாரிப்புகளை உருவாக்குகிறோம் [வாரத்தில் i வாங்கியது]-[வாரத்தில் j வாங்கியது], இங்கு j > i, இங்கிருந்து ஒவ்வொரு தயாரிப்புக்கும் அடுத்த வாரம் மற்றொரு தயாரிப்புக்கு மாறுவதற்கான நிகழ்தகவைக் கணக்கிடுகிறோம். அதாவது, ஒவ்வொரு ஜோடி பொருட்களுக்கும் தயாரிப்பு-தயாரிப்பு கண்டுபிடிக்கப்பட்ட ஜோடிகளில் அவற்றின் எண்ணிக்கையை எண்ணி, ஜோடிகளின் எண்ணிக்கையால் வகுக்கிறோம் தயாரிப்புகள் முதல் வாரத்தில் இருந்தது. வேட்பாளர்களைப் பிரித்தெடுக்க, வாங்குபவரின் கடைசி ரசீதை எடுத்து பிரித்தெடுக்கிறோம் மேல்-k நாங்கள் பெற்ற மாற்றம் மேட்ரிக்ஸின் அடுத்த தயாரிப்புகள். ஒரு மாற்றம் மேட்ரிக்ஸை உருவாக்கும் செயல்முறை இதுபோல் தெரிகிறது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

மாற்றம் நிகழ்தகவு மேட்ரிக்ஸில் உள்ள உண்மையான எடுத்துக்காட்டுகளிலிருந்து பின்வரும் சுவாரஸ்யமான நிகழ்வுகளைக் காண்கிறோம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
நுகர்வோர் நடத்தையில் வெளிப்படுத்தப்படும் சுவாரஸ்யமான சார்புகளை இங்கே நீங்கள் கவனிக்கலாம்: எடுத்துக்காட்டாக, சிட்ரஸ் பழங்களை விரும்புவோர் அல்லது பால் ஒரு பிராண்டில் இருந்து அவர்கள் மற்றொன்றுக்கு மாற வாய்ப்புள்ளது. வெண்ணெய் போன்ற அதிக அதிர்வெண் கொண்ட தயாரிப்புகள் மீண்டும் மீண்டும் வாங்குவதில் ஆச்சரியமில்லை.

மார்கோவ் சங்கிலிகள் கொண்ட முறையின் அளவீடுகள் பின்வருமாறு:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
k - வாங்குபவரின் கடைசி பரிவர்த்தனையிலிருந்து வாங்கிய ஒவ்வொரு தயாரிப்புக்கும் பெறப்பட்ட தயாரிப்புகளின் எண்ணிக்கை.
நாம் பார்க்கிறபடி, k=4 உடன் உள்ளமைவு மூலம் சிறந்த முடிவு காட்டப்படுகிறது. 4வது வாரத்தின் அதிகரிப்பு விடுமுறை நாட்களில் பருவகால நடத்தை மூலம் விளக்கப்படலாம். 

வெவ்வேறு மாடல்களால் கட்டப்பட்ட குணாதிசயங்களின்படி, வாங்குபவர்களுக்கு ஒத்த தயாரிப்புகள்

இப்போது நாங்கள் மிகவும் கடினமான மற்றும் சுவாரஸ்யமான பகுதிக்கு வந்துள்ளோம் - வாடிக்கையாளர்களின் திசையன்கள் மற்றும் பல்வேறு மாதிரிகளின்படி கட்டப்பட்ட தயாரிப்புகளின் அடிப்படையில் அருகிலுள்ள அண்டை நாடுகளைத் தேடுகிறோம். எங்கள் வேலையில் இதுபோன்ற 3 மாதிரிகளைப் பயன்படுத்துகிறோம்:

  • ஏ.எல்.எஸ்
  • Word2Vec (அத்தகைய பணிகளுக்கான Item2Vec)
  • டி.எஸ்.எஸ்.எம்

நாங்கள் ஏற்கனவே ALS உடன் கையாண்டுள்ளோம், அது எவ்வாறு கற்றுக்கொள்கிறது என்பதைப் பற்றி நீங்கள் படிக்கலாம் இங்கே. Word2Vec இன் விஷயத்தில், மாதிரியின் நன்கு அறியப்பட்ட செயலாக்கத்தைப் பயன்படுத்துகிறோம் ஜென்சிம். உரைகளுடன் ஒப்பிடுவதன் மூலம், சலுகையை கொள்முதல் ரசீது என வரையறுக்கிறோம். இவ்வாறு, ஒரு தயாரிப்பு திசையன் கட்டமைக்கும்போது, ​​மாதிரியானது ரசீதில் உள்ள தயாரிப்பை அதன் "சூழல்" (ரசீதில் மீதமுள்ள தயாரிப்புகள்) கணிக்க கற்றுக்கொள்கிறது. இணையவழி தரவுகளில், ரசீதுக்குப் பதிலாக வாங்குபவரின் அமர்வைப் பயன்படுத்துவது நல்லது. ஓசோனும். மற்றும் DSSM பாகுபடுத்த மிகவும் சுவாரஸ்யமானது. ஆரம்பத்தில், இது தேடலுக்கான மாதிரியாக மைக்ரோசாப்ட் தோழர்களால் எழுதப்பட்டது, அசல் ஆய்வுக் கட்டுரையை இங்கே படிக்கலாம். மாதிரியின் கட்டமைப்பு இதுபோல் தெரிகிறது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இது Q — வினவல், பயனர் தேடல் வினவல், D[i] - ஆவணம், இணையப் பக்கம். மாதிரிக்கான உள்ளீடு முறையே கோரிக்கை மற்றும் பக்கங்களின் பண்புகளாகும். ஒவ்வொரு உள்ளீட்டு அடுக்குக்குப் பிறகும் முழுமையாக இணைக்கப்பட்ட பல அடுக்குகள் (மல்டிலேயர் பெர்செப்ட்ரான்) உள்ளன. அடுத்து, மாதிரியின் கடைசி அடுக்குகளில் பெறப்பட்ட திசையன்களுக்கு இடையே உள்ள கொசைனைக் குறைக்க மாதிரி கற்றுக்கொள்கிறது.
பரிந்துரைப் பணிகள் அதே கட்டமைப்பைப் பயன்படுத்துகின்றன, கோரிக்கைக்கு பதிலாக ஒரு பயனர் மட்டுமே இருக்கிறார், பக்கங்களுக்குப் பதிலாக தயாரிப்புகள் உள்ளன. எங்கள் விஷயத்தில், இந்த கட்டிடக்கலை பின்வருமாறு மாற்றப்படுகிறது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இப்போது, ​​​​முடிவுகளைச் சரிபார்க்க, இது கடைசி புள்ளியை உள்ளடக்கியது - ALS மற்றும் DSSM விஷயத்தில் நாம் பயனர் திசையன்களை வெளிப்படையாக வரையறுத்திருந்தால், Word2Vec விஷயத்தில் எங்களிடம் தயாரிப்பு திசையன்கள் மட்டுமே உள்ளன. இங்கே, பயனர் வெக்டரை உருவாக்க, நாங்கள் 3 முக்கிய அணுகுமுறைகளை வரையறுத்துள்ளோம்:

  1. வெக்டார்களைச் சேர்த்தால் போதும், கொசைன் தூரத்தைப் பொறுத்தவரை, வாங்குதல் வரலாற்றில் தயாரிப்புகளை நாங்கள் சராசரியாகக் கொண்டுள்ளோம்.
  2. வெக்டார் கூட்டுத்தொகை சில நேர எடையுடன்.
  3. TF-IDF குணகம் கொண்ட பொருட்களை எடைபோடுதல்.

வாங்குபவரின் திசையன் நேரியல் எடையைப் பொறுத்தவரை, பயனர் ஆறு மாதங்களுக்கு முன்பு வாங்கிய தயாரிப்பை விட நேற்று வாங்கிய தயாரிப்பு அவரது நடத்தையில் அதிக தாக்கத்தை ஏற்படுத்துகிறது என்ற கருதுகோளிலிருந்து நாங்கள் தொடர்கிறோம். எனவே வாங்குபவரின் முந்தைய வாரத்தை 1 இன் முரண்பாடுகளுடன் நாங்கள் கருதுகிறோம், மேலும் ½, ⅓ போன்றவற்றின் முரண்பாடுகளுடன் அடுத்து என்ன நடந்தது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

TF-IDF குணகங்களுக்கு, TF-IDF இல் உள்ளதைப் போலவே உரைகளையும் செய்கிறோம், வாங்குபவரை ஒரு ஆவணமாகவும், காசோலையை ஒரு சலுகையாகவும் மட்டுமே நாங்கள் கருதுகிறோம், இந்த வார்த்தை ஒரு தயாரிப்பு. இந்த வழியில், பயனரின் திசையன் அரிதான பொருட்களை நோக்கி அதிகமாக மாறும், அதே நேரத்தில் வாங்குபவருக்கு அடிக்கடி மற்றும் பழக்கமான பொருட்கள் அதை பெரிதாக மாற்றாது. அணுகுமுறையை இவ்வாறு விளக்கலாம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இப்போது அளவீடுகளைப் பார்ப்போம். ALS முடிவுகள் இப்படித்தான் இருக்கும்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
வாங்குபவர் வெக்டரை உருவாக்கும் பல்வேறு மாறுபாடுகளுடன் Item2Vec க்கான அளவீடுகள்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
இந்த வழக்கில், எங்கள் அடிப்படையைப் போலவே அதே மாதிரி பயன்படுத்தப்படுகிறது. எந்த k ஐப் பயன்படுத்துவோம் என்பதுதான் வித்தியாசம். கூட்டு மாதிரிகளை மட்டுமே பயன்படுத்த, ஒவ்வொரு வாடிக்கையாளருக்கும் 50-70 நெருங்கிய தயாரிப்புகளை நீங்கள் எடுக்க வேண்டும்.

மற்றும் DSSM படி அளவீடுகள்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

அனைத்து முறைகளையும் எவ்வாறு இணைப்பது?

அருமை, நீங்கள் சொல்கிறீர்கள், ஆனால் இவ்வளவு பெரிய வேட்பாளர் பிரித்தெடுக்கும் கருவிகளை என்ன செய்வது? உங்கள் தரவுக்கான உகந்த உள்ளமைவை எவ்வாறு தேர்வு செய்வது? இங்கே எங்களுக்கு பல சிக்கல்கள் உள்ளன:

  1. ஒவ்வொரு முறையிலும் ஹைப்பர் பாராமீட்டர்களுக்கான தேடல் இடத்தை எப்படியாவது கட்டுப்படுத்துவது அவசியம். இது, நிச்சயமாக, எல்லா இடங்களிலும் தனித்துவமானது, ஆனால் சாத்தியமான புள்ளிகளின் எண்ணிக்கை மிகப் பெரியது.
  2. குறிப்பிட்ட ஹைப்பர் பாராமீட்டர்களுடன் குறிப்பிட்ட முறைகளின் சிறிய வரையறுக்கப்பட்ட மாதிரியைப் பயன்படுத்தி, உங்கள் மெட்ரிக்கிற்கான சிறந்த உள்ளமைவை எவ்வாறு தேர்ந்தெடுக்கலாம்?

முதல் கேள்விக்கான சரியான பதிலை நாங்கள் இன்னும் கண்டுபிடிக்கவில்லை, எனவே நாங்கள் பின்வருவனவற்றிலிருந்து தொடர்கிறோம்: ஒவ்வொரு முறைக்கும், எங்களிடம் உள்ள தரவுகளின் சில புள்ளிவிவரங்களைப் பொறுத்து, ஒரு ஹைபர்பாராமீட்டர் தேடல் இடைவெளி வரம்பு எழுதப்படுகிறது. எனவே, மக்களிடமிருந்து வாங்குதல்களுக்கு இடையிலான சராசரி காலத்தை அறிந்து, "ஏற்கனவே வாங்கப்பட்டவை" மற்றும் "நீண்ட கடந்த கொள்முதல் காலம்" முறையைப் பயன்படுத்த எந்தக் காலக்கட்டத்தில் நாம் யூகிக்க முடியும்.

வெவ்வேறு முறைகளின் குறிப்பிட்ட போதுமான எண்ணிக்கையிலான மாறுபாடுகளை நாங்கள் கடந்து சென்ற பிறகு, பின்வருவனவற்றை நாங்கள் கவனிக்கிறோம்: ஒவ்வொரு செயலாக்கமும் ஒரு குறிப்பிட்ட எண்ணிக்கையிலான வேட்பாளர்களைப் பிரித்தெடுக்கிறது மற்றும் நமக்கான முக்கிய அளவீட்டின் ஒரு குறிப்பிட்ட மதிப்பைக் கொண்டுள்ளது (நினைவூட்டல்). சாத்தியமான அதிகபட்ச அளவீட்டைக் கொண்டு, எங்களின் அனுமதிக்கக்கூடிய கம்ப்யூட்டிங் சக்தியைப் பொறுத்து, குறிப்பிட்ட எண்ணிக்கையிலான வேட்பாளர்களைப் பெற விரும்புகிறோம். இங்கே பிரச்சனை அழகாக பேக் பேக் பிரச்சனையில் சரிகிறது.
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இங்கே வேட்பாளர்களின் எண்ணிக்கை என்பது இங்காட்டின் எடை, மற்றும் திரும்ப அழைக்கும் முறை அதன் மதிப்பு. இருப்பினும், அல்காரிதத்தை செயல்படுத்தும்போது கணக்கில் எடுத்துக்கொள்ள வேண்டிய மேலும் 2 புள்ளிகள் உள்ளன:

  • அவர்கள் மீட்டெடுக்கும் வேட்பாளர்களில் முறைகள் ஒன்றுடன் ஒன்று இருக்கலாம்.
  • சில சந்தர்ப்பங்களில், வெவ்வேறு அளவுருக்களுடன் ஒரு முறையை இரண்டு முறை எடுத்துக்கொள்வது சரியாக இருக்கும், மேலும் முதல் வேட்பாளர் வெளியீடு இரண்டாவது துணைக்குழுவாக இருக்காது.

எடுத்துக்காட்டாக, மீட்டெடுப்பதற்கு வெவ்வேறு இடைவெளிகளுடன் "நான் ஏற்கனவே வாங்கியவை" முறையைச் செயல்படுத்தினால், அவர்களின் வேட்பாளர்களின் தொகுப்புகள் ஒருவருக்கொருவர் உள்ளமைக்கப்படும். அதே நேரத்தில், வெளியேறும் இடத்தில் "அவ்வப்போது வாங்குதல்களில்" வெவ்வேறு அளவுருக்கள் முழுமையான குறுக்குவெட்டை வழங்காது. எனவே, வெவ்வேறு அளவுருக்கள் கொண்ட மாதிரி அணுகுமுறைகளை தொகுதிகளாகப் பிரிக்கிறோம், அதாவது ஒவ்வொரு தொகுதியிலிருந்தும் குறிப்பிட்ட ஹைப்பர் பாராமீட்டர்களுடன் அதிகபட்சம் ஒரு பிரித்தெடுக்கும் அணுகுமுறையை எடுக்க வேண்டும். இதைச் செய்ய, நாப்சாக் சிக்கலைச் செயல்படுத்துவதில் நீங்கள் கொஞ்சம் புத்திசாலித்தனமாக இருக்க வேண்டும், ஆனால் அசிம்டோடிக்ஸ் மற்றும் விளைவு மாறாது.

இந்த ஸ்மார்ட் கலவையானது, எளிமையான கூட்டு மாதிரிகளுடன் ஒப்பிடுகையில் பின்வரும் அளவீடுகளைப் பெற அனுமதிக்கிறது:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
இறுதி அளவீடுகளில் நாம் பின்வரும் படத்தைப் பார்க்கிறோம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

இருப்பினும், வணிகத்திற்கு பயனுள்ள பரிந்துரைகளுக்கு ஒரு வெளிப்படுத்தப்படாத புள்ளி இருப்பதை இங்கே நீங்கள் கவனிக்கலாம். பயனர் என்ன வாங்குவார் என்று கணிக்கும் ஒரு சிறந்த வேலையை எப்படி செய்வது என்று இப்போது கற்றுக்கொண்டோம், உதாரணமாக, அடுத்த வாரம். ஆனால் அவர் ஏற்கனவே வாங்கும் பொருளுக்கு தள்ளுபடி வழங்குவது மிகவும் அருமையாக இல்லை. ஆனால் எதிர்பார்ப்பை அதிகரிப்பது அருமையாக இருக்கிறது, எடுத்துக்காட்டாக, பின்வரும் அளவீடுகள்:

  1. தனிப்பட்ட பரிந்துரைகளின் அடிப்படையில் வரம்பு/விற்றுமுதல்.
  2. சராசரி வாடிக்கையாளர் சோதனை.
  3. வருகைகளின் அதிர்வெண்.

எனவே, பெறப்பட்ட நிகழ்தகவுகளை வெவ்வேறு குணகங்களால் பெருக்கி அவற்றை மறுவரிசைப்படுத்துகிறோம், இதனால் மேலே உள்ள அளவீடுகளைப் பாதிக்கும் தயாரிப்புகள் மேலே வரும். எந்த அணுகுமுறையைப் பயன்படுத்துவது சிறந்தது என்பதற்கு ஆயத்த தீர்வு எதுவும் இல்லை. உற்பத்தியில் நேரடியாக இத்தகைய குணகங்களை நாங்கள் பரிசோதிக்கிறோம். ஆனால் இங்கே சுவாரஸ்யமான நுட்பங்கள் உள்ளன, அவை பெரும்பாலும் சிறந்த முடிவுகளைத் தருகின்றன:

  1. பொருளின் விலை/விளிம்பு மூலம் பெருக்கவும்.
  2. தயாரிப்பு தோன்றும் சராசரி ரசீது மூலம் பெருக்கவும். எனவே பொருட்கள் வரும், அதனுடன் அவர்கள் வழக்கமாக வேறு எதையாவது எடுத்துக்கொள்கிறார்கள்.
  3. இந்த தயாரிப்பு வாங்குபவர்களின் வருகைகளின் சராசரி அதிர்வெண்ணால் பெருக்கவும், இந்த தயாரிப்பு மக்களை அடிக்கடி திரும்பத் தூண்டுகிறது என்ற கருதுகோளின் அடிப்படையில்.

குணகங்களுடன் சோதனைகளை நடத்திய பிறகு, உற்பத்தியில் பின்வரும் அளவீடுகளைப் பெற்றோம்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்
இது ஒட்டுமொத்த தயாரிப்புகளின் மாற்றம் - நாங்கள் உருவாக்கிய பரிந்துரைகளில் உள்ள அனைத்து தயாரிப்புகளிலிருந்தும் வாங்கிய பொருட்களின் பங்கு.

ஒரு கவனமுள்ள வாசகர் ஆஃப்லைன் மற்றும் ஆன்லைன் அளவீடுகளுக்கு இடையே குறிப்பிடத்தக்க வேறுபாட்டைக் கவனிப்பார். மாதிரியைப் பயிற்றுவிக்கும் போது பரிந்துரைக்கக்கூடிய தயாரிப்புகளுக்கான அனைத்து டைனமிக் வடிப்பான்களையும் கணக்கில் எடுத்துக்கொள்ள முடியாது என்பதன் மூலம் இந்த நடத்தை விளக்கப்படுகிறது. எங்களைப் பொறுத்தவரை, மீட்டெடுக்கப்பட்ட வேட்பாளர்களில் பாதியை வடிகட்ட முடியும் என்பது ஒரு சாதாரண கதை; இது போன்ற குறிப்பிட்ட தன்மை எங்கள் துறையில் பொதுவானது.

வருவாயைப் பொறுத்தவரை, பின்வரும் கதை பெறப்பட்டது, பரிந்துரைகள் தொடங்கப்பட்ட பிறகு, சோதனைக் குழுவின் வருவாய் வலுவாக வளர்ந்து வருகிறது என்பது தெளிவாகிறது, இப்போது எங்கள் பரிந்துரைகளுடன் வருவாயின் சராசரி அதிகரிப்பு 3-4% ஆகும்:
ஆஃப்லைன் சில்லறை விற்பனையில் பரிந்துரைகளின் தரத்தை வியத்தகு முறையில் மேம்படுத்தியுள்ளோம்

முடிவில், உங்களுக்கு நிகழ்நேரம் அல்லாத பரிந்துரைகள் தேவைப்பட்டால், பரிந்துரைகளுக்கான வேட்பாளர்களைப் பிரித்தெடுப்பதற்கான சோதனைகளில் தரத்தில் மிகப் பெரிய அதிகரிப்பு காணப்படலாம் என்று நான் கூற விரும்புகிறேன். அவர்களின் தலைமுறைக்கு ஒரு பெரிய அளவு நேரம் பல நல்ல முறைகளை இணைப்பதை சாத்தியமாக்குகிறது, இது மொத்தத்தில் வணிகத்திற்கு சிறந்த முடிவுகளைத் தரும்.

பொருள் சுவாரஸ்யமானதாகக் காணும் எவருடனும் கருத்துகளில் அரட்டையடிப்பதில் நான் மகிழ்ச்சியடைவேன். நீங்கள் என்னிடம் தனிப்பட்ட முறையில் கேள்விகளைக் கேட்கலாம் தந்தி. AI/ஸ்டார்ட்அப்கள் பற்றிய எனது எண்ணங்களையும் நான் பகிர்ந்து கொள்கிறேன் தந்தி சேனல் - வரவேற்பு :)

ஆதாரம்: www.habr.com

கருத்தைச் சேர்