இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

சில நேரங்களில், ஒரு சிக்கலைத் தீர்க்க, நீங்கள் அதை வேறு கோணத்தில் பார்க்க வேண்டும். கடந்த 10 ஆண்டுகளில் இதே போன்ற பிரச்சனைகள் வெவ்வேறு விளைவுகளுடன் ஒரே மாதிரியாக தீர்க்கப்பட்டாலும், இந்த முறை மட்டும்தான் என்பது உண்மையல்ல.

வாடிக்கையாளர் குழப்பம் போன்ற ஒரு தலைப்பு உள்ளது. விஷயம் தவிர்க்க முடியாதது, ஏனென்றால் எந்தவொரு நிறுவனத்தின் வாடிக்கையாளர்கள், பல காரணங்களுக்காக, அதன் தயாரிப்புகள் அல்லது சேவைகளைப் பயன்படுத்துவதை நிறுத்தலாம். நிச்சயமாக, ஒரு நிறுவனத்தைப் பொறுத்தவரை, சலிப்பு என்பது இயற்கையானது, ஆனால் மிகவும் விரும்பத்தக்க செயல் அல்ல, எனவே எல்லோரும் இந்த குழப்பத்தை குறைக்க முயற்சி செய்கிறார்கள். இன்னும் சிறப்பாக, ஒரு குறிப்பிட்ட வகை பயனர்கள் அல்லது ஒரு குறிப்பிட்ட பயனருக்கான குழப்பத்தின் நிகழ்தகவைக் கணித்து, அவர்களைத் தக்கவைக்க சில படிகளைப் பரிந்துரைக்கவும்.

குறைந்தபட்சம் பின்வரும் காரணங்களுக்காக, முடிந்தால், வாடிக்கையாளரை பகுப்பாய்வு செய்து தக்கவைக்க முயற்சிப்பது அவசியம்:

  • புதிய வாடிக்கையாளர்களை ஈர்ப்பது தக்கவைப்பு நடைமுறைகளை விட விலை அதிகம். புதிய வாடிக்கையாளர்களை ஈர்க்க, ஒரு விதியாக, நீங்கள் சில பணத்தை (விளம்பரம்) செலவிட வேண்டும், அதே நேரத்தில் இருக்கும் வாடிக்கையாளர்களை சிறப்பு நிபந்தனைகளுடன் சிறப்பு சலுகையுடன் செயல்படுத்தலாம்;
  • வாடிக்கையாளர்கள் வெளியேறுவதற்கான காரணங்களைப் புரிந்துகொள்வது தயாரிப்புகள் மற்றும் சேவைகளை மேம்படுத்துவதற்கு முக்கியமாகும்.

குழப்பத்தை கணிக்க நிலையான அணுகுமுறைகள் உள்ளன. ஆனால் AI சாம்பியன்ஷிப் ஒன்றில், இதற்காக Weibull விநியோகத்தை முயற்சிக்க முடிவு செய்தோம். உயிர்வாழ்வு பகுப்பாய்வு, வானிலை முன்னறிவிப்பு, இயற்கை பேரழிவு பகுப்பாய்வு, தொழில்துறை பொறியியல் மற்றும் பலவற்றிற்கு இது பெரும்பாலும் பயன்படுத்தப்படுகிறது. வெய்புல் விநியோகம் என்பது இரண்டு அளவுருக்கள் மூலம் அளவுருக்கள் கொண்ட ஒரு சிறப்பு விநியோக செயல்பாடு ஆகும் இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம் и இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
விக்கிப்பீடியா

பொதுவாக, இது ஒரு சுவாரஸ்யமான விஷயம், ஆனால் வெளியேற்றங்களை முன்னறிவிப்பதற்காகவும், பொதுவாக ஃபின்டெக்ஸில், இது அடிக்கடி பயன்படுத்தப்படுவதில்லை. "ஏஐ இன் பேங்க்ஸ்" பிரிவில் செயற்கை நுண்ணறிவு சாம்பியன்ஷிப்பில் ஒரே நேரத்தில் தங்கம் வென்ற நாங்கள் (டேட்டா மைனிங் லேபரட்டரி) இதை எப்படிச் செய்தோம் என்பதை வெட்டுக்குக் கீழே கூறுவோம்.

பொதுவாக மந்தம் பற்றி

வாடிக்கையாளரின் குழப்பம் என்றால் என்ன, அது ஏன் மிகவும் முக்கியமானது என்பதைப் பற்றி கொஞ்சம் புரிந்துகொள்வோம். ஒரு வணிகத்திற்கு வாடிக்கையாளர் அடிப்படை முக்கியமானது. புதிய வாடிக்கையாளர்கள் இந்த தளத்திற்கு வருகிறார்கள், எடுத்துக்காட்டாக, ஒரு விளம்பரத்திலிருந்து ஒரு தயாரிப்பு அல்லது சேவையைப் பற்றி அறிந்துகொண்டு, சிறிது காலம் வாழ்க (தயாரிப்புகளை தீவிரமாகப் பயன்படுத்துங்கள்) மற்றும் சிறிது நேரம் கழித்து அதைப் பயன்படுத்துவதை நிறுத்துங்கள். இந்தக் காலகட்டம் “வாடிக்கையாளர் வாழ்க்கைச் சுழற்சி” என்று அழைக்கப்படுகிறது - ஒரு பொருளைப் பற்றி அறிந்து, வாங்கும் முடிவை எடுக்கும்போது, ​​பணம் செலுத்தி, உபயோகித்து, விசுவாசமான நுகர்வோராக மாறும்போது, ​​அந்தத் தயாரிப்பைப் பயன்படுத்துவதை நிறுத்தும்போது, ​​வாடிக்கையாளர் கடக்கும் நிலைகளை விவரிக்கும் சொல். ஏதாவது ஒரு காரணத்திற்காக. அதன்படி, வாடிக்கையாளரின் வாழ்க்கைச் சுழற்சியின் இறுதிக் கட்டம், வாடிக்கையாளர் சேவைகளைப் பயன்படுத்துவதை நிறுத்தும்போது, ​​மேலும் ஒரு வணிகத்திற்காக வாடிக்கையாளர் லாபம் அல்லது எந்த நன்மையையும் கொண்டு வருவதை நிறுத்திவிட்டார் என்று அர்த்தம்.

ஒவ்வொரு வங்கி வாடிக்கையாளரும் ஒரு குறிப்பிட்ட நபர், அவர் தனது தேவைகளுக்காக ஒன்று அல்லது மற்றொரு வங்கி அட்டையைத் தேர்ந்தெடுக்கிறார். நீங்கள் அடிக்கடி பயணம் செய்தால், மைல்கள் கொண்ட அட்டை கைக்கு வரும். நிறைய வாங்குகிறார் - ஹலோ, கேஷ்பேக் கார்டு. அவர் குறிப்பிட்ட கடைகளில் நிறைய வாங்குகிறார் - இதற்கு ஏற்கனவே ஒரு சிறப்பு கூட்டாளர் பிளாஸ்டிக் உள்ளது. நிச்சயமாக, சில நேரங்களில் ஒரு அட்டை "மலிவான சேவை" அளவுகோலின் அடிப்படையில் தேர்ந்தெடுக்கப்படுகிறது. பொதுவாக, இங்கே போதுமான மாறிகள் உள்ளன.

ஒரு நபர் வங்கியைத் தானே தேர்வு செய்கிறார் - நீங்கள் கபரோவ்ஸ்கிலிருந்து வரும்போது, ​​​​மாஸ்கோவிலும் பிராந்தியத்திலும் மட்டுமே கிளைகளைக் கொண்ட ஒரு வங்கியிலிருந்து ஒரு அட்டையைத் தேர்ந்தெடுப்பதில் ஏதேனும் அர்த்தம் உள்ளதா? அத்தகைய வங்கியின் அட்டை குறைந்தபட்சம் 2 மடங்கு அதிக லாபம் ஈட்டினாலும், அருகிலுள்ள வங்கி கிளைகள் இருப்பது இன்னும் ஒரு முக்கிய அளவுகோலாகும். ஆம், 2019 ஏற்கனவே வந்துவிட்டது, டிஜிட்டல் தான் எங்களின் எல்லாமே, ஆனால் சில வங்கிகளில் உள்ள பல சிக்கல்களை ஒரு கிளையில் மட்டுமே தீர்க்க முடியும். கூடுதலாக, மீண்டும், மக்கள்தொகையில் சில பகுதியினர் ஸ்மார்ட்போனில் உள்ள பயன்பாட்டை விட உடல் வங்கியை நம்புகிறார்கள், இதுவும் கணக்கில் எடுத்துக்கொள்ளப்பட வேண்டும்.

இதன் விளைவாக, ஒரு நபர் வங்கி தயாரிப்புகளை (அல்லது வங்கியே) மறுப்பதற்கு பல காரணங்கள் இருக்கலாம். நான் வேலைகளை மாற்றினேன், கார்டு கட்டணம் சம்பளத்தில் இருந்து "வெறும் மனிதர்களுக்கு" என்று மாற்றப்பட்டது, இது குறைவான லாபம் தரும். வங்கிக் கிளைகள் இல்லாத வேறு ஊருக்குச் சென்றேன். கிளையில் உள்ள தகுதியற்ற ஆபரேட்டருடனான தொடர்பு எனக்குப் பிடிக்கவில்லை. அதாவது, தயாரிப்பைப் பயன்படுத்துவதை விட கணக்கை மூடுவதற்கு இன்னும் அதிகமான காரணங்கள் இருக்கலாம்.

வாடிக்கையாளர் தனது நோக்கத்தை தெளிவாக வெளிப்படுத்த முடியாது - வங்கிக்கு வந்து ஒரு அறிக்கையை எழுதுங்கள், ஆனால் ஒப்பந்தத்தை நிறுத்தாமல் தயாரிப்புகளைப் பயன்படுத்துவதை நிறுத்துங்கள். இது போன்ற பிரச்சனைகளை புரிந்து கொள்ள இயந்திர கற்றல் மற்றும் AI ஐ பயன்படுத்த முடிவு செய்யப்பட்டது.

மேலும், எந்தவொரு தொழிற்துறையிலும் (தொலைத்தொடர்பு, இணைய வழங்குநர்கள், காப்பீட்டு நிறுவனங்கள், பொதுவாக, வாடிக்கையாளர் தளம் மற்றும் குறிப்பிட்ட கால பரிவர்த்தனைகள் உள்ள இடங்களில்) வாடிக்கையாளர் குழப்பம் ஏற்படலாம்.

என்ன செய்தோம்

முதலில், ஒரு தெளிவான எல்லையை விவரிக்க வேண்டியது அவசியம் - எந்த நேரத்திலிருந்து வாடிக்கையாளரை விட்டுச் சென்றதாகக் கருதுகிறோம். எங்கள் பணிக்கான தரவை எங்களுக்கு வழங்கிய வங்கியின் பார்வையில், வாடிக்கையாளரின் செயல்பாட்டு நிலை பைனரி - அவர் செயலில் உள்ளாரா இல்லையா. "செயல்பாடு" அட்டவணையில் ACTIVE_FLAG கொடி இருந்தது, அதன் மதிப்பு "0" அல்லது "1" ஆக இருக்கலாம் (முறையே "செயலற்ற" மற்றும் "செயலில்"). எல்லாம் நன்றாக இருக்கும், ஆனால் ஒரு நபர் அதை சிறிது நேரம் தீவிரமாகப் பயன்படுத்தலாம், பின்னர் ஒரு மாதத்திற்கு செயலில் உள்ள பட்டியலில் இருந்து வெளியேறலாம் - அவர் நோய்வாய்ப்பட்டார், விடுமுறையில் வேறு நாட்டிற்குச் சென்றார், அல்லது ஒரு சோதனைக்குச் சென்றார் மற்றொரு வங்கியிலிருந்து அட்டை. அல்லது நீண்ட கால செயலற்ற நிலைக்குப் பிறகு, வங்கியின் சேவைகளை மீண்டும் பயன்படுத்தத் தொடங்கலாம்

எனவே, செயலற்ற காலத்தை ஒரு குறிப்பிட்ட தொடர்ச்சியான காலப்பகுதி என்று அழைக்க முடிவு செய்தோம், இதன் போது அதற்கான கொடி "0" ஆக அமைக்கப்பட்டது.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

வெவ்வேறு நீளங்களின் செயலற்ற காலங்களுக்குப் பிறகு வாடிக்கையாளர்கள் செயலற்ற நிலையில் இருந்து செயலுக்கு நகர்கின்றனர். “செயலற்ற காலங்களின் நம்பகத்தன்மை” என்ற அனுபவ மதிப்பின் அளவைக் கணக்கிட எங்களுக்கு வாய்ப்பு உள்ளது - அதாவது, தற்காலிக செயலற்ற நிலைக்குப் பிறகு ஒரு நபர் மீண்டும் வங்கி தயாரிப்புகளைப் பயன்படுத்தத் தொடங்கும் நிகழ்தகவு.

எடுத்துக்காட்டாக, இந்த வரைபடம் பல மாதங்கள் செயலற்ற நிலைக்குப் பிறகு (ACTIVE_FLAG=1) வாடிக்கையாளர்களின் செயல்பாட்டை (ACTIVE_FLAG=0) மீண்டும் தொடங்குவதைக் காட்டுகிறது.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

நாங்கள் வேலை செய்யத் தொடங்கிய தரவுத் தொகுப்பை இங்கே கொஞ்சம் தெளிவுபடுத்துவோம். எனவே, வங்கி பின்வரும் அட்டவணையில் 19 மாதங்களுக்கு ஒருங்கிணைக்கப்பட்ட தகவலை வழங்கியது:

  • "செயல்பாடு" - மாதாந்திர வாடிக்கையாளர் பரிவர்த்தனைகள் (அட்டைகள் மூலம், இணைய வங்கி மற்றும் மொபைல் வங்கியில்), ஊதியம் மற்றும் விற்றுமுதல் பற்றிய தகவல் உட்பட.
  • “கார்டுகள்” - கிளையன்ட் வைத்திருக்கும் அனைத்து கார்டுகள் பற்றிய தரவு, விரிவான கட்டண அட்டவணையுடன்.
  • “ஒப்பந்தங்கள்” - வாடிக்கையாளரின் ஒப்பந்தங்கள் பற்றிய தகவல்கள் (திறந்த மற்றும் மூடப்பட்டவை): கடன்கள், வைப்புத்தொகைகள் போன்றவை, ஒவ்வொன்றின் அளவுருக்களைக் குறிக்கும்.
  • “வாடிக்கையாளர்கள்” - மக்கள்தொகை தரவுகளின் தொகுப்பு (பாலினம் மற்றும் வயது) மற்றும் தொடர்புத் தகவல்களின் கிடைக்கும் தன்மை.

வேலைக்கு எங்களுக்கு "வரைபடம்" தவிர அனைத்து அட்டவணைகளும் தேவை.

இங்கே மற்றொரு சிரமம் இருந்தது - இந்தத் தரவுகளில், அட்டைகளில் என்ன வகையான செயல்பாடு நடந்தது என்பதை வங்கி குறிப்பிடவில்லை. அதாவது, பரிவர்த்தனைகள் இருந்ததா இல்லையா என்பதை எங்களால் புரிந்து கொள்ள முடியும், ஆனால் அவற்றின் வகையை எங்களால் தீர்மானிக்க முடியவில்லை. எனவே, வாடிக்கையாளர் பணத்தை திரும்பப் பெறுகிறாரா, சம்பளம் பெறுகிறாரா அல்லது பணத்தை வாங்குகிறாரா என்பது தெளிவாகத் தெரியவில்லை. எங்களிடம் கணக்கு நிலுவைகள் பற்றிய தரவு இல்லை, அது பயனுள்ளதாக இருந்திருக்கும்.

மாதிரியே பக்கச்சார்பற்றது - இந்த மாதிரியில், 19 மாதங்களுக்கும் மேலாக, வாடிக்கையாளர்களைத் தக்கவைத்துக்கொள்வதற்கும், வெளியேறுவதைக் குறைப்பதற்கும் வங்கி எந்த முயற்சியும் எடுக்கவில்லை.

எனவே, செயலற்ற காலங்கள் பற்றி.

சலனத்தின் வரையறையை உருவாக்க, செயலற்ற காலத்தைத் தேர்ந்தெடுக்க வேண்டும். ஒரு கட்டத்தில் ஒரு குழப்ப முன்னறிவிப்பை உருவாக்க இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம், நீங்கள் ஒரு இடைவெளியில் குறைந்தது 3 மாத வாடிக்கையாளர் வரலாறு இருக்க வேண்டும் இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம். எங்கள் வரலாறு 19 மாதங்களுக்கு மட்டுப்படுத்தப்பட்டது, எனவே கிடைத்தால், 6 மாதங்கள் செயல்படாமல் இருக்க முடிவு செய்தோம். உயர்தர முன்னறிவிப்புக்கான குறைந்தபட்ச காலத்திற்கு, நாங்கள் 3 மாதங்கள் எடுத்தோம். வாடிக்கையாளர் தரவு நடத்தையின் பகுப்பாய்வின் அடிப்படையில் அனுபவபூர்வமாக 3 மற்றும் 6 மாதங்களுக்கு புள்ளிவிவரங்களை எடுத்தோம்.

சலிப்புக்கான வரையறையை நாங்கள் பின்வருமாறு வடிவமைத்துள்ளோம்: வாடிக்கையாளர் சலசலப்பு மாதம் இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம் இது ACTIVE_FLAG=0 உடன் முதல் மாதமாகும், இந்த மாதத்தில் இருந்து ACTIVE_FLAG புலத்தில் குறைந்தது ஆறு பூஜ்ஜியங்கள் உள்ளன, வேறுவிதமாகக் கூறினால், கிளையன்ட் 6 மாதங்களுக்கு செயலற்ற நிலையில் இருந்த மாதம்.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
வெளியேறிய வாடிக்கையாளர்களின் எண்ணிக்கை

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
மீதமுள்ள வாடிக்கையாளர்களின் எண்ணிக்கை

துர்நாற்றம் எவ்வாறு கணக்கிடப்படுகிறது?

இத்தகைய போட்டிகளிலும், பொதுவாக நடைமுறையிலும், வெளியேற்றம் பெரும்பாலும் இந்த வழியில் கணிக்கப்படுகிறது. வாடிக்கையாளர் வெவ்வேறு காலகட்டங்களில் தயாரிப்புகள் மற்றும் சேவைகளைப் பயன்படுத்துகிறார், அவருடனான தொடர்பு பற்றிய தரவு ஒரு நிலையான நீளம் n இன் அம்சங்களின் திசையன் என குறிப்பிடப்படுகிறது. பெரும்பாலும் இந்த தகவலில் பின்வருவன அடங்கும்:

  • பயனரை வகைப்படுத்தும் தரவு (மக்கள்தொகை தரவு, சந்தைப்படுத்தல் பிரிவு).
  • வங்கி தயாரிப்புகள் மற்றும் சேவைகளின் பயன்பாட்டின் வரலாறு (இவை எப்பொழுதும் ஒரு குறிப்பிட்ட நேரம் அல்லது நமக்குத் தேவையான இடைவெளியுடன் இணைக்கப்பட்ட வாடிக்கையாளர் செயல்கள்).
  • வெளிப்புற தரவு, அதைப் பெற முடிந்தால் - எடுத்துக்காட்டாக, சமூக வலைப்பின்னல்களில் இருந்து மதிப்புரைகள்.

அதன்பிறகு, அவர்கள் ஒவ்வொரு பணிக்கும் வித்தியாசமான சலனத்தின் வரையறையைப் பெறுகிறார்கள். பின்னர் அவர்கள் ஒரு இயந்திர கற்றல் வழிமுறையைப் பயன்படுத்துகின்றனர், இது ஒரு கிளையன்ட் வெளியேறுவதற்கான சாத்தியக்கூறுகளை முன்னறிவிக்கிறது இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம் காரணிகளின் திசையன் அடிப்படையில் இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம். அல்காரிதத்தைப் பயிற்றுவிக்க, முடிவெடுக்கும் மரங்களின் குழுமங்களை உருவாக்குவதற்கான நன்கு அறியப்பட்ட கட்டமைப்புகளில் ஒன்று பயன்படுத்தப்படுகிறது, XGBboost, லைட்ஜிபிஎம், கேட் பூஸ்ட் அல்லது அதன் மாற்றங்கள்.

அல்காரிதமே மோசமாக இல்லை, ஆனால் அது குழப்பத்தை முன்னறிவிக்கும் போது பல கடுமையான குறைபாடுகளைக் கொண்டுள்ளது.

  • அவருக்கு "நினைவகம்" என்று சொல்லப்படுவதில்லை.. மாதிரியின் உள்ளீடு என்பது தற்போதைய புள்ளியுடன் தொடர்புடைய குறிப்பிட்ட எண்ணிக்கையிலான அம்சமாகும். அளவுருக்களில் ஏற்பட்ட மாற்றங்களின் வரலாற்றைப் பற்றிய தகவல்களைச் சேமிப்பதற்காக, காலப்போக்கில் அளவுருக்களில் ஏற்படும் மாற்றங்களைக் குறிக்கும் சிறப்பு அம்சங்களைக் கணக்கிடுவது அவசியம், எடுத்துக்காட்டாக, கடந்த 1,2,3, XNUMX, XNUMX மாதங்களில் வங்கி பரிவர்த்தனைகளின் எண்ணிக்கை அல்லது அளவு. இந்த அணுகுமுறை தற்காலிக மாற்றங்களின் தன்மையை ஓரளவு மட்டுமே பிரதிபலிக்க முடியும்.
  • நிலையான முன்கணிப்பு அடிவானம். முன் வரையறுக்கப்பட்ட காலத்திற்கு மட்டுமே இந்த மாடலால் வாடிக்கையாளர் குழப்பத்தை கணிக்க முடியும், எடுத்துக்காட்டாக, ஒரு மாதத்திற்கு முன்பே முன்னறிவிப்பு. வெவ்வேறு காலத்திற்கு ஒரு முன்னறிவிப்பு தேவைப்பட்டால், எடுத்துக்காட்டாக, மூன்று மாதங்கள், நீங்கள் பயிற்சித் தொகுப்பை மீண்டும் உருவாக்கி புதிய மாதிரியை மீண்டும் பயிற்சி செய்ய வேண்டும்.

எங்கள் அணுகுமுறை

நாங்கள் நிலையான அணுகுமுறைகளைப் பயன்படுத்த மாட்டோம் என்று இப்போதே முடிவு செய்தோம். எங்களைத் தவிர, மேலும் 497 பேர் சாம்பியன்ஷிப்பில் பதிவு செய்தனர், அவர்கள் ஒவ்வொருவருக்கும் பின்னால் கணிசமான அனுபவம் இருந்தது. எனவே இதுபோன்ற சூழ்நிலைகளில் ஒரு நிலையான திட்டத்தின் படி ஏதாவது செய்ய முயற்சிப்பது நல்ல யோசனையல்ல.

மேலும், பைனரி வகைப்பாடு மாதிரி எதிர்கொள்ளும் பிரச்சனைகளை, வாடிக்கையாளர் சலன நேரங்களின் நிகழ்தகவு விநியோகத்தைக் கணிப்பதன் மூலம் தீர்க்கத் தொடங்கினோம். இதேபோன்ற அணுகுமுறையைக் காணலாம் இங்கே, இது கிளாசிக்கல் அணுகுமுறையை விட மிகவும் நெகிழ்வான முறையில் குழப்பத்தை கணிக்கவும் மேலும் சிக்கலான கருதுகோள்களை சோதிக்கவும் உங்களை அனுமதிக்கிறது. வெளியேறும் நேரத்தை மாதிரியாகக் கொண்ட விநியோகங்களின் குடும்பமாக, நாங்கள் விநியோகத்தைத் தேர்ந்தெடுத்தோம் வெய்புல் உயிர்வாழும் பகுப்பாய்வில் அதன் பரவலான பயன்பாட்டிற்காக. வாடிக்கையாளரின் நடத்தை ஒரு வகையான உயிர்வாழ்வாக பார்க்கப்படலாம்.

அளவுருக்களைப் பொறுத்து வெய்புல் நிகழ்தகவு அடர்த்தி விநியோகங்களின் எடுத்துக்காட்டுகள் இங்கே உள்ளன இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம் и இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்:

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

இது காலப்போக்கில் மூன்று வெவ்வேறு வாடிக்கையாளர்களின் நிகழ்தகவு அடர்த்தி செயல்பாடாகும். நேரம் மாதங்களில் வழங்கப்படுகிறது. வேறு வார்த்தைகளில் கூறுவதானால், அடுத்த இரண்டு மாதங்களில் ஒரு கிளையன்ட் எப்போது குழப்பமடையக்கூடும் என்பதை இந்த வரைபடம் காட்டுகிறது. நீங்கள் பார்க்கிறபடி, Weibull(2, 0.5) மற்றும் Weibullஐக் கொண்ட வாடிக்கையாளர்களை விட, விநியோகம் உள்ள கிளையன்ட் முன்கூட்டியே வெளியேறும் திறன் அதிகம். (3,1) விநியோகங்கள்.

இதன் விளைவாக, ஒவ்வொரு வாடிக்கையாளருக்கும், ஒவ்வொருவருக்கும் ஒரு மாதிரி
மாதம் வெய்புல் விநியோகத்தின் அளவுருக்களை முன்னறிவிக்கிறது, இது காலப்போக்கில் வெளியேறும் நிகழ்தகவின் நிகழ்வை சிறப்பாக பிரதிபலிக்கிறது. மேலும் விரிவாக:

  • பயிற்சித் தொகுப்பில் உள்ள இலக்கு அம்சங்கள் ஒரு குறிப்பிட்ட வாடிக்கையாளருக்கு ஒரு குறிப்பிட்ட மாதத்தில் சலனமடையும் வரை மீதமுள்ள நேரம்.
  • ஒரு வாடிக்கையாளருக்கு கர்ன் ரேட் இல்லை எனில், நடப்பு மாதத்திலிருந்து நம்மிடம் உள்ள வரலாற்றின் இறுதி வரையிலான மாதங்களின் எண்ணிக்கையை விட, சலவை நேரம் அதிகமாக இருக்கும் என்று கருதுகிறோம்.
  • பயன்படுத்தப்பட்ட மாதிரி: LSTM லேயருடன் மீண்டும் மீண்டும் வரும் நரம்பியல் நெட்வொர்க்.
  • இழப்புச் செயல்பாடாக, Weibull விநியோகத்திற்கான எதிர்மறை பதிவு-நிகழ்தகவு செயல்பாட்டைப் பயன்படுத்துகிறோம்.

இந்த முறையின் நன்மைகள் இங்கே:

  • நிகழ்தகவு விநியோகம், பைனரி வகைப்பாட்டின் வெளிப்படையான சாத்தியக்கூறுடன் கூடுதலாக, பல்வேறு நிகழ்வுகளின் நெகிழ்வான கணிப்புகளை அனுமதிக்கிறது, எடுத்துக்காட்டாக, ஒரு வாடிக்கையாளர் 3 மாதங்களுக்குள் வங்கியின் சேவைகளைப் பயன்படுத்துவதை நிறுத்துவார். மேலும், தேவைப்பட்டால், இந்த விநியோகத்தில் பல்வேறு அளவீடுகள் சராசரியாக இருக்கும்.
  • எல்எஸ்டிஎம் மறுநிகழ்வு நரம்பியல் நெட்வொர்க் நினைவகத்தைக் கொண்டுள்ளது மற்றும் கிடைக்கக்கூடிய முழு வரலாற்றையும் திறம்பட பயன்படுத்துகிறது. கதை விரிவாக்கப்படும்போது அல்லது சுத்திகரிக்கப்படும்போது, ​​துல்லியம் அதிகரிக்கிறது.
  • நேரக் காலங்களைச் சிறியதாகப் பிரிக்கும்போது (உதாரணமாக, மாதங்களை வாரங்களாகப் பிரிக்கும்போது) அணுகுமுறையை எளிதாக அளவிட முடியும்.

ஆனால் ஒரு நல்ல மாதிரியை உருவாக்க இது போதாது; நீங்கள் அதன் தரத்தை சரியாக மதிப்பீடு செய்ய வேண்டும்.

தரம் எவ்வாறு மதிப்பிடப்பட்டது?

லிஃப்ட் வளைவை மெட்ரிக்காக தேர்வு செய்தோம். இது போன்ற சந்தர்ப்பங்களில் வணிகத்தில் பயன்படுத்தப்படுகிறது, ஏனெனில் அதன் தெளிவான விளக்கம், அது நன்கு விவரிக்கப்பட்டுள்ளது இங்கே и இங்கே. இந்த அளவீட்டின் அர்த்தத்தை நீங்கள் ஒரு வாக்கியத்தில் விவரித்தால், அது "அல்காரிதம் எத்தனை முறை முதல் சிறந்த கணிப்பு செய்கிறது இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்தற்செயலாக விட %."

பயிற்சி மாதிரிகள்

வெவ்வேறு மாதிரிகள் மற்றும் அணுகுமுறைகளை ஒப்பிடக்கூடிய ஒரு குறிப்பிட்ட தர அளவீட்டை போட்டி நிலைமைகள் நிறுவவில்லை. மேலும், குழப்பத்தின் வரையறை வேறுபட்டிருக்கலாம் மற்றும் சிக்கல் அறிக்கையைப் பொறுத்து இருக்கலாம், இது வணிக இலக்குகளால் தீர்மானிக்கப்படுகிறது. எனவே, எந்த முறை சிறந்தது என்பதைப் புரிந்து கொள்ள, நாங்கள் இரண்டு மாதிரிகளைப் பயிற்றுவித்தோம்:

  1. ஒரு குழும முடிவு மர இயந்திர கற்றல் வழிமுறையைப் பயன்படுத்தி பொதுவாகப் பயன்படுத்தப்படும் பைனரி வகைப்பாடு அணுகுமுறை (லைட்ஜிபிஎம்);
  2. வெய்புல்-எல்எஸ்டிஎம் மாடல்

பயிற்சித் தொகுப்பில் இல்லாத முன்தேர்ந்தெடுக்கப்பட்ட 500 வாடிக்கையாளர்களைக் கொண்ட சோதனைத் தொகுப்பு. கிளையண்ட் மூலம் உடைக்கப்பட்ட குறுக்கு சரிபார்ப்பைப் பயன்படுத்தி மாதிரிக்கு ஹைப்பர்-அளவுருக்கள் தேர்ந்தெடுக்கப்பட்டன. ஒவ்வொரு மாதிரியையும் பயிற்றுவிக்க ஒரே மாதிரியான அம்சங்கள் பயன்படுத்தப்பட்டன.

மாடலில் நினைவகம் இல்லாததால், அதற்கான சிறப்பு அம்சங்கள் எடுக்கப்பட்டன, கடந்த மூன்று மாதங்களில் அளவுருக்களுக்கான சராசரி மதிப்புக்கு ஒரு மாதத்திற்கான அளவுருக்களின் மாற்றங்களின் விகிதத்தைக் காட்டுகிறது. கடந்த மூன்று மாதங்களில் மதிப்புகளில் ஏற்படும் மாற்றத்தின் விகிதத்தை என்ன வகைப்படுத்துகிறது. இது இல்லாமல், வெய்புல்-எல்எஸ்டிஎம் உடன் ஒப்பிடும்போது ரேண்டம் ஃபாரஸ்ட் அடிப்படையிலான மாதிரி பாதகமாக இருக்கும்.

ஏன் வெய்புல் விநியோகத்துடன் கூடிய LSTM ஆனது குழும முடிவு மர அணுகுமுறையை விட சிறந்தது

ஓரிரு படங்களில் எல்லாம் இங்கே தெளிவாகத் தெரியும்.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
கிளாசிக்கல் அல்காரிதம் மற்றும் வெய்புல்-எல்எஸ்டிஎம் ஆகியவற்றிற்கான லிஃப்ட் வளைவின் ஒப்பீடு

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
கிளாசிக்கல் அல்காரிதம் மற்றும் வெய்புல்-எல்எஸ்டிஎம் ஆகியவற்றிற்கான லிஃப்ட் கர்வ் மெட்ரிக் மாதத்தின் ஒப்பீடு

பொதுவாக, LSTM ஆனது கிட்டத்தட்ட எல்லா நிகழ்வுகளிலும் கிளாசிக்கல் அல்காரிதத்தை விட உயர்ந்தது.

கர்ன் கணிப்பு

வெய்புல் விநியோகத்துடன் கூடிய எல்எஸ்டிஎம் செல்கள் கொண்ட தொடர்ச்சியான நரம்பியல் வலையமைப்பை அடிப்படையாகக் கொண்ட ஒரு மாதிரியானது, எடுத்துக்காட்டாக, அடுத்த n மாதங்களுக்குள் வாடிக்கையாளர் குழப்பத்தை முன்கூட்டியே கணிக்க முடியும். n = 3க்கான வழக்கைக் கவனியுங்கள். இந்த வழக்கில், ஒவ்வொரு மாதத்திற்கும், கிளையன்ட் வெளியேறுவாரா என்பதை நியூரல் நெட்வொர்க் சரியாகத் தீர்மானிக்க வேண்டும், அடுத்த மாதம் தொடங்கி n வது மாதம் வரை. வேறு வார்த்தைகளில் கூறுவதானால், வாடிக்கையாளர் n மாதங்களுக்குப் பிறகு இருப்பாரா என்பதை இது சரியாக தீர்மானிக்க வேண்டும். இது முன்கூட்டியே ஒரு முன்னறிவிப்பாகக் கருதப்படலாம்: வாடிக்கையாளர் வெளியேறுவது பற்றி சிந்திக்கத் தொடங்கும் தருணத்தை கணித்தல்.

வெய்புல்-எல்எஸ்டிஎம் 1, 2 மற்றும் 3 மாதங்களுக்கு முன்பு லிஃப்ட் வளைவை ஒப்பிடுவோம்:

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

சில காலம் செயலில் இல்லாத வாடிக்கையாளர்களுக்கான முன்னறிவிப்புகளும் முக்கியமானவை என்பதை நாங்கள் ஏற்கனவே மேலே எழுதியுள்ளோம். எனவே, புறப்பட்ட வாடிக்கையாளர் ஏற்கனவே ஒன்று அல்லது இரண்டு மாதங்கள் செயலற்ற நிலையில் இருக்கும் போது, ​​அத்தகைய நிகழ்வுகளை மாதிரியில் சேர்ப்போம், மேலும் Weibull-LSTM அத்தகைய நிகழ்வுகளை கர்ன் என சரியாக வகைப்படுத்துகிறதா என்பதைச் சரிபார்ப்போம். இதுபோன்ற வழக்குகள் மாதிரியில் இருப்பதால், நெட்வொர்க் அவற்றை நன்றாகக் கையாளும் என்று எதிர்பார்க்கிறோம்:

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

வாடிக்கையாளர்களை தக்கவைத்தல்

உண்மையில், இதுபோன்ற மற்றும் அத்தகைய வாடிக்கையாளர்கள் தயாரிப்பைப் பயன்படுத்துவதை நிறுத்தத் தயாராகி வருகின்றனர் என்ற தகவலைக் கையில் வைத்திருப்பதன் மூலம் செய்யக்கூடிய முக்கிய விஷயம் இதுதான். வாடிக்கையாளர்களைத் தக்கவைத்துக்கொள்வதற்காக அவர்களுக்கு பயனுள்ள ஒன்றை வழங்கக்கூடிய மாதிரியை உருவாக்குவது பற்றி பேசுகையில், இது போன்ற முயற்சிகளின் வரலாறு உங்களிடம் இல்லையென்றால் அது நன்றாக முடிவடையும்.

எங்களிடம் அத்தகைய கதை இல்லை, எனவே நாங்கள் அதை இப்படி முடிவு செய்தோம்.

  1. ஒவ்வொரு வாடிக்கையாளருக்கும் சுவாரஸ்யமான தயாரிப்புகளை அடையாளம் காணும் மாதிரியை நாங்கள் உருவாக்குகிறோம்.
  2. ஒவ்வொரு மாதமும் நாங்கள் வகைப்படுத்தியை இயக்கி, வாடிக்கையாளர்களை விட்டுச் செல்லும் சாத்தியத்தை அடையாளம் காண்கிறோம்.
  3. சில வாடிக்கையாளர்களுக்கு, பாயிண்ட் 1ல் உள்ள மாதிரியின்படி தயாரிப்பை வழங்குகிறோம், மேலும் எங்கள் செயல்களை நினைவில் கொள்கிறோம்.
  4. சில மாதங்களுக்குப் பிறகு, வாடிக்கையாளர்களை விட்டுச் செல்லக்கூடிய இவற்றில் எது எஞ்சியிருக்கிறது, எவை எஞ்சியுள்ளன என்பதைப் பார்க்கிறோம். எனவே, நாங்கள் ஒரு பயிற்சி மாதிரியை உருவாக்குகிறோம்.
  5. படி 4 இல் பெறப்பட்ட வரலாற்றைப் பயன்படுத்தி மாதிரியைப் பயிற்றுவிக்கிறோம்.
  6. விருப்பமாக, நாங்கள் செயல்முறையை மீண்டும் செய்கிறோம், படி 1 இலிருந்து மாதிரியை படி 5 இல் பெறப்பட்ட மாதிரியுடன் மாற்றுகிறோம்.

வழக்கமான A/B சோதனையின் மூலம் அத்தகைய தக்கவைப்பின் தரத்தை சோதிக்க முடியும் - நாங்கள் வெளியேறக்கூடிய வாடிக்கையாளர்களை இரண்டு குழுக்களாகப் பிரிக்கிறோம். எங்கள் தக்கவைப்பு மாதிரியின் அடிப்படையில் ஒருவருக்கு தயாரிப்புகளை வழங்குகிறோம், மற்றொன்றுக்கு நாங்கள் எதையும் வழங்கவில்லை. எங்கள் உதாரணத்தின் புள்ளி 1 இல் ஏற்கனவே பயனுள்ளதாக இருக்கும் மாதிரியைப் பயிற்றுவிக்க முடிவு செய்தோம்.

பிரிவை முடிந்தவரை விளக்கக்கூடியதாக மாற்ற விரும்புகிறோம். இதைச் செய்ய, எளிதாகப் புரிந்துகொள்ளக்கூடிய பல அம்சங்களை நாங்கள் தேர்ந்தெடுத்தோம்: மொத்த பரிவர்த்தனைகளின் எண்ணிக்கை, ஊதியங்கள், மொத்த கணக்கு விற்றுமுதல், வயது, பாலினம். "வரைபடங்கள்" அட்டவணையில் உள்ள அம்சங்கள் தகவல் அற்றவையாகக் கணக்கில் எடுத்துக்கொள்ளப்படவில்லை, சரிபார்ப்புத் தொகுப்புக்கும் பயிற்சித் தொகுப்பிற்கும் இடையில் தரவு கசிவைத் தவிர்ப்பதற்காக செயலாக்கத்தின் சிக்கலான தன்மை காரணமாக அட்டவணை 3 "ஒப்பந்தங்களின்" அம்சங்கள் கணக்கில் எடுத்துக்கொள்ளப்படவில்லை.

காஸியன் கலவை மாதிரிகளைப் பயன்படுத்தி கிளஸ்டரிங் மேற்கொள்ளப்பட்டது. Akaike தகவல் அளவுகோல் 2 ஆப்டிமாவை தீர்மானிக்க எங்களுக்கு அனுமதித்தது. முதல் உகந்தது 1 கிளஸ்டருக்கு ஒத்திருக்கிறது. இரண்டாவது உகந்தது, குறைவாக உச்சரிக்கப்படுகிறது, 80 கிளஸ்டர்களுக்கு ஒத்திருக்கிறது. இந்த முடிவின் அடிப்படையில், நாம் பின்வரும் முடிவுக்கு வரலாம்: முன்கூட்டிய தகவல் இல்லாமல் தரவை கொத்துகளாகப் பிரிப்பது மிகவும் கடினம். சிறந்த கிளஸ்டரிங்கிற்கு, ஒவ்வொரு கிளையண்டையும் விரிவாக விவரிக்கும் தரவு உங்களுக்குத் தேவை.

எனவே, ஒவ்வொரு வாடிக்கையாளருக்கும் வெவ்வேறு தயாரிப்புகளை வழங்குவதற்காக மேற்பார்வையிடப்பட்ட கற்றலின் சிக்கல் கருதப்பட்டது. பின்வரும் தயாரிப்புகள் கருதப்பட்டன: "கால வைப்பு", "கிரெடிட் கார்டு", "ஓவர் டிராஃப்ட்", "நுகர்வோர் கடன்", "கார் கடன்", "அடமானம்".

தரவு இன்னும் ஒரு வகை தயாரிப்புகளை உள்ளடக்கியது: "நடப்பு கணக்கு". ஆனால் குறைந்த தகவல் உள்ளடக்கம் காரணமாக நாங்கள் அதை கருத்தில் கொள்ளவில்லை. வங்கி வாடிக்கையாளர்களாக இருக்கும் பயனர்களுக்கு, அதாவது. அதன் தயாரிப்புகளைப் பயன்படுத்துவதை நிறுத்தவில்லை, எந்த தயாரிப்பு அவர்களுக்கு ஆர்வமாக இருக்கும் என்பதைக் கணிக்க ஒரு மாதிரி உருவாக்கப்பட்டது. லாஜிஸ்டிக் பின்னடைவு மாதிரியாகத் தேர்ந்தெடுக்கப்பட்டது, மேலும் முதல் 10 சதவீதங்களுக்கான லிஃப்ட் மதிப்பு தர மதிப்பீட்டு அளவீடாகப் பயன்படுத்தப்பட்டது.

மாதிரியின் தரத்தை படத்தில் மதிப்பிடலாம்.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்
வாடிக்கையாளர்களுக்கான தயாரிப்பு பரிந்துரை மாதிரி முடிவுகள்

இதன் விளைவாக

இந்த அணுகுமுறை RAIF-Challenge 2017 AI சாம்பியன்ஷிப்பில் "வங்கிகளில் AI" பிரிவில் எங்களுக்கு முதல் இடத்தைப் பெற்றுத் தந்தது.

இயற்கைப் பேரிடரைப் போல அணுகுவதன் மூலம் அதை எப்படிக் கணித்தோம்

வெளிப்படையாக, முக்கிய விஷயம் என்னவென்றால், வழக்கத்திற்கு மாறான கோணத்தில் சிக்கலை அணுகுவது மற்றும் பொதுவாக மற்ற சூழ்நிலைகளுக்குப் பயன்படுத்தப்படும் ஒரு முறையைப் பயன்படுத்துவது.

பயனர்கள் பெருமளவில் வெளியேறுவது சேவைகளுக்கு இயற்கைப் பேரழிவாக இருக்கலாம்.

வங்கிகள் மட்டுமின்றி, வெளியேற்றத்தை கணக்கில் எடுத்துக்கொள்வது முக்கியமான வேறு எந்த பகுதிக்கும் இந்த முறையை கணக்கில் எடுத்துக்கொள்ளலாம். உதாரணமாக, எங்கள் சொந்த வெளியேற்றத்தை கணக்கிட இதைப் பயன்படுத்தினோம் - ரோஸ்டெலெகாமின் சைபீரியன் மற்றும் செயின்ட் பீட்டர்ஸ்பர்க் கிளைகளில்.

"டேட்டா மைனிங் லேபரேட்டரி" நிறுவனம் "தேடல் போர்டல் "ஸ்புட்னிக்"

ஆதாரம்: www.habr.com

கருத்தைச் சேர்