ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

සමහර විට, ගැටලුවක් විසඳීම සඳහා, ඔබ එය වෙනත් කෝණයකින් බැලිය යුතුය. පසුගිය වසර 10 පුරාවටම එක හා සමාන ගැටළු විවිධ බලපෑම් සහිතව එකම ආකාරයකින් විසඳා ඇතත්, මෙම ක්‍රමය එකම එකක් බව සත්‍ය නොවේ.

පාරිභෝගික චංචල වැනි මාතෘකාවක් තිබේ. කාරණය නොවැළැක්විය හැකිය, මන්ද ඕනෑම සමාගමක ගනුදෙනුකරුවන්ට බොහෝ හේතු නිසා එහි නිෂ්පාදන හෝ සේවාවන් භාවිතා කිරීම නැවැත්විය හැකිය. ඇත්ත වශයෙන්ම, සමාගමක් සඳහා, කැළඹීම ස්වභාවික නමුත් වඩාත්ම කැමති ක්‍රියාවක් නොවේ, එබැවින් සෑම කෙනෙකුම මෙම කැළඹීම අවම කිරීමට උත්සාහ කරයි. වඩා හොඳ නම්, යම් පරිශීලක කාණ්ඩයක් හෝ නිශ්චිත පරිශීලකයෙකු සඳහා ව්‍යාකූල වීමේ සම්භාවිතාව පුරෝකථනය කර ඒවා රඳවා ගැනීමට පියවර කිහිපයක් යෝජනා කරන්න.

අවම වශයෙන් පහත සඳහන් හේතූන් මත හැකි නම්, විශ්ලේෂණය කර සේවාදායකයා රඳවා ගැනීමට උත්සාහ කිරීම අවශ්‍ය වේ:

  • නව ගනුදෙනුකරුවන් ආකර්ෂණය කර ගැනීම රඳවා තබා ගැනීමේ ක්රියා පටිපාටියට වඩා මිල අධිකය. නව ගනුදෙනුකරුවන් ආකර්ෂණය කර ගැනීම සඳහා, නීතියක් ලෙස, ඔබ යම් මුදලක් (ප්රචාරණය) වියදම් කළ යුතු අතර, පවතින පාරිභෝගිකයින්ට විශේෂ කොන්දේසි සහිත විශේෂ දීමනාවක් සමඟ සක්රිය කළ හැකිය;
  • පාරිභෝගිකයින් ඉවත් වීමට හේතු තේරුම් ගැනීම නිෂ්පාදන සහ සේවා වැඩිදියුණු කිරීම සඳහා යතුරයි.

ව්යසනය පුරෝකථනය කිරීම සඳහා සම්මත ප්රවේශයන් තිබේ. නමුත් එක් AI ශූරතාවලියකදී, අපි මේ සඳහා Weibull බෙදා හැරීම උත්සාහ කිරීමට තීරණය කළෙමු. එය බොහෝ විට පැවැත්ම විශ්ලේෂණය, කාලගුණ අනාවැකි, ස්වභාවික විපත් විශ්ලේෂණය, කාර්මික ඉංජිනේරු සහ ඒ හා සමාන සඳහා භාවිතා වේ. Weibull බෙදාහැරීම යනු පරාමිති දෙකකින් පරාමිතිකරණය කරන ලද විශේෂ බෙදාහැරීමේ කාර්යයකි ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය и ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
විකිපීඩියා

පොදුවේ ගත් කල, එය සිත්ගන්නා කරුණකි, නමුත් පිටතට ගලායාම පුරෝකථනය කිරීම සඳහා සහ පොදුවේ ෆින්ටෙක්හි එය බොහෝ විට භාවිතා නොවේ. කප්පාදුවට පහළින් අපි (දත්ත කැණීම් රසායනාගාරය) මෙය සිදු කළේ කෙසේදැයි අපි ඔබට කියමු, ඊට සමගාමීව "බැංකු තුළ AI" කාණ්ඩයේ කෘත්‍රිම බුද්ධි ශූරතාවලියේ රන් පදක්කම දිනා ගනිමු.

පොදුවේ කැළඹීම ගැන

පාරිභෝගික චංචල යනු කුමක්ද සහ එය එතරම් වැදගත් වන්නේ මන්දැයි අපි ටිකක් තේරුම් ගනිමු. ව්‍යාපාරයක් සඳහා පාරිභෝගික පදනමක් වැදගත් වේ. නව ගනුදෙනුකරුවන් මෙම පදනමට පැමිණේ, උදාහරණයක් ලෙස, වෙළඳ දැන්වීමකින් නිෂ්පාදනයක් හෝ සේවාවක් ගැන ඉගෙන ගෙන, යම් කාලයක් ජීවත් වන්න (නිෂ්පාදන සක්‍රීයව භාවිතා කරන්න) සහ ටික වේලාවකට පසු එය භාවිතා කිරීම නවත්වන්න. මෙම කාල සීමාව "පාරිභෝගික ජීවන චක්‍රය" ලෙස හැඳින්වේ - පාරිභෝගිකයෙකු නිෂ්පාදනයක් ගැන ඉගෙන ගන්නා විට, මිලදී ගැනීමේ තීරණයක් ගන්නා විට, ගෙවන විට, භාවිතා කරන විට සහ විශ්වාසවන්ත පාරිභෝගිකයෙකු බවට පත්වන විට සහ අවසානයේ නිෂ්පාදිතය භාවිතා කිරීම නතර කරන විට ඔහු පසු කරන අදියර විස්තර කරන යෙදුමකි. එක් හේතුවක් හෝ වෙනත් හේතුවක් නිසා. ඒ අනුව, ගණුදෙණු කිරීම සේවාලාභියාගේ ජීවන චක්‍රයේ අවසාන අදියර වන අතර, සේවාලාභියා සේවා භාවිතා කිරීම නැවැත්වූ විට, සහ ව්‍යාපාරයක් සඳහා මෙයින් අදහස් කරන්නේ සේවාදායකයා ලාභයක් හෝ කිසියම් ප්‍රතිලාභයක් ගෙන ඒම නතර කර ඇති බවයි.

එක් එක් බැංකු සේවාදායකයා යනු ඔහුගේ අවශ්යතා සඳහා විශේෂයෙන් එක් හෝ තවත් බැංකු කාඩ්පතක් තෝරා ගන්නා විශේෂිත පුද්ගලයෙකි. ඔබ නිතර ගමන් කරන්නේ නම්, සැතපුම් සහිත කාඩ්පතක් ප්රයෝජනවත් වනු ඇත. ගොඩක් මිල දී ගන්නවා - හලෝ, මුදල් ආපසු කාඩ්පත. ඔහු විශේෂිත වෙළඳසැල් වල බොහෝ දේ මිලදී ගනී - මේ සඳහා දැනටමත් විශේෂ සහකරු ප්ලාස්ටික් ඇත. ඇත්ත වශයෙන්ම, සමහර විට "ලාභම සේවා" නිර්ණායකය මත පදනම්ව කාඩ්පතක් තෝරා ගනු ලැබේ. පොදුවේ, මෙහි ප්රමාණවත් තරම් විචල්යයන් ඇත.

පුද්ගලයෙකු ද බැංකුවම තෝරා ගනී - ඔබ කබරොව්ස්ක් සිට පැමිණෙන විට මොස්කව් සහ කලාපයේ පමණක් ශාඛා ඇති බැංකුවකින් කාඩ්පතක් තෝරා ගැනීමේ තේරුමක් තිබේද? එවැනි බැංකුවක කාඩ්පතක් අවම වශයෙන් 2 ගුණයක් ලාභදායී වුවද, අසල බැංකු ශාඛා තිබීම තවමත් වැදගත් නිර්ණායකයකි. ඔව්, 2019 දැනටමත් පැමිණ ඇති අතර ඩිජිටල් අපගේ සෑම දෙයක්ම වේ, නමුත් සමහර බැංකු සමඟ ගැටලු ගණනාවක් විසඳා ගත හැක්කේ ශාඛාවක් තුළ පමණි. Plus, නැවතත්, ජනගහනයෙන් සමහර කොටසක් ස්මාර්ට් ජංගම දුරකතනයේ යෙදුමකට වඩා භෞතික බැංකුවක් විශ්වාස කරයි, මෙයද සැලකිල්ලට ගත යුතුය.

ප්රතිඵලයක් වශයෙන්, බැංකු නිෂ්පාදන (හෝ බැංකුවම) ප්රතික්ෂේප කිරීම සඳහා පුද්ගලයෙකුට බොහෝ හේතු තිබිය හැකිය. මම රැකියා වෙනස් කළ අතර, කාඩ්පත් ගාස්තු වැටුපෙන් "හුදෙක් මනුෂ්‍යයන් සඳහා" ලෙස වෙනස් විය, එය අඩු ලාභයකි. මම බැංකු ශාඛා නොමැති වෙනත් නගරයකට ගියා. ශාඛාවේ සුදුසුකම් නොලබන ක්‍රියාකරු සමඟ අන්තර්ක්‍රියා කිරීමට මා කැමති වූයේ නැත. එනම්, නිෂ්පාදිතය භාවිතා කිරීමට වඩා ගිණුමක් වසා දැමීම සඳහා තවත් හේතු තිබිය හැක.

සේවාදායකයාට ඔහුගේ අභිප්‍රාය පැහැදිලිව ප්‍රකාශ කිරීමට පමණක් නොව - බැංකුවට පැමිණ ප්‍රකාශයක් ලියන්න, නමුත් කොන්ත්‍රාත්තුව අවසන් නොකර නිෂ්පාදන භාවිතා කිරීම නවත්වන්න. එවැනි ගැටළු තේරුම් ගැනීමට යන්ත්‍ර ඉගෙනීම සහ AI භාවිතා කිරීමට තීරණය විය.

එපමණක් නොව, ඕනෑම කර්මාන්තයක (ටෙලිකොම්, අන්තර්ජාල සපයන්නන්, රක්ෂණ සමාගම්, සාමාන්‍යයෙන්, පාරිභෝගික පදනමක් සහ කාලානුරූපී ගනුදෙනු ඇති ඕනෑම තැනක) පාරිභෝගික කඩාකප්පල් වීම සිදුවිය හැක.

අපි මොනවද කරලා තියෙන්නේ

පළමුවෙන්ම, පැහැදිලි මායිමක් විස්තර කිරීම අවශ්ය විය - සේවාදායකයා පිටත්ව ගොස් ඇති බව අප සලකන්නේ කුමන වේලාවක සිටද යන්න. අපගේ වැඩ සඳහා දත්ත අපට ලබා දුන් බැංකුවේ දෘෂ්ටි කෝණයෙන්, සේවාදායකයාගේ ක්‍රියාකාරකම් තත්ත්වය ද්විමය විය - ඔහු ක්‍රියාකාරී හෝ නැත. "ක්‍රියාකාරකම්" වගුවේ ACTIVE_FLAG ධජයක් තිබී ඇති අතර, එහි අගය "0" හෝ "1" ("අක්‍රිය" සහ "ක්‍රියාකාරී") විය හැක. සෑම දෙයක්ම හොඳින් වනු ඇත, නමුත් පුද්ගලයෙකුට එය යම් කාලයක් සඳහා සක්‍රියව භාවිතා කළ හැකි අතර පසුව මාසයක් ක්‍රියාකාරී ලැයිස්තුවෙන් ඉවත් විය හැකිය - ඔහු අසනීප විය, නිවාඩුවට වෙනත් රටකට ගියේය, නැතහොත් පරීක්ෂා කිරීමට පවා ගියේය. වෙනත් බැංකුවකින් කාඩ්පතක්. එසේත් නැතිනම් දිගු කලක් අක්රිය වීමෙන් පසුව, නැවත බැංකුවේ සේවාවන් භාවිතා කිරීම ආරම්භ කරන්න

එබැවින්, අක්‍රිය කාල පරිච්ඡේදයක් සඳහා ධජය “0” ලෙස සකසා ඇති නිශ්චිත අඛණ්ඩ කාල පරිච්ඡේදයක් ලෙස හැඳින්වීමට අපි තීරණය කළෙමු.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

විවිධ දිගුවල අක්‍රිය කාලපරිච්ඡේදයෙන් පසු සේවාලාභීන් අක්‍රිය සිට සක්‍රිය දක්වා ගමන් කරයි. “අක්‍රිය කාල පරිච්ඡේදවල විශ්වසනීයත්වය” ආනුභවික අගයේ උපාධිය ගණනය කිරීමට අපට අවස්ථාව තිබේ - එනම්, තාවකාලික අක්‍රියතාවයෙන් පසු පුද්ගලයෙකු නැවත බැංකු නිෂ්පාදන භාවිතා කිරීමට පටන් ගැනීමේ සම්භාවිතාව.

උදාහරණයක් ලෙස, මෙම ප්‍රස්ථාරය මඟින් සේවාලාභීන්ගේ ක්‍රියාකාරකම් නැවත ආරම්භ කිරීම (ACTIVE_FLAG=1) මාස කිහිපයක අක්‍රියතාවයෙන් පසු (ACTIVE_FLAG=0) පෙන්වයි.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

මෙන්න අපි වැඩ කිරීමට පටන් ගත් දත්ත කට්ටලය ටිකක් පැහැදිලි කරන්නෙමු. එබැවින්, බැංකුව පහත වගු වල මාස 19 සඳහා සමස්ථ තොරතුරු ලබා දී ඇත:

  • “ක්‍රියාකාරකම්” - වැටුප් ගෙවීම සහ පිරිවැටුම පිළිබඳ තොරතුරු ඇතුළුව මාසික පාරිභෝගික ගනුදෙනු (කාඩ්පත් මගින්, අන්තර්ජාල බැංකුකරණයේදී සහ ජංගම බැංකුකරණයේදී).
  • “කාඩ්පත්” - සවිස්තරාත්මක ගාස්තු කාලසටහනක් සමඟ සේවාදායකයා සතුව ඇති සියලුම කාඩ්පත් පිළිබඳ දත්ත.
  • "ගිවිසුම්" - සේවාදායකයාගේ ගිවිසුම් පිළිබඳ තොරතුරු (විවෘත සහ සංවෘත දෙකම): ණය, තැන්පතු, ආදිය, එක් එක් පරාමිතීන් පෙන්නුම් කරයි.
  • “පාරිභෝගිකයින්” - ජනවිකාස දත්ත (ස්ත්‍රී පුරුෂ භාවය සහ වයස) සහ සම්බන්ධතා තොරතුරු ලබා ගැනීමේ හැකියාව.

වැඩ සඳහා අපට "සිතියම" හැර අනෙකුත් සියලුම වගු අවශ්ය විය.

මෙහි තවත් දුෂ්කරතාවයක් ඇති විය - මෙම දත්තවල බැංකුව විසින් කාඩ්පත් මත කුමන ආකාරයේ ක්රියාකාරිත්වයක් සිදුවී ඇත්දැයි සඳහන් කර නැත. එනම්, ගනුදෙනු තිබේද නැද්ද යන්න අපට තේරුම් ගත හැකිය, නමුත් අපට තවදුරටත් ඒවායේ වර්ගය තීරණය කළ නොහැක. එබැවින්, සේවාදායකයා මුදල් ආපසු ගන්නේද, වැටුපක් ලබා ගන්නේද, නැතහොත් මිලදී ගැනීම් සඳහා මුදල් වියදම් කරන්නේද යන්න අපැහැදිලි විය. අපට ප්‍රයෝජනවත් විය හැකි ගිණුම් ශේෂයන් පිළිබඳ දත්ත ද නොතිබුණි.

නියැදියම අපක්ෂපාතී විය - මෙම කොටසෙහි, මාස 19 ක් පුරා, බැංකුව ගනුදෙනුකරුවන් රඳවා තබා ගැනීමට සහ පිටතට ගලායාම අවම කිරීමට කිසිදු උත්සාහයක් නොගත්තේය.

ඉතින්, අක්රිය කාල පරිච්ඡේදයන් ගැන.

චූන් පිළිබඳ නිර්වචනයක් සකස් කිරීම සඳහා, අක්රිය කාල පරිච්ඡේදයක් තෝරාගත යුතුය. යම් අවස්ථාවක දී චංචල පුරෝකථනයක් නිර්මාණය කිරීමට ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය, ඔබට පරතරයකින් අවම වශයෙන් මාස 3 ක පාරිභෝගික ඉතිහාසයක් තිබිය යුතුය ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය. අපගේ ඉතිහාසය මාස 19කට සීමා වූ බැවින්, තිබේ නම්, මාස 6ක අක්‍රිය කාල සීමාවක් ගැනීමට අපි තීරණය කළෙමු. උසස් තත්ත්වයේ පුරෝකථනයක් සඳහා අවම කාලය සඳහා, අපි මාස 3 ක් ගත කළෙමු. පාරිභෝගික දත්ත හැසිරීම් විශ්ලේෂණයක් මත පදනම්ව අපි මාස 3 සහ 6 සඳහා සංඛ්‍යා ප්‍රත්‍යක්ෂ ලෙස ලබා ගත්තෙමු.

අපි චූන් යන්නෙහි නිර්වචනය පහත පරිදි සකස් කළෙමු: පාරිභෝගික දූෂිත මාසය ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය මෙය ACTIVE_FLAG=0 සමඟින් පළමු මාසයයි, මෙම මාසයේ සිට ACTIVE_FLAG ක්ෂේත්‍රයේ අවම වශයෙන් අඛණ්ඩ ශුන්‍ය හයක් ඇත, වෙනත් වචන වලින් කිවහොත්, සේවාලාභියා මාස 6ක් අක්‍රියව සිටි මාසයයි.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
පිටත්ව ගිය සේවාදායකයින් සංඛ්යාව

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
ඉතිරි ගනුදෙනුකරුවන් සංඛ්යාව

චූර්ණය ගණනය කරන්නේ කෙසේද?

එවැනි තරඟවලදී සහ සාමාන්යයෙන් ප්රායෝගිකව, පිටතට ගලායාම බොහෝ විට පුරෝකථනය කරනු ලබන්නේ මේ ආකාරයෙන් ය. සේවාදායකයා විවිධ කාල පරිච්ඡේදවල නිෂ්පාදන සහ සේවා භාවිතා කරයි, ඔහු සමඟ අන්තර්ක්‍රියා පිළිබඳ දත්ත ස්ථාවර දිග n හි ලක්ෂණ වල දෛශිකයක් ලෙස නිරූපණය කෙරේ. බොහෝ විට මෙම තොරතුරු ඇතුළත් වේ:

  • පරිශීලකයා ගුනාංගීකරනය කරන දත්ත (ජනගහන දත්ත, අලෙවිකරණ අංශය).
  • බැංකු නිෂ්පාදන සහ සේවා භාවිතයේ ඉතිහාසය (මේවා සෑම විටම අපට අවශ්‍ය කාල සීමාවක් හෝ කාලසීමාවකට බැඳී ඇති පාරිභෝගික ක්‍රියා වේ).
  • බාහිර දත්ත, එය ලබා ගැනීමට හැකි නම් - උදාහරණයක් ලෙස, සමාජ ජාල වලින් සමාලෝචන.

ඊට පසු, ඔවුන් එක් එක් කාර්යය සඳහා වෙනස් වන චූන් පිළිබඳ අර්ථකථනයක් ලබා ගනී. එවිට ඔවුන් යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතමයක් භාවිතා කරයි, එමඟින් සේවාදායකයෙකු ඉවත් වීමේ සම්භාවිතාව පුරෝකථනය කරයි ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය සාධක දෛශිකයක් මත පදනම්ව ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය. ඇල්ගොරිතම පුහුණු කිරීම සඳහා, තීරණ ගස් සමූහයක් තැනීම සඳහා සුප්‍රසිද්ධ රාමුවක් භාවිතා කරයි, XGBoost, සැහැල්ලු GBM, කැට්බූස්ට් හෝ එහි වෙනස් කිරීම්.

ඇල්ගොරිතමයම නරක නැත, නමුත් එය අවුල් සහගත බව පුරෝකථනය කිරීමේදී බරපතල අවාසි කිහිපයක් ඇත.

  • ඔහුට ඊනියා "මතකය" නැත.. ආකෘතියේ ආදානය යනු වත්මන් ලක්ෂ්‍යයට අනුරූප වන නිශ්චිත විශේෂාංග ගණනකි. පරාමිතිවල වෙනස්කම් ඉතිහාසය පිළිබඳ තොරතුරු ගබඩා කිරීම සඳහා, කාලයත් සමඟ පරාමිතීන්හි වෙනස්කම් සංලක්ෂිත විශේෂ ලක්ෂණ ගණනය කිරීම අවශ්ය වේ, උදාහරණයක් ලෙස, පසුගිය මාස 1,2,3, XNUMX, XNUMX තුළ බැංකු ගනුදෙනු සංඛ්යාව හෝ ප්රමාණය. මෙම ප්රවේශය තාවකාලික වෙනස්කම්වල ස්වභාවය අර්ධ වශයෙන් පිළිබිඹු කළ හැකිය.
  • ස්ථාවර පුරෝකථන ක්ෂිතිජය. ආකෘතියට පුරෝකථනය කළ හැක්කේ පෙර නිශ්චිත කාලයක් සඳහා පමණි, උදාහරණයක් ලෙස, මාසයකට පෙර පුරෝකථනයක්. වෙනත් කාල පරිච්ඡේදයක් සඳහා පුරෝකථනයක් අවශ්‍ය නම්, උදාහරණයක් ලෙස, මාස තුනක්, එවිට ඔබට පුහුණු කට්ටලය නැවත ගොඩනඟා නව ආකෘතියක් නැවත පුහුණු කළ යුතුය.

අපගේ ප්රවේශය

අපි සම්මත ප්රවේශයන් භාවිතා නොකරන බව අපි වහාම තීරණය කළා. අපට අමතරව, තවත් 497 දෙනෙක් ශූරතාවලියේ ලියාපදිංචි වූ අතර, ඔවුන් සෑම කෙනෙකුටම ඔවුන් පිටුපස සැලකිය යුතු අත්දැකීම් තිබුණි. එබැවින් එවැනි තත්වයන් තුළ සම්මත යෝජනා ක්රමයකට අනුව යමක් කිරීමට උත්සාහ කිරීම හොඳ අදහසක් නොවේ.

තවද අපි ද්විමය වර්ගීකරණ ආකෘතියට මුහුණ දෙන ගැටළු විසඳීමට පටන් ගත්තේ පාරිභෝගිකයින්ගේ කාලයෙහි සම්භාවිතා ව්‍යාප්තිය පුරෝකථනය කිරීමෙනි. සමාන ප්රවේශයක් දැකිය හැකිය මෙහි, එය සම්භාව්‍ය ප්‍රවේශයට වඩා වඩාත් නම්‍යශීලීව චූන් පුරෝකථනය කිරීමට සහ වඩාත් සංකීර්ණ උපකල්පන පරීක්ෂා කිරීමට ඔබට ඉඩ සලසයි. පිටතට ගලා යන කාලය ආදර්ශනය කරන බෙදාහැරීම් පවුලක් ලෙස, අපි බෙදාහැරීම තෝරා ගත්තෙමු වයිබුල් පැවැත්ම විශ්ලේෂණය සඳහා එහි පුළුල් භාවිතය සඳහා. සේවාදායකයාගේ හැසිරීම එක්තරා ආකාරයක පැවැත්මක් ලෙස සැලකිය හැකිය.

පරාමිති මත පදනම්ව Weibull සම්භාවිතා ඝනත්ව බෙදාහැරීම් සඳහා උදාහරණ මෙන්න ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය и ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය:

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

කාලයත් සමඟ වෙනස් පාරිභෝගිකයින් තිදෙනෙකුගේ සම්භාවිතා ඝනත්ව කාර්යය මෙයයි. කාලය මාස වලින් ඉදිරිපත් කෙරේ. වෙනත් වචන වලින් කිවහොත්, මෙම ප්‍රස්ථාරය මඟින් සේවාදායකයෙකු ඉදිරි මාස දෙක තුළ බොහෝ විට කඩාකප්පල් වීමට ඉඩ ඇති විට පෙන්වයි. ඔබට පෙනෙන පරිදි, බෙදාහැරීමක් ඇති සේවාදායකයෙකුට Weibull(2, 0.5) සහ Weibull සමඟ සිටින සේවාදායකයින්ට වඩා කලින් පිටවීමට වැඩි හැකියාවක් ඇත. (3,1) බෙදාහැරීම්.

ප්රතිඵලය වන්නේ සෑම සේවාදායකයෙකු සඳහාම, සෑම කෙනෙකුටම ආකෘතියකි
මාසය Weibull බෙදා හැරීමේ පරාමිතීන් පුරෝකථනය කරයි, එය කාලයත් සමඟ පිටතට ගලා යාමේ සම්භාවිතාවේ සිදුවීම වඩාත් හොඳින් පිළිබිඹු කරයි. වඩාත් විස්තරාත්මකව:

  • පුහුණු කට්ටලයේ ඉලක්කගත ලක්ෂණ වන්නේ නිශ්චිත සේවාලාභියෙකු සඳහා නිශ්චිත මාසයක් තුළ ඉතිරි වන කාලයයි.
  • පාරිභෝගිකයෙකු සඳහා චූන් අනුපාතයක් නොමැති නම්, අපි උපකල්පනය කරන්නේ වත්මන් මාසයේ සිට අප සතුව ඇති ඉතිහාසයේ අවසානය දක්වා වූ මාස ගණනට වඩා වැඩි වන කාලයයි.
  • භාවිතා කරන ලද ආකෘතිය: LSTM ස්තරය සහිත පුනරාවර්තන ස්නායුක ජාලය.
  • අලාභ ශ්‍රිතයක් ලෙස, අපි Weibull ව්‍යාප්තිය සඳහා සෘණ ලොග් සම්භාවිතා ශ්‍රිතය භාවිතා කරමු.

මෙම ක්රමයේ වාසි මෙන්න:

  • සම්භාවිතා බෙදා හැරීම, ද්විමය වර්ගීකරණයේ පැහැදිලි හැකියාවට අමතරව, විවිධ සිදුවීම් පිළිබඳ නම්‍යශීලී පුරෝකථනය කිරීමට ඉඩ සලසයි, උදාහරණයක් ලෙස, සේවාදායකයෙකු මාස ​​3 ක් ඇතුළත බැංකුවේ සේවාවන් භාවිතා කිරීම නවත්වන්නේද යන්න. එසේම, අවශ්‍ය නම්, මෙම ව්‍යාප්තිය මත විවිධ ප්‍රමිතික සාමාන්‍යකරණය කළ හැකිය.
  • LSTM පුනරාවර්තන ස්නායු ජාලයට මතකය ඇති අතර පවතින සමස්ත ඉතිහාසයම ඵලදායී ලෙස භාවිතා කරයි. කතාව පුළුල් වන විට හෝ පිරිපහදු කරන විට, නිරවද්‍යතාවය වැඩි වේ.
  • කාල පරිච්ඡේද කුඩා ඒවාට බෙදීමේදී (උදාහරණයක් ලෙස, මාස සතිවලට බෙදීමේදී) ප්රවේශය පහසුවෙන් පරිමාණය කළ හැකිය.

නමුත් හොඳ ආකෘතියක් නිර්මාණය කිරීමට එය ප්රමාණවත් නොවේ; ඔබ එහි ගුණාත්මකභාවය නිසි ලෙස ඇගයීමට ලක් කළ යුතුය.

ගුණාත්මකභාවය තක්සේරු කළේ කෙසේද?

අපි මෙට්‍රික් එක ලෙස ලිෆ්ට් වක්‍රය තෝරා ගත්තෙමු. එහි පැහැදිලි අර්ථ නිරූපණය නිසා එය එවැනි අවස්ථාවන් සඳහා ව්‍යාපාරයේ භාවිතා වේ, එය හොඳින් විස්තර කර ඇත මෙහි и මෙහි. ඔබ මෙම මෙට්‍රික් එකේ තේරුම එක වාක්‍යයකින් විස්තර කරන්නේ නම්, එය වනුයේ “ඇල්ගොරිතමයෙන් කී වතාවක් හොඳම අනාවැකිය පළ කරනවාද යන්නයි. ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරයඅහඹු ලෙස වඩා %."

පුහුණු ආකෘති

තරඟ කොන්දේසි මගින් විවිධ මාදිලි සහ ප්‍රවේශයන් සංසන්දනය කළ හැකි නිශ්චිත ගුණාත්මක මෙට්‍රික් ස්ථාපිත කර නැත. එපමනක් නොව, චූන් යන්නෙහි නිර්වචනය වෙනස් විය හැකි අතර ගැටළු ප්‍රකාශය මත රඳා පවතී, එය ව්‍යාපාරික අරමුණු මගින් තීරණය වේ. එබැවින්, කුමන ක්රමය වඩා හොඳද යන්න තේරුම් ගැනීම සඳහා, අපි ආකෘති දෙකක් පුහුණු කළෙමු:

  1. සමූහ තීරණ ගස් යන්ත්‍ර ඉගෙනීමේ ඇල්ගොරිතමයක් භාවිතා කරමින් බහුලව භාවිතා වන ද්විමය වර්ගීකරණ ප්‍රවේශයක් (සැහැල්ලු GBM);
  2. Weibull-LSTM ආකෘතිය

පරීක්ෂණ කට්ටලය පුහුණු කට්ටලයේ නොසිටි පෙර තෝරාගත් සේවාදායකයින් 500 කින් සමන්විත විය. සේවාදායකයා විසින් බිඳ දැමූ හරස් වලංගුකරණය භාවිතයෙන් ආකෘතිය සඳහා අධි-පරාමිතීන් තෝරා ගන්නා ලදී. එක් එක් ආකෘතිය පුහුණු කිරීම සඳහා එකම විශේෂාංග කට්ටල භාවිතා කරන ලදී.

ආකෘතියට මතකය නොමැති නිසා, ඒ සඳහා විශේෂ ලක්ෂණ ගෙන ඇති අතර, පසුගිය මාස තුන තුළ පරාමිතීන් සඳහා සාමාන්ය අගයට මාසයක් සඳහා පරාමිතිවල වෙනස්කම්වල අනුපාතය පෙන්වයි. පසුගිය මාස තුනක කාලය තුළ අගයන්හි වෙනස්වීම් අනුපාතය සංලක්ෂිත කළේ කුමක්ද? මෙය නොමැතිව, Random Forest-පාදක ආකෘතිය Weibull-LSTM ට සාපේක්ෂව අවාසි සහගත වනු ඇත.

ඇයි Weibull බෙදාහැරීම සමඟ LSTM සමූහ තීරණ ගැනීමේ ප්‍රවේශයකට වඩා හොඳ වන්නේ

පින්තූර කිහිපයකින් පමණක් මෙහි සියල්ල පැහැදිලිය.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
සම්භාව්‍ය ඇල්ගොරිතම සහ Weibull-LSTM සඳහා Lift Curve සංසන්දනය

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
සම්භාව්‍ය ඇල්ගොරිතම සහ Weibull-LSTM සඳහා Lift Curve Metric මාසය අනුව සංසන්දනය කිරීම

සාමාන්‍යයෙන්, LSTM සෑම අවස්ථාවකම පාහේ සම්භාව්‍ය ඇල්ගොරිතමයට වඩා උසස් වේ.

පුරෝකථනය කරන්න

Weibull බෙදාහැරීම සහිත LSTM සෛල සහිත පුනරාවර්තන ස්නායුක ජාලයක් මත පදනම් වූ ආකෘතියක් කල්තියා පුරෝකථනය කළ හැකිය, උදාහරණයක් ලෙස, ඉදිරි මාස n තුළ පාරිභෝගික අපගමනය පුරෝකථනය කළ හැකිය. n = 3 සඳහා වන අවස්ථාව සලකා බලන්න. මෙම අවස්ථාවෙහිදී, එක් එක් මාසය සඳහා, ස්නායු ජාලය විසින් සේවාදායකයා ඉවත් වන්නේද යන්න නිවැරදිව තීරණය කළ යුතුය, ඊළඟ මාසයේ සිට n වන මාසය දක්වා. වෙනත් වචන වලින් කිවහොත්, එය පාරිභෝගිකයා මාස nකට පසුව පවතිනු ඇත්ද යන්න නිවැරදිව තීරණය කළ යුතුය. මෙය කල්තියා පුරෝකථනයක් ලෙස සැලකිය හැකිය: සේවාදායකයා පිටව යාම ගැන සිතීමට පටන් ගත් මොහොත පුරෝකථනය කිරීම.

Weibull-LSTM සඳහා Lift Curve 1, 2 සහ 3 පිටතට ගලා යාමට පෙර සංසන්දනය කරමු:

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

යම් කාලයක් සඳහා තවදුරටත් ක්‍රියාකාරී නොවන සේවාදායකයින් සඳහා කරන ලද අනාවැකි ද වැදගත් බව අපි දැනටමත් ඉහත ලියා ඇත. එබැවින්, පිටත්ව ගිය පාරිභෝගිකයා දැනටමත් මාස එකක් හෝ දෙකක් අක්‍රියව සිටින විට, අපි නියැදියට එවැනි අවස්ථා එකතු කරන්නෙමු, සහ Weibull-LSTM එවැනි අවස්ථා churn ලෙස නිවැරදිව වර්ග කර ඇත්දැයි පරීක්ෂා කරන්න. එවැනි අවස්ථා නියැදියේ තිබූ බැවින්, ජාලය ඒවා හොඳින් හසුරුවනු ඇතැයි අපි අපේක්ෂා කරමු:

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

පාරිභෝගික රඳවා තබා ගැනීම

ඇත්ත වශයෙන්ම, එවැනි සහ එවැනි සේවාදායකයින් නිෂ්පාදනය භාවිතා කිරීම නැවැත්වීමට සූදානම් වන බවට තොරතුරු අතේ තබාගෙන කළ හැකි ප්‍රධාන දෙය මෙයයි. ගනුදෙනුකරුවන් රඳවා තබා ගැනීම සඳහා ඔවුන්ට ප්‍රයෝජනවත් යමක් ලබා දිය හැකි ආකෘතියක් තැනීම ගැන කතා කරමින්, ඔබට සමාන උත්සාහයන් පිළිබඳ ඉතිහාසයක් නොමැති නම් මෙය කළ නොහැක.

අපට එවැනි කතාවක් නොතිබූ නිසා අපි එය මේ ආකාරයෙන් තීරණය කළෙමු.

  1. අපි එක් එක් සේවාදායකයා සඳහා රසවත් නිෂ්පාදන හඳුනා ගන්නා ආකෘතියක් ගොඩනඟමු.
  2. සෑම මසකම අපි වර්ගීකාරකය ක්‍රියාත්මක කරන අතර පාරිභෝගිකයින් හැර යාමට ඉඩ ඇති බව හඳුනා ගනිමු.
  3. අපි සමහර ගනුදෙනුකරුවන්ට 1 වන ලක්ෂ්‍යයේ ආකෘතියට අනුව නිෂ්පාදනය ලබා දෙන අතර අපගේ ක්‍රියාවන් මතක තබා ගන්න.
  4. මාස කිහිපයකට පසු, අපි මෙයින් ඉවත් විය හැකි ගනුදෙනුකරුවන් අතරින් ඉතිරිව ඇත්තේ කුමක්ද සහ ඉතිරිව ඇත්තේ කුමක්ද යන්න බලමු. මේ අනුව, අපි පුහුණු නියැදියක් සාදන්නෙමු.
  5. පියවර 4 හි ලබාගත් ඉතිහාසය භාවිතා කරමින් අපි ආකෘතිය පුහුණු කරන්නෙමු.
  6. විකල්පයක් ලෙස, අපි ක්‍රියා පටිපාටිය නැවත කරන්නෙමු, පියවර 1 සිට ආකෘතිය 5 පියවරෙන් ලබාගත් ආකෘතිය සමඟ ප්‍රතිස්ථාපනය කරන්න.

සාමාන්‍ය A/B පරීක්‍ෂාවකින් එවැනි රඳවා ගැනීමේ ගුණාත්මකභාවය පිළිබඳ පරීක්‍ෂණයක් සිදු කළ හැක - අපි ඉවත් විය හැකි පාරිභෝගිකයින් කණ්ඩායම් දෙකකට බෙදන්නෙමු. අපි අපගේ රඳවා ගැනීමේ ආකෘතිය මත පදනම්ව එකකට නිෂ්පාදන පිරිනමන්නෙමු, අනෙකට අපි කිසිවක් ලබා නොදෙමු. අපගේ උදාහරණයේ 1 වන ස්ථානයේ දැනටමත් ප්රයෝජනවත් විය හැකි ආකෘතියක් පුහුණු කිරීමට අපි තීරණය කළෙමු.

අපට අවශ්‍ය වූයේ ඛණ්ඩනය හැකිතාක් අර්ථකථනය කළ හැකි ලෙස කිරීමටයි. මෙය සිදු කිරීම සඳහා, අපි පහසුවෙන් අර්ථ දැක්විය හැකි විශේෂාංග කිහිපයක් තෝරා ගත්තෙමු: මුළු ගනුදෙනු ගණන, වැටුප්, සම්පූර්ණ ගිණුම් පිරිවැටුම, වයස, ස්ත්‍රී පුරුෂ භාවය. “සිතියම්” වගුවේ ඇති විශේෂාංග තොරතුරු රහිත ලෙස සැලකිල්ලට නොගත් අතර, වලංගු කිරීමේ කට්ටලය සහ පුහුණු කට්ටලය අතර දත්ත කාන්දු වීම වළක්වා ගැනීම සඳහා සැකසීමේ සංකීර්ණත්වය හේතුවෙන් 3 “කොන්ත්‍රාත්තු” වගුවේ විශේෂාංග සැලකිල්ලට නොගන්නා ලදී.

Gaussian මිශ්‍රණ ආකෘති භාවිතයෙන් පොකුරු කිරීම සිදු කරන ලදී. Akaike තොරතුරු නිර්ණායකය 2 optima තීරණය කිරීමට අපට ඉඩ දුන්නේය. පළමු ප්රශස්තය පොකුරු 1 ට අනුරූප වේ. දෙවන ප්රශස්ත, අඩු ප්රකාශිත, පොකුරු 80 ට අනුරූප වේ. මෙම ප්‍රතිඵලය මත පදනම්ව, අපට පහත නිගමනයට එළඹිය හැක: පූර්වයෙන් ලබා දී ඇති තොරතුරු නොමැතිව දත්ත පොකුරුවලට බෙදීම අතිශයින් දුෂ්කර ය. වඩා හොඳ පොකුරු කිරීම සඳහා, ඔබට එක් එක් සේවාදායකයා විස්තරාත්මකව විස්තර කරන දත්ත අවශ්‍ය වේ.

එබැවින්, එක් එක් සේවාදායකයාට වෙනස් නිෂ්පාදනයක් පිරිනැමීම සඳහා අධීක්ෂණය කරන ලද ඉගෙනීමේ ගැටලුව සලකා බලන ලදී. පහත සඳහන් නිෂ්පාදන සලකා බලන ලදී: "කාලීන තැන්පතු", "ක්රෙඩිට් කාඩ්", "අතිරේක", "පාරිභෝගික ණය", "මෝටර් රථ ණය", "උකස්".

දත්තවල තවත් නිෂ්පාදන වර්ගයක් ඇතුළත් විය: "වත්මන් ගිණුම". නමුත් එහි අඩු තොරතුරු අන්තර්ගතය නිසා අපි එය සලකා බැලුවේ නැත. බැංකු ගනුදෙනුකරුවන් වන පරිශීලකයින් සඳහා, i.e. එහි නිෂ්පාදන භාවිතා කිරීම නතර කළේ නැත, කුමන නිෂ්පාදනයක් ඔවුන්ට උනන්දුවක් දැක්විය හැකිද යන්න අනාවැකි කිරීමට ආකෘතියක් ගොඩනගා ඇත. ලොජිස්ටික් ප්‍රතිගමනය ආකෘතිය ලෙස තෝරා ගන්නා ලද අතර, පළමු ප්‍රතිශත 10 සඳහා Lift අගය තත්ත්ව ඇගයීම් මෙට්‍රික් ලෙස භාවිතා කරන ලදී.

ආකෘතියේ ගුණාත්මකභාවය රූපයෙන් තක්සේරු කළ හැකිය.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය
පාරිභෝගිකයින් සඳහා නිෂ්පාදන නිර්දේශ ආකෘති ප්රතිඵල

ප්රතිඵලය

මෙම ප්‍රවේශය RAIF-අභියෝග 2017 AI ශූරතාවලියේ "බැංකු තුළ AI" කාණ්ඩයේ ප්‍රථම ස්ථානය අපට ගෙන ආවේය.

ස්වභාවික ව්‍යසනයක් මෙන් එය ළං වීමෙන් අපි චංචල බව පුරෝකථනය කළ ආකාරය

පෙනෙන විදිහට, ප්රධාන දෙය වූයේ අසාමාන්ය කෝණයකින් ගැටලුව වෙත ප්රවේශ වීම සහ සාමාන්යයෙන් වෙනත් තත්වයන් සඳහා භාවිතා කරන ක්රමයක් භාවිතා කිරීමයි.

පරිශීලකයින් විශාල වශයෙන් ගලා යාම සේවා සඳහා ස්වාභාවික විපතක් විය හැකි වුවද.

බැංකු පමණක් නොව, පිටතට ගලායාම සැලකිල්ලට ගැනීම වැදගත් වන වෙනත් ඕනෑම ප්රදේශයක් සඳහා මෙම ක්රමය සැලකිල්ලට ගත හැකිය. උදාහරණයක් ලෙස, අපි අපේම පිටතට ගලායාම ගණනය කිරීමට එය භාවිතා කළෙමු - Rostelecom හි සයිබීරියානු සහ ශාන්ත පීටර්ස්බර්ග් ශාඛා වල.

"දත්ත කැනීම් රසායනාගාරය" සමාගම "සෙවුම් ද්වාරය "ස්පුට්නික්"

මූලාශ්රය: www.habr.com

DDoS ආරක්ෂාව, VPS VDS සේවාදායකයන් සහිත අඩවි සඳහා විශ්වාසදායක සත්කාරකත්වය මිලදී ගන්න 🔥 DDoS ආරක්ෂාව, VPS VDS සේවාදායකයන් සහිත විශ්වාසදායක වෙබ් අඩවි සත්කාරකත්වය මිලදී ගන්න | ProHoster