රඳවා තබා ගැනීම: අපි පයිතන් සහ පැන්ඩාස් හි නිෂ්පාදන විශ්ලේෂණ සඳහා විවෘත මූලාශ්‍ර මෙවලම් ලිවූ ආකාරය

හෙලෝ, හබ්ර්. යෙදුමක හෝ වෙබ් අඩවියක පරිශීලක චලන ගමන් පථ සැකසීම සඳහා ක්‍රම සහ මෙවලම් මාලාවක් වසර හතරක සංවර්ධනයේ ප්‍රතිඵල සඳහා මෙම ලිපිය කැප කෙරේ. සංවර්ධනයේ කර්තෘ - මැක්සිම් ගොඩ්සි, නිෂ්පාදන නිර්මාපකයින්ගේ කණ්ඩායමේ ප්‍රධානියා වන අතර ලිපියේ කතුවරයා ද වේ. නිෂ්පාදනයම Retentioneering ලෙස නම් කරන ලදී; එය දැන් විවෘත මූලාශ්‍ර පුස්තකාලයක් බවට පරිවර්තනය කර Github මත පළ කර ඇති අතර එමඟින් ඕනෑම කෙනෙකුට එය භාවිතා කළ හැකිය. නිෂ්පාදන සහ අලෙවිකරණ විශ්ලේෂණය, ප්‍රවර්ධනය සහ නිෂ්පාදන සංවර්ධනයට සම්බන්ධ අයට මේ සියල්ල උනන්දු විය හැකිය. මාර්ගය වන විට, Habré මත රඳවා තබා ගැනීම සමඟ වැඩ කිරීමේ එක් සිද්ධියක් ගැන ලිපියක් දැනටමත් ප්‍රකාශයට පත් කර ඇත. නිෂ්පාදනයට කළ හැකි දේ සහ එය භාවිතා කළ හැකි ආකාරය නව ද්රව්ය පැහැදිලි කරයි.

ලිපිය කියවීමෙන් පසු, ඔබට ඔබේම රඳවා තබා ගැනීමක් ලිවීමට හැකි වනු ඇත; එය යෙදුමේ සහ ඉන් ඔබ්බෙහි පරිශීලක ගමන් පථ සැකසීම සඳහා ඕනෑම ප්‍රමිතිගත ක්‍රමයක් විය හැකිය, හැසිරීමේ ලක්ෂණ විස්තරාත්මකව බැලීමට සහ වර්ධනය සඳහා මෙයින් තීක්ෂ්ණ බුද්ධිය ලබා ගැනීමට ඔබට ඉඩ සලසයි. ව්යාපාර මිනුම්

රඳවා තබා ගැනීම යනු කුමක්ද සහ එය අවශ්ය වන්නේ ඇයි?

අපගේ මූලික ඉලක්කය වූයේ Growth Hacking "ඩිජිටල් මන්තර ගුරුකම්" ලෝකයෙන් සංඛ්‍යා, විශ්ලේෂණ සහ අනාවැකි ලෝකයට ගෙන යාමයි. එහි ප්‍රතිඵලයක් වශයෙන්, නිෂ්පාදන විශ්ලේෂණ, අපූරු කථා වෙනුවට සංඛ්‍යාවලට කැමති අය සඳහා පිරිසිදු ගණිතය සහ ක්‍රමලේඛනය දක්වා අඩු කර ඇති අතර, “නැවත සන්නාමකරණය”, “නැවත ස්ථානගත කිරීම” වැනි ප්‍රබෝධමත් වචන සඳහා සූත්‍ර හොඳ යැයි පෙනෙන නමුත් ප්‍රායෝගිකව සුළු වශයෙන් උපකාරී වේ.

මෙම ගැටළු විසඳීම සඳහා, අපට ප්‍රස්තාර සහ ගමන් පථ හරහා විශ්ලේෂණ සඳහා රාමුවක් අවශ්‍ය වූ අතර, ඒ සමඟම මිනිසුන්ට සහ රොබෝවරුන්ට තේරුම් ගත හැකි නිත්‍ය නිෂ්පාදන විශ්ලේෂණ කාර්යයන් විස්තර කිරීමේ මාර්ගයක් ලෙස සාමාන්‍ය විශ්ලේෂක චර්යාවන් සරල කරන පුස්තකාලයක් අවශ්‍ය විය. පුස්තකාලය මඟින් පරිශීලක හැසිරීම විස්තර කිරීමට සහ එය සංවර්ධකයින් සහ විශ්ලේෂකයින්ගේ සාමාන්‍ය කාර්යයන් සරල කර ස්වයංක්‍රීය කරන අතර ව්‍යාපාරය සමඟ ඔවුන්ගේ සන්නිවේදනය පහසු කරන විධිමත් සහ පැහැදිලි භාෂාවකින් නිෂ්පාදන ව්‍යාපාර ප්‍රමිතිකවලට සම්බන්ධ කිරීමට හැකියාව සපයයි.

රඳවා තබා ගැනීම යනු ඕනෑම ඩිජිටල් (සහ පමණක් නොව) නිෂ්පාදනයකට අනුවර්තනය කළ හැකි සහ ඒකාබද්ධ කළ හැකි ක්‍රමයක් සහ විශ්ලේෂණාත්මක මෘදුකාංග මෙවලම් වේ.

අපි 2015 දී නිෂ්පාදනයේ වැඩ ආරම්භ කළා. දැන් මෙය තවමත් පරමාදර්ශී නොවූවත්, දත්ත සමඟ වැඩ කිරීම සඳහා Python සහ Pandas හි මෙවලම් කට්ටලයක්, sklearn-like api සහිත යන්ත්‍ර ඉගෙනුම් ආකෘති, යන්ත්‍ර ඉගෙනුම් ආකෘති eli5 සහ shap හි ප්‍රතිඵල අර්ථකථනය කිරීමේ මෙවලම් කට්ටලයකි.

ඔක්කොම ඔතා විවෘත Github ගබඩාවේ පහසු විවෘත-මූලාශ්‍ර පුස්තකාලයකට - රඳවා ගැනීමේ-මෙවලම්. පුස්තකාලය භාවිතා කිරීම අපහසු නැත; නිෂ්පාදන විශ්ලේෂණ වලට ප්‍රිය කරන, නමුත් මීට පෙර කේතය ලියා නැති ඕනෑම කෙනෙකුට පාහේ, අපගේ විශ්ලේෂණ ක්‍රම ස්වාධීනව සහ සැලකිය යුතු කාල ආයෝජනයකින් තොරව ඔවුන්ගේ දත්ත වලට යෙදිය හැක.

හොඳයි, ක්‍රමලේඛකයෙකුට, යෙදුම් නිර්මාපකයෙකුට හෝ මින් පෙර කිසි දිනක විශ්ලේෂණ සිදු නොකළ සංවර්ධන හෝ පරීක්ෂණ කණ්ඩායමක සාමාජිකයෙකුට මෙම කේතය සමඟ සෙල්ලම් කිරීමට පටන් ගෙන බාහිර උදව් නොමැතිව ඔවුන්ගේ යෙදුමේ භාවිත රටා බැලීමට හැකිය.

විශ්ලේෂණයේ මූලික අංගයක් ලෙස පරිශීලක ගමන් පථය සහ එය සැකසීම සඳහා ක්රම

පරිශීලක ගමන් පථය යනු නිශ්චිත කාල වකවානුවල පරිශීලක ප්‍රාන්තවල අනුපිළිවෙලකි. එපමනක් නොව, සිදුවීම් සබැඳි සහ නොබැඳි යන දෙඅංශයෙන්ම විවිධ දත්ත මූලාශ්‍රවලින් පැමිණිය හැක. පරිශීලකයාට සිදුවන සිදුවීම් ඔහුගේ ගමන් පථයේ කොටසකි. උදාහරණ:
• බොත්තම එබුවා
• පින්තූරය දැක්කා
• තිරයට පහර දෙන්න
• විද්‍යුත් තැපෑලක් ලැබුණි
• නිෂ්පාදනය මිතුරෙකුට නිර්දේශ කර ඇත
• පෝරමය පුරවා ඇත
• තිරය තට්ටු කළා
• අනුචලනය කරන ලදී
• මුදල් ලේඛනයට ගියා
• බුරිටෝ එකක් ඇණවුම් කළා
• බුරිටෝ එකක් කෑවා
• බුරිටෝ ආහාරයට ගැනීමෙන් විෂ විය
• පිටුපස දොරටුවෙන් ආපන ශාලාවට ඇතුළු විය
• ඉදිරිපස දොරටුවෙන් ඇතුල් විය
• යෙදුම අවම කර ඇත
• තල්ලු දැනුම්දීමක් ලැබිණි
• X ට වඩා වැඩි කාලයක් තිරය මත සිරවී තිබුණි
• ඇණවුම සඳහා ගෙවා ඇත
• ඇණවුම මිලදී ගත්තා
• ණයක් ප්‍රතික්ෂේප කරන ලදී

ඔබ පරිශීලකයින් පිරිසකගේ ගමන් පථය දත්ත ගෙන සංක්‍රාන්ති ව්‍යුහගත වී ඇති ආකාරය අධ්‍යයනය කරන්නේ නම්, යෙදුම තුළ ඔවුන්ගේ හැසිරීම ව්‍යුහගත වී ඇති ආකාරය හරියටම සොයා ගත හැක. ප්‍රස්ථාරයක් හරහා මෙය සිදු කිරීම පහසු වන අතර එහි ප්‍රාන්ත නෝඩ් වන අතර ප්‍රාන්ත අතර සංක්‍රමණය දාර වේ:

රඳවා තබා ගැනීම: අපි පයිතන් සහ පැන්ඩාස් හි නිෂ්පාදන විශ්ලේෂණ සඳහා විවෘත මූලාශ්‍ර මෙවලම් ලිවූ ආකාරය

"ට්‍රැක්ටරි" යනු ඉතා පහසු සංකල්පයකි - මෙම ක්‍රියාවන්ගේ විස්තරයට ඕනෑම අමතර දත්තයක් එක් කිරීමේ හැකියාව ඇති සියලුම පරිශීලක ක්‍රියා පිළිබඳ සවිස්තරාත්මක තොරතුරු එහි අඩංගු වේ. මෙය විශ්වීය වස්තුවක් බවට පත් කරයි. ඔබට ධාවන පථ සමඟ වැඩ කිරීමට ඉඩ සලසන ලස්සන සහ පහසු මෙවලම් තිබේ නම්, ඔබට සමානකම් සොයාගෙන ඒවා කොටස් කළ හැකිය.

ගමන් පථ ඛණ්ඩනය මුලදී ඉතා සංකීර්ණ බවක් පෙනෙන්නට තිබේ. සාමාන්‍ය තත්වයකදී, මෙය සිදු වේ - ඔබ සම්බන්ධක අනුකෘති සංසන්දනය හෝ අනුක්‍රමික පෙළගැස්ම භාවිතා කළ යුතුය. අපි වඩාත් සරල ක්‍රමයක් සොයා ගැනීමට සමත් වූවෙමු - ගමන් පථ විශාල ප්‍රමාණයක් අධ්‍යයනය කිරීම සහ ඒවා පොකුරු කිරීම හරහා කොටස් කිරීම.

එය සිදු වූ පරිදි, අඛණ්ඩ නිරූපණයන් භාවිතා කරමින් ගමන් පථයක් ලක්ෂ්‍යයක් බවට පත් කළ හැකිය, උදාහරණයක් ලෙස, ටීඑෆ්-අයිඩීඑෆ්. පරිවර්තනයෙන් පසු, ගමන් පථය අභ්‍යවකාශයේ ලක්ෂ්‍යයක් බවට පත් වන අතර එහිදී විවිධ සිදුවීම් සහ ගමන් පථයේ ඒවා අතර සංක්‍රාන්ති සාමාන්‍යකරණය වීම අක්ෂය ඔස්සේ සැලසුම් කර ඇත. විශාල දහසක් හෝ ඊට වැඩි මාන අවකාශයකින් (dimS=sum(සිදුවීම් වර්ග)+sum(ngrams_2 වර්ග)) මෙම දෙය භාවිතා කරමින් තලයකට ප්‍රක්ෂේපණය කළ හැක. TSNE. TSNE යනු අවකාශයේ මානය අක්ෂ 2 දක්වා අඩු කරන පරිවර්තනයක් වන අතර, හැකි නම්, ලක්ෂ්‍ය අතර සාපේක්ෂ දුර ආරක්ෂා කරයි. ඒ අනුව, විවිධ ගමන් පථවල ලක්ෂ්‍ය එකින් එක පිහිටා තිබූ ආකාරය අධ්‍යයනය කිරීමට පැතලි සිතියමක්, ගමන් පථවල රූපමය ප්‍රක්ෂේපණ සිතියමක් මත හැකි වේ. එය ඔවුන් එකිනෙකාට කෙතරම් සමීප හෝ වෙනස්ද යන්න විශ්ලේෂණය කරයි, ඒවා පොකුරු සෑදුවේද නැතහොත් සිතියම පුරා විසිරී තිබේද යනාදිය:

රඳවා තබා ගැනීම: අපි පයිතන් සහ පැන්ඩාස් හි නිෂ්පාදන විශ්ලේෂණ සඳහා විවෘත මූලාශ්‍ර මෙවලම් ලිවූ ආකාරය

රඳවා ගැනීමේ විශ්ලේෂණ මෙවලම් මගින් සංකීර්ණ දත්ත සහ ගමන් පථ එකිනෙක හා සැසඳිය හැකි දර්ශනයක් බවට පත් කිරීමේ හැකියාව ලබා දෙන අතර, පසුව පරිවර්තනයේ ප්‍රතිඵලය පරීක්ෂා කර අර්ථකථනය කළ හැකිය.

ධාවන පථ සැකසීම සඳහා සම්මත ක්‍රම ගැන කතා කරමින්, අපි අදහස් කරන්නේ රඳවා තබා ගැනීමේදී අප ක්‍රියාත්මක කර ඇති ප්‍රධාන මෙවලම් තුනක් - ප්‍රස්ථාර, පියවර න්‍යාස සහ ගමන් පථ ප්‍රක්ෂේපණ සිතියම්.

Google Analytics, Firebase සහ සමාන විශ්ලේෂණ පද්ධති සමඟ වැඩ කිරීම තරමක් සංකීර්ණ වන අතර 100% ඵලදායී නොවේ. ගැටළුව වන්නේ පරිශීලකයා සඳහා සීමාවන් ගණනාවක් වන අතර, එහි ප්රතිඵලයක් ලෙස එවැනි පද්ධතිවල විශ්ලේෂකයාගේ කාර්යය මූසික ක්ලික් කිරීම් සහ පෙති තෝරාගැනීම මත රඳා පවතී. රඳවා තබා ගැනීම මඟින් Google Analytics හි මෙන් පුනීල සමඟ පමණක් නොව, පරිශීලක ගමන් පථ සමඟ වැඩ කිරීමට හැකි වේ, එහිදී විස්තර මට්ටම යම් කොටසක් සඳහා ගොඩනගා ඇතත්, බොහෝ විට පුනීලයකට අඩු වේ.

රඳවා තබා ගැනීම සහ නඩු

සංවර්ධිත මෙවලම භාවිතා කිරීමේ උදාහරණයක් ලෙස, අපට රුසියාවේ විශාල නිකේතන සේවාවක් උපුටා දැක්විය හැකිය. මෙම සමාගමට පාරිභෝගිකයින් අතර ජනප්‍රිය ඇන්ඩ්‍රොයිඩ් ජංගම යෙදුමක් ඇත. ජංගම යෙදුමෙන් වාර්ෂික පිරිවැටුම රූබල් මිලියන 7 ක් පමණ වූ අතර සෘතුමය උච්චාවචනයන් 60-130 දහසක් විය. එම සමාගමට iOS සඳහා යෙදුමක් ද ඇති අතර Apple යෙදුම භාවිතා කරන්නෙකුගේ සාමාන්‍ය බිල්පත සාමාන්‍ය බිල්පතට වඩා වැඩි විය. ඇන්ඩ්රොයිඩ් යෙදුම භාවිතා කරන සේවාදායකයෙක් - 1080 rub. එදිරිව 1300 rub.

ඇන්ඩ්රොයිඩ් යෙදුමේ කාර්යක්ෂමතාව වැඩි කිරීමට සමාගම තීරණය කළ අතර, ඒ සඳහා එය සම්පූර්ණ විශ්ලේෂණයක් සිදු කරන ලදී. යෙදුමේ සඵලතාවය වැඩි කිරීම පිළිබඳව උපකල්පන දුසිම් කිහිපයක් ජනනය විය. Retentionneering භාවිතා කිරීමෙන් පසු, ගැටළුව නව පරිශීලකයින්ට පෙන්වන පණිවිඩවල ඇති බව පෙනී ගියේය. වෙළඳ නාමය, සමාගමේ ප්රතිලාභ සහ මිල ගණන් පිළිබඳ තොරතුරු ඔවුන්ට ලැබුණි. නමුත්, එය සිදු වූ පරිදි, පණිවිඩ පරිශීලකයාට යෙදුමේ වැඩ කරන්නේ කෙසේදැයි ඉගෙන ගැනීමට උපකාරී විය යුතුය.

රඳවා තබා ගැනීම: අපි පයිතන් සහ පැන්ඩාස් හි නිෂ්පාදන විශ්ලේෂණ සඳහා විවෘත මූලාශ්‍ර මෙවලම් ලිවූ ආකාරය

මෙය සිදු කරන ලද අතර, එහි ප්රතිඵලයක් ලෙස යෙදුම අස්ථාපනය කිරීම අඩු වූ අතර, ඇණවුමට පරිවර්තනය කිරීමේ වැඩිවීම 23% කි. මුලදී, පැමිණෙන ගමනාගමනයෙන් සියයට 20 ක් පරීක්ෂණයට ලබා දී ඇත, නමුත් දින කිහිපයකට පසු, පළමු ප්රතිඵල විශ්ලේෂණය කිරීමෙන් සහ ප්රවණතාවය තක්සේරු කිරීමෙන් පසුව, ඔවුන් සමානුපාතිකයන් ආපසු හැරවූ අතර, ඊට පටහැනිව, පාලන කණ්ඩායම සඳහා සියයට 20 ක් ඉතිරි කර ඇත. සියයට අසූවක් පරීක්ෂණයට ඉදිරිපත් විය. සතියකට පසු, තවත් උපකල්පන දෙකක පරීක්ෂණ අනුපිළිවෙලින් එකතු කිරීමට තීරණය විය. සති හතක් තුළ, Android යෙදුමෙන් පිරිවැටුම පෙර මට්ටමට සාපේක්ෂව එකහමාරක ගුණයකින් වැඩි විය.

රඳවා තබා ගැනීම සමඟ වැඩ කරන්නේ කෙසේද?

පළමු පියවර ඉතා සරලයි - pip install retentioneering විධානය සමඟ පුස්තකාලය බාගන්න. සමහර නිෂ්පාදන විශ්ලේෂණ කාර්යයන් සඳහා සූදානම් කළ උදාහරණ සහ දත්ත සැකසීමේ අවස්ථා ගබඩාවේම අඩංගු වේ. පළමු දැන හඳුනා ගැනීම සඳහා ප්රමාණවත් වන තෙක් කට්ටලය නිරන්තරයෙන් යාවත්කාලීන වේ. ඕනෑම කෙනෙකුට සූදානම් කළ මොඩියුල ගෙන ඒවා වහාම ඔවුන්ගේ කාර්යයන් සඳහා යෙදිය හැකිය - මෙය වඩාත් සවිස්තරාත්මක විශ්ලේෂණ ක්‍රියාවලියක් සහ හැකි ඉක්මනින් හා කාර්යක්ෂමව පරිශීලක ගමන් පථ ප්‍රශස්තිකරණය කිරීමේ ක්‍රියාවලිය වහාම සැකසීමට ඉඩ සලසයි. මේ සියල්ල පැහැදිලි කේතයක් හරහා යෙදුම් භාවිත රටා සොයා ගැනීමට සහ මෙම අත්දැකීම සගයන් සමඟ බෙදා ගැනීමට හැකි වේ.

රඳවා තබා ගැනීම ඔබේ යෙදුමේ ජීවිත කාලය පුරාවටම භාවිතා කිරීමට වටිනා මෙවලමක් වන අතර, ඒ ඇයි:

  • රඳවා තබා ගැනීම පරිශීලක ගමන් පථයන් ලුහුබැඳීම සහ අඛණ්ඩව ප්‍රශස්ත කිරීම සහ ව්‍යාපාර කාර්ය සාධනය වැඩිදියුණු කිරීම සඳහා ඵලදායී වේ. මේ අනුව, නව විශේෂාංග බොහෝ විට ඊ-වාණිජ්‍ය යෙදුම් වලට එකතු කරනු ලැබේ, නිෂ්පාදනයට ඇති බලපෑම සෑම විටම නිවැරදිව පුරෝකථනය කළ නොහැක. සමහර අවස්ථාවලදී, නව සහ පැරණි කාර්යයන් අතර අනුකූලතා ගැටළු පැන නගී - උදාහරණයක් ලෙස, නව ඒවා පවතින ඒවා "කැනිබල්" කරයි. මෙම තත්වය තුළ, ගමන් පථ පිළිබඳ නිරන්තර විශ්ලේෂණය හරියටම අවශ්‍ය වේ.
  • වෙළඳ ප්‍රචාරණ නාලිකා සමඟ වැඩ කිරීමේදී තත්වය සමාන වේ: නව ගමනාගමන ප්‍රභවයන් සහ වෙළඳ ප්‍රචාරණ නිර්මාණ නිරන්තරයෙන් පරීක්ෂා කරනු ලැබේ, සෘතුමයභාවය, ප්‍රවණතා සහ වෙනත් සිදුවීම්වල බලපෑම නිරීක්ෂණය කිරීම අවශ්‍ය වන අතර එමඟින් වැඩි වැඩියෙන් නව පන්ති ගැටළු මතු වීමට හේතු වේ. මෙයට පරිශීලක යාන්ත්‍ර විද්‍යාව පිළිබඳ නිරන්තර අධීක්ෂණය සහ අර්ථ නිරූපණය අවශ්‍ය වේ.
  • යෙදුමක ක්‍රියාකාරිත්වයට නිරන්තරයෙන් බලපාන සාධක ගණනාවක් තිබේ. උදාහරණයක් ලෙස, සංවර්ධකයින්ගෙන් නව නිකුතු: වත්මන් ගැටළුවක් වසා දැමීම, ඔවුන් නොදැනුවත්වම පැරණි එක ආපසු ලබා දීම හෝ සම්පූර්ණයෙන්ම නව එකක් නිර්මාණය කරයි. කාලයත් සමඟම, නව නිකුතු ගණන වර්ධනය වන අතර, පරිශීලක ගමන් පථ විශ්ලේෂණය කිරීම ඇතුළුව දෝෂ ලුහුබැඳීමේ ක්‍රියාවලිය ස්වයංක්‍රීය කළ යුතුය.

සමස්තයක් වශයෙන්, රඳවා තබා ගැනීම ඵලදායී මෙවලමකි. නමුත් පරිපූර්ණත්වයට සීමාවක් නොමැත - එය එහි පදනම මත ගොඩනඟා වැඩිදියුණු කළ හැකි, දියුණු කළ හැකි සහ නව සිසිල් නිෂ්පාදන කළ යුතුය. ව්‍යාපෘතියේ ප්‍රජාව වඩාත් ක්‍රියාකාරී වන තරමට ගෑරුප්පු වැඩි වන අතර එය භාවිතා කිරීම සඳහා නව රසවත් විකල්ප දිස්වනු ඇත.

රඳවා ගැනීමේ මෙවලම් පිළිබඳ වැඩි විස්තර:

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න