නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය

මගේ නම Pavel Parkhomenko, මම ML සංවර්ධකයෙක්. මෙම ලිපියෙන්, මම Yandex.Zen සේවාවේ ව්‍යුහය ගැන කතා කිරීමට සහ තාක්ෂණික වැඩිදියුණු කිරීම් බෙදා ගැනීමට කැමතියි, එය ක්‍රියාත්මක කිරීම මඟින් නිර්දේශවල ගුණාත්මකභාවය වැඩි කිරීමට හැකි වී තිබේ. මිලි තත්පර කිහිපයකින් මිලියන ගණනක ලේඛන අතර පරිශීලකයාට වඩාත්ම අදාළ ඒවා සොයා ගන්නේ කෙසේදැයි මෙම සටහනෙන් ඔබ ඉගෙන ගනු ඇත; විශාල න්‍යාසයක (තීරු මිලියන ගණනකින් සහ පේළි මිලියන ගණනකින් සමන්විත) අඛණ්ඩ වියෝජනය සිදු කරන්නේ කෙසේද, එවිට නව ලේඛනවලට විනාඩි දස දහස් ගණනකින් දෛශිකය ලැබෙනු ඇත; වීඩියෝ සඳහා හොඳ දෛශික නිරූපණයක් ලබා ගැනීම සඳහා පරිශීලක ලිපි න්‍යාස වියෝජනය නැවත භාවිතා කරන්නේ කෙසේද.

නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය

අපගේ නිර්දේශ දත්ත ගබඩාවේ විවිධ ආකෘති වල මිලියන ගණනක් ලේඛන අඩංගු වේ: අපගේ වේදිකාවේ නිර්මාණය කරන ලද සහ බාහිර අඩවි, වීඩියෝ, ආඛ්‍යාන සහ කෙටි පළ කිරීම් වලින් ලබාගත් පෙළ ලිපි. එවැනි සේවාවක් සංවර්ධනය කිරීම තාක්ෂණික අභියෝග විශාල සංඛ්යාවක් සමඟ සම්බන්ධ වේ. ඒවායින් කිහිපයක් මෙන්න:

  • පරිගණන කාර්යයන් බෙදන්න: සියලුම බර මෙහෙයුම් නොබැඳි ලෙස කරන්න, සහ තත්‍ය කාලීනව 100-200 ms සඳහා වගකියනු පිණිස ආකෘතිවල ඉක්මන් යෙදුම පමණක් සිදු කරන්න.
  • පරිශීලක ක්‍රියාවන් ඉක්මනින් සැලකිල්ලට ගන්න. මෙය සිදු කිරීම සඳහා, සියලුම සිදුවීම් ක්ෂණිකව නිර්දේශ කරන්නා වෙත ලබා දීම සහ ආකෘතිවල ප්රතිඵලවලට බලපෑම් කිරීම අවශ්ය වේ.
  • නව පරිශීලකයින් සඳහා එය ඉක්මනින් ඔවුන්ගේ හැසිරීමට අනුවර්තනය වන පරිදි සංග්‍රහය සාදන්න. පද්ධතියට අලුතින් සම්බන්ධ වූ පුද්ගලයින්ට ඔවුන්ගේ ප්‍රතිපෝෂණය නිර්දේශයන්ට බලපාන බව හැඟිය යුතුය.
  • නව ලිපියක් නිර්දේශ කරන්නේ කාටදැයි ඉක්මනින් තේරුම් ගන්න.
  • නව අන්තර්ගතයේ නිරන්තර මතුවීම සඳහා ඉක්මනින් ප්රතිචාර දක්වන්න. සෑම දිනකම ලිපි දස දහස් ගණනක් පළ වන අතර, ඒවායින් බොහොමයක් සීමිත ආයු කාලයක් ඇත (කියන්න, ප්‍රවෘත්ති). චිත්‍රපට, සංගීතය සහ වෙනත් දිගුකාලීන සහ මිල අධික අන්තර්ගතයන් නිර්මාණය කිරීම සඳහා ඔවුන් වෙන්කර හඳුනා ගන්නේ මෙයයි.
  • දැනුම එක් වසමකින් තවත් වසමකට මාරු කරන්න. නිර්දේශ පද්ධතියක පෙළ ලිපි සඳහා ආකෘති පුහුණු කර තිබේ නම් සහ අපි එයට වීඩියෝ එකතු කරන්නේ නම්, නව ආකාරයේ අන්තර්ගත වඩා හොඳ ශ්‍රේණිගත කිරීම සඳහා අපට පවතින මාදිලි නැවත භාවිත කළ හැක.

අපි මේ ප්‍රශ්න විසඳපු හැටි මම කියන්නම්.

අපේක්ෂකයින් තෝරා ගැනීම

ශ්‍රේණිගත කිරීමේ ගුණාත්මක භාවයේ ප්‍රායෝගිකව කිසිදු පිරිහීමකින් තොරව, සලකා බලනු ලබන ලේඛන සංඛ්‍යාව මිලි තත්පර කිහිපයකින් දහස් ගුණයකින් අඩු කරන්නේ කෙසේද?

අපි බොහෝ ML මාදිලි පුහුණු කර, ඒවා මත පදනම් වූ විශේෂාංග ජනනය කර, පරිශීලකයා සඳහා ලේඛන ශ්‍රේණිගත කරන වෙනත් ආකෘතියක් පුහුණු කළෙමු යැයි සිතමු. සෑම දෙයක්ම හොඳ වනු ඇත, නමුත් ඔබට මෙම ලේඛන මිලියන ගණනක් තිබේ නම්, සහ නිර්දේශයන් 100-200 ms තුළ ගොඩනගා ගත යුතු නම්, ඔබට සියලු ලේඛන සඳහා සියලු සලකුණු තථ්‍ය කාලීනව ගෙන ගණනය කළ නොහැක. කර්තව්‍යය වන්නේ පරිශීලකයා සඳහා ශ්‍රේණිගත කරනු ලබන මිලියන ගණනකින් නිශ්චිත උප කුලකයක් තෝරා ගැනීමයි. මෙම අදියර සාමාන්‍යයෙන් අපේක්ෂක තේරීම ලෙස හැඳින්වේ. ඒ සඳහා අවශ්‍යතා කිහිපයක් තිබේ. පළමුව, තේරීම ඉතා ඉක්මනින් සිදුවිය යුතුය, එවිට ශ්‍රේණිගත කිරීම සඳහා හැකි තරම් කාලයක් ඉතිරි වේ. දෙවනුව, ශ්‍රේණිගත කිරීම සඳහා ලේඛන සංඛ්‍යාව විශාල ලෙස අඩු කිරීමෙන්, අපි පරිශීලකයාට අදාළ ලේඛන හැකිතාක් සම්පූර්ණයෙන්ම සංරක්ෂණය කළ යුතුය.

අපේක්ෂකයින් තෝරා ගැනීමේ අපගේ මූලධර්මය විකාශනය වී ඇති අතර, මේ මොහොතේ අපි බහු-අදියර යෝජනා ක්‍රමයකට පැමිණ ඇත:

නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය

පළමුව, සියලුම ලේඛන කණ්ඩායම් වලට බෙදී ඇති අතර, වඩාත් ජනප්රිය ලේඛන එක් එක් කණ්ඩායමෙන් ගනු ලැබේ. කණ්ඩායම් අඩවි, මාතෘකා, පොකුරු විය හැක. එක් එක් පරිශීලකයා සඳහා, ඔහුගේ ඉතිහාසය මත පදනම්ව, ඔහුට සමීපතම කණ්ඩායම් තෝරාගෙන ඔවුන්ගෙන් හොඳම ලේඛන ගනු ලැබේ. තථ්‍ය කාලය තුළ පරිශීලකයාට සමීපතම ලේඛන තෝරාගැනීමට අපි kNN දර්ශකය භාවිතා කරමු. kNN දර්ශකයක් තැනීම සඳහා ක්‍රම කිහිපයක් තිබේ; අපගේ හොඳම ක්‍රමය ක්‍රියාත්මක විය HNSW (ධූරාවලි යාත්‍රා කළ හැකි කුඩා ලෝක ප්‍රස්ථාර). මෙය මිලි තත්පර කිහිපයකින් මිලියන ගණනක දත්ත ගබඩාවකින් පරිශීලකයෙකු සඳහා N සමීපතම දෛශික සොයා ගැනීමට ඔබට ඉඩ සලසන ධූරාවලි ආකෘතියකි. අපි පළමුව අපගේ සම්පූර්ණ ලේඛන දත්ත සමුදාය නොබැඳි ලෙස සුචිගත කරමු. දර්ශකය තුළ සෙවීම ඉතා ඉක්මනින් ක්‍රියාත්මක වන බැවින්, ශක්තිමත් කාවැද්දීම් කිහිපයක් තිබේ නම්, ඔබට දර්ශක කිහිපයක් (එක් එක් කාවැද්දීම සඳහා එක් දර්ශකයක්) සාදා ඒවායින් එකකට තත්‍ය වේලාවට ප්‍රවේශ විය හැකිය.

සෑම පරිශීලකයෙකු සඳහාම අපට තවමත් ලේඛන දස දහස් ගණනක් ඇත. මෙය තවමත් සියලුම විශේෂාංග ගණන් කිරීමට බොහෝ දේ ඇත, එබැවින් මෙම අදියරේදී අපි සැහැල්ලු ශ්‍රේණිගත කිරීම භාවිතා කරමු - අඩු විශේෂාංග සහිත සැහැල්ලු බර ශ්‍රේණිගත කිරීමේ ආකෘතියකි. කාර්යය වන්නේ බර ආකෘතියක් ඉහළින් ඇති ලේඛන මොනවාදැයි අනාවැකි කීමයි. ඉහළම පුරෝකථනය සහිත ලේඛන බර ආකෘතියේ, එනම් ශ්‍රේණිගත කිරීමේ අවසාන අදියරේදී භාවිතා කරනු ඇත. මෙම ප්‍රවේශය මඟින් පරිශීලකයා සඳහා සලකා බලන ලේඛනවල දත්ත සමුදාය මිලි තත්පර දස දහස් ගණනකින් මිලියන ගණනකින් අඩු කිරීමට ඔබට ඉඩ සලසයි.

ALS ධාවන කාලය තුළ පියවර

ක්ලික් කිරීමකින් පසු වහාම පරිශීලක ප්‍රතිපෝෂණ සැලකිල්ලට ගන්නේ කෙසේද?

නිර්දේශ වල වැදගත් සාධකයක් වන්නේ පරිශීලක ප්‍රතිපෝෂණ සඳහා ප්‍රතිචාර දැක්වීමේ කාලයයි. නව පරිශීලකයින් සඳහා මෙය විශේෂයෙන් වැදගත් වේ: පුද්ගලයෙකු නිර්දේශ පද්ධතිය භාවිතා කිරීමට පටන් ගත් විට, ඔහුට විවිධ මාතෘකා වල ලේඛනවල පුද්ගලීකරණය නොකළ සංග්‍රහයක් ලැබේ. ඔහු පළමු ක්ලික් කිරීම සිදු කළ වහාම, ඔබ වහාම මෙය සැලකිල්ලට ගෙන ඔහුගේ රුචිකත්වයට අනුවර්තනය විය යුතුය. ඔබ සියලු සාධක නොබැඳි ලෙස ගණනය කරන්නේ නම්, ප්‍රමාදය හේතුවෙන් ඉක්මන් පද්ධති ප්‍රතිචාරයක් කළ නොහැකි වනු ඇත. එබැවින් පරිශීලක ක්‍රියා තත්‍ය කාලීනව සැකසීම අවශ්‍ය වේ. මෙම අරමුණු සඳහා, අපි පරිශීලකයාගේ දෛශික නිරූපණයක් ගොඩනැගීමට ධාවන වේලාවේදී ALS පියවර භාවිතා කරමු.

අපි හිතමු අපිට සියලුම ලේඛන සඳහා දෛශික නියෝජනයක් තියෙනවා කියලා. උදාහරණයක් ලෙස, අපට ELMo, BERT හෝ වෙනත් යන්ත්‍ර ඉගෙනුම් ආකෘති භාවිතයෙන් ලිපියක පෙළ මත පදනම්ව නොබැඳිව කාවැද්දීම් ගොඩනගා ගත හැක. පද්ධතිය තුළ ඔවුන්ගේ අන්තර්ක්‍රියා මත පදනම්ව එකම අවකාශයේ පරිශීලකයන්ගේ දෛශික නිරූපණයක් අපට ලබා ගත හැක්කේ කෙසේද?

පරිශීලක ලේඛන අනුකෘතිය සෑදීමේ සහ වියෝජනය කිරීමේ පොදු මූලධර්මයඅපට m පරිශීලකයින් සහ n ලේඛන ලබා ගනිමු. සමහර පරිශීලකයින් සඳහා, ඇතැම් ලේඛන සමඟ ඔවුන්ගේ සම්බන්ධතාවය දන්නා කරුණකි. එවිට මෙම තොරතුරු mxn matrix ලෙස නිරූපණය කළ හැක: පේළි පරිශීලකයින්ට අනුරූප වන අතර තීරු ලේඛන වලට අනුරූප වේ. පුද්ගලයා බොහෝ ලේඛන දැක නැති නිසා, බොහෝ matrix සෛල හිස්ව පවතිනු ඇත, අනෙක් ඒවා පුරවනු ඇත. සෑම සිදුවීමක් සඳහාම (කැමති, අකමැති, ක්ලික් කරන්න) න්‍යාසය තුළ යම් අගයක් සපයා ඇත - නමුත් කැමති එකක් 1 ට අනුරූප වන සහ අකමැත්ත -1 ට අනුරූප වන සරල කළ ආකෘතියක් සලකා බලමු.

අපි matrix දෙකට වියෝජනය කරමු: P (mxd) සහ Q (dxn), d යනු දෛශික නිරූපණයේ මානය (සාමාන්‍යයෙන් කුඩා සංඛ්‍යාවක්). එවිට සෑම වස්තුවක්ම d-මාන දෛශිකයකට අනුරූප වේ (පරිශීලකයෙකු සඳහා - න්‍යාසය P හි පේළියක්, ලේඛනයක් සඳහා - න්‍යාසයේ Q හි තීරුවක්). මෙම දෛශික අනුරූප වස්තූන්ගේ කාවැද්දීම වනු ඇත. පරිශීලකයෙකු ලේඛනයකට කැමති දැයි පුරෝකථනය කිරීමට, ඔබට ඔවුන්ගේ කාවැද්දීම ගුණ කළ හැක.

නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය
න්‍යාසයක් දිරාපත් කළ හැකි එක් ක්‍රමයක් වන්නේ ALS (ප්‍රත්‍යාවර්ත අවම වර්ග) ය. අපි පහත පාඩු ශ්‍රිතය ප්‍රශස්ත කරන්නෙමු:

නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය

මෙහි rui යනු පරිශීලක u ලේඛනය i සමඟ අන්තර්ක්‍රියා කරයි, qi යනු ලේඛනයේ දෛශිකයයි, pu යනු u පරිශීලකයාගේ දෛශිකයයි.

එවිට මධ්‍යන්‍ය වර්ග දෝෂයේ දෘෂ්ටිකෝණයෙන් ප්‍රශස්ත පරිශීලක දෛශිකය (ස්ථාවර ලේඛන දෛශික සඳහා) අනුරූප රේඛීය ප්‍රතිගාමීත්වය විසඳීම මගින් විශ්ලේෂණාත්මකව සොයා ගනු ලැබේ.

මෙය "ALS පියවර" ලෙස හැඳින්වේ. තවද ALS ඇල්ගොරිතමයම නම් අපි එක් න්‍යාසයක් (පරිශීලකයින් සහ ලිපි) විකල්ප වශයෙන් සවි කර අනෙක යාවත්කාලීන කර ප්‍රශස්ත විසඳුම සොයා ගැනීමයි.

වාසනාවකට මෙන්, පරිශීලකයාගේ දෛශික නිරූපණය සොයා ගැනීම දෛශික උපදෙස් භාවිතයෙන් ධාවන වේලාවේදී සිදු කළ හැකි තරමක් වේගවත් මෙහෙයුමකි. ශ්‍රේණිගත කිරීමේදී පරිශීලක ප්‍රතිපෝෂණ වහාම සැලකිල්ලට ගැනීමට මෙම උපක්‍රමය ඔබට ඉඩ සලසයි. අපේක්ෂකයින් තේරීම වැඩිදියුණු කිරීම සඳහා kNN දර්ශකයේ එකම කාවැද්දීම භාවිතා කළ හැක.

බෙදා හරින ලද සහයෝගී පෙරහන

වර්ධක බෙදා හරින ලද න්‍යාස සාධකකරණය කිරීම සහ නව ලිපිවල දෛශික නිරූපණයන් ඉක්මනින් සොයා ගන්නේ කෙසේද?

නිර්දේශ සංඥා වල එකම මූලාශ්‍රය අන්තර්ගතය නොවේ. තවත් වැදගත් මූලාශ්‍රයක් වන්නේ සහයෝගී තොරතුරු ය. හොඳ ශ්‍රේණිගත කිරීමේ විශේෂාංග සම්ප්‍රදායිකව පරිශීලක ලේඛන අනුකෘතියේ වියෝජනයෙන් ලබා ගත හැක. නමුත් එවැනි වියෝජනයක් කිරීමට උත්සාහ කරන විට, අපට ගැටළු ඇති විය:

1. අපට ලේඛන මිලියන ගණනක් සහ මිලියන ගණනක් පරිශීලකයින් ඇත. matrix එක යන්ත්රයක් මත සම්පූර්ණයෙන්ම නොගැලපෙන අතර, වියෝජනය ඉතා දිගු කාලයක් ගතවනු ඇත.
2. පද්ධතියේ බොහෝ අන්තර්ගතයන් කෙටි ආයු කාලයක් ඇත: ලේඛන අදාළ වන්නේ පැය කිහිපයක් පමණි. එබැවින්, හැකි ඉක්මනින් ඔවුන්ගේ දෛශික නිරූපණය ගොඩනැගීම අවශ්ය වේ.
3. ලේඛනය ප්‍රකාශයට පත් කළ වහාම ඔබ විසංයෝජනයක් ගොඩනඟන්නේ නම්, ප්‍රමාණවත් පරිශීලකයින් සංඛ්‍යාවක් එය ඇගයීමට කාලය නොමැති වනු ඇත. එබැවින්, එහි දෛශික නිරූපණය බොහෝ දුරට හොඳ නොවනු ඇත.
4. පරිශීලකයෙකු කැමති හෝ අකමැති නම්, වියෝජනය කිරීමේදී අපට මෙය වහාම සැලකිල්ලට ගත නොහැක.

මෙම ගැටළු විසඳීම සඳහා, අපි නිතර වර්ධක යාවත්කාලීන කිරීම් සමඟ පරිශීලක-ලේඛන අනුකෘතියේ බෙදා හරින ලද වියෝජනය ක්‍රියාත්මක කළෙමු. එය හරියටම වැඩ කරන්නේ කෙසේද?

අපට N යන්ත්‍ර පොකුරක් ඇතැයි සිතමු (N යනු සිය ගණනින්) සහ එක් යන්ත්‍රයකට නොගැලපෙන අනුකෘතියක බෙදා හැරීමක් සිදු කිරීමට අපට අවශ්‍ය වේ. ප්රශ්නය වන්නේ, එක් අතකින්, එක් එක් යන්ත්රයේ ප්රමාණවත් දත්ත ඇති අතර, අනෙක් අතට, ගණනය කිරීම් ස්වාධීන වන පරිදි මෙම වියෝජනය සිදු කරන්නේ කෙසේද?

නිර්දේශ තෝරාගැනීමේ ගුණාත්මකභාවය සහ වේගය මත අපි වැඩ කරන ආකාරය

අපි ඉහත විස්තර කර ඇති ALS වියෝජන ඇල්ගොරිතම භාවිතා කරන්නෙමු. එක් ALS පියවරක් බෙදා හරින ආකාරයෙන් ක්‍රියාත්මක කරන්නේ කෙසේදැයි බලමු - ඉතිරි පියවර සමාන වනු ඇත. අපි හිතමු අපට ස්ථාවර න්‍යාස ලේඛන ඇති අතර අපට පරිශීලකයන්ගේ න්‍යාසයක් ගොඩනැගීමට අවශ්‍ය බව. මෙය සිදු කිරීම සඳහා, අපි එය රේඛා මගින් N කොටස් වලට බෙදන්නෙමු, සෑම කොටසකම ආසන්න වශයෙන් එකම පේළි ගණනක් අඩංගු වේ. අපි එක් එක් යන්ත්‍රයට අනුරූප පේළිවල හිස් නොවන සෛල මෙන්ම ලේඛන කාවැද්දීමේ අනුකෘතිය (සම්පූර්ණයෙන්ම) යවමු. එහි ප්‍රමාණය ඉතා විශාල නොවන අතර පරිශීලක ලේඛන අනුකෘතිය සාමාන්‍යයෙන් ඉතා විරල බැවින්, මෙම දත්ත සාමාන්‍ය යන්ත්‍රයකට ගැලපේ.

ස්ථාවර න්‍යාසය එකින් එක ප්‍රත්‍යාවර්ත කරමින් ආකෘතිය අභිසාරී වන තෙක් මෙම උපක්‍රමය යුග කිහිපයක් පුරා නැවත නැවතත් කළ හැක. නමුත් එසේ වුවද, matrix වියෝජනය පැය කිහිපයක් ගත විය හැක. තවද ඔබට නව ලේඛන කාවැද්දීම ඉක්මනින් ලබා ගැනීමට සහ ආකෘතිය තැනීමේදී එතරම් තොරතුරු නොමැති අයගේ කාවැද්දීම් යාවත්කාලීන කිරීමට අවශ්‍ය ගැටළුව මෙය විසඳන්නේ නැත.

වේගවත් වර්ධක මාදිලි යාවත්කාලීන හඳුන්වාදීම අපට උපකාරී විය. අපි හිතමු අපිට දැනට පුහුණු වූ නිරූපිකාවක් ඉන්නවා කියලා. ඇයගේ පුහුණුවේ සිට, අපගේ පරිශීලකයින් සමඟ අන්තර්ක්‍රියා කළ නව ලිපි මෙන්ම පුහුණුවීම් අතරතුර එතරම් අන්තර්ක්‍රියා කළ ලිපි ද ඇත. එවැනි ලිපිවල කාවැද්දීම් ඉක්මනින් ලබා ගැනීම සඳහා, අපි ආකෘතියේ පළමු විශාල පුහුණුවේදී ලබාගත් පරිශීලක කාවැද්දීම් භාවිතා කරන අතර ස්ථාවර පරිශීලක න්‍යාසයක් ලබා දී ඇති ලේඛන අනුකෘතිය ගණනය කිරීමට එක් ALS පියවරක් කරන්නෙමු. ලේඛනය ප්‍රකාශයට පත් කිරීමෙන් මිනිත්තු කිහිපයක් ඇතුළත - සහ බොහෝ විට මෑත ලේඛනවල කාවැද්දීම් යාවත්කාලීන කිරීමට මෙය ඔබට ඉඩ සලසයි.

නිර්දේශ කිරීම සඳහා මානව ක්‍රියාවන් වහාම සැලකිල්ලට ගන්න, ධාවන කාලය තුළ අපි නොබැඳි ලෙස ලබාගත් පරිශීලක කාවැද්දීම් භාවිතා නොකරමු. ඒ වෙනුවට, අපි ALS පියවරක් කර සැබෑ පරිශීලක දෛශිකය ලබා ගනිමු.

වෙනත් වසම් ප්රදේශයකට මාරු කරන්න

වීඩියෝවක දෛශික නිරූපණයක් ගොඩනැගීමට පෙළ ලිපි සඳහා පරිශීලක ප්‍රතිපෝෂණ භාවිතා කරන්නේ කෙසේද?

මුලදී, අපි නිර්දේශ කළේ පෙළ ලිපි පමණි, එබැවින් අපගේ බොහෝ ඇල්ගොරිතම මෙම ආකාරයේ අන්තර්ගතයට ගැලපේ. නමුත් වෙනත් ආකාරයේ අන්තර්ගතයන් එකතු කිරීමේදී, අපි ආකෘති අනුවර්තනය කිරීමේ අවශ්යතාවට මුහුණ දුන්නා. වීඩියෝ උදාහරණයක් භාවිතයෙන් අපි මෙම ගැටලුව විසඳා ගත්තේ කෙසේද? එක් විකල්පයක් වන්නේ මුල සිටම සියලුම මාදිලි නැවත පුහුණු කිරීමයි. නමුත් මෙය බොහෝ කාලයක් ගත වන අතර, සමහර ඇල්ගොරිතම පුහුණු නියැදියේ ප්‍රමාණයෙන් ඉල්ලා සිටින අතර, එය සේවාවේ ජීවිතයේ පළමු අවස්ථාවන්හි නව ආකාරයේ අන්තර්ගතයක් සඳහා අවශ්‍ය ප්‍රමාණයෙන් තවමත් ලබා ගත නොහැක.

අපි අනෙක් පැත්තට ගොස් වීඩියෝව සඳහා පෙළ ආකෘති නැවත භාවිතා කළෙමු. එම ALS උපක්‍රමය අපට වීඩියෝවල දෛශික නිරූපණයන් නිර්මාණය කිරීමට උදවු විය. අපි පෙළ ලිපි මත පදනම්ව පරිශීලකයන්ගේ දෛශික නිරූපණයක් ගෙන වීඩියෝ දර්ශන තොරතුරු භාවිතයෙන් ALS පියවරක් කළෙමු. ඉතින් අපිට පහසුවෙන්ම වීඩියෝවේ දෛශික නිරූපණයක් ලැබුණා. තවද ධාවන වේලාවේදී අපි සරලව ගණනය කරන්නේ පෙළ ලිපි වලින් ලබාගත් පරිශීලක දෛශිකය සහ වීඩියෝ දෛශිකය අතර සමීපත්වයයි.

නිගමනය

තත්‍ය කාලීන නිර්දේශ පද්ධතියක හරය සංවර්ධනය කිරීම බොහෝ අභියෝග ඇතුළත් වේ. මෙම දත්ත ඵලදායී ලෙස භාවිතා කිරීමට ඔබ ඉක්මනින් දත්ත සැකසීමට සහ ML ක්‍රම යෙදිය යුතුය; අවම කාලයක් තුළ පරිශීලක සංඥා සහ නව අන්තර්ගත ඒකක සැකසීමට හැකියාව ඇති සංකීර්ණ බෙදාහැරීමේ පද්ධති ගොඩනැගීම; සහ තවත් බොහෝ කාර්යයන්.

වත්මන් ක්‍රමය තුළ, මා විස්තර කළ සැලසුම, පරිශීලකයාගේ ක්‍රියාකාරකම් සහ සේවාවේ රැඳී සිටීමේ කාලය සමඟ ඔහුගේ නිර්දේශවල ගුණාත්මකභාවය වර්ධනය වේ. නමුත් ඇත්ත වශයෙන්ම, මෙහි ප්‍රධාන දුෂ්කරතාවය පවතී: අන්තර්ගතය සමඟ කුඩා අන්තර්ක්‍රියා ඇති පුද්ගලයෙකුගේ අවශ්‍යතා වහාම තේරුම් ගැනීමට පද්ධතියට අපහසුය. නව පරිශීලකයින් සඳහා නිර්දේශ වැඩිදියුණු කිරීම අපගේ ප්‍රධාන අරමුණයි. පුද්ගලයෙකුට අදාළ අන්තර්ගතය ඉක්මනින් ඔහුගේ සංග්‍රහයට ඇතුළු වන පරිදි සහ අදාළ නොවන අන්තර්ගතය නොපෙන්වන පරිදි අපි ඇල්ගොරිතම ප්‍රශස්ත කිරීම දිගටම කරගෙන යන්නෙමු.

මූලාශ්රය: www.habr.com

අදහස් එක් කරන්න