OpenNMT 2.28.0 යන්ත්‍ර පරිවර්තන පද්ධතිය මුදා හැරීම

යන්ත්‍ර ඉගෙනීමේ ක්‍රම භාවිතා කරන OpenNMT 0.28.0 (Open Neural Machine Translation) යන්ත්‍ර පරිවර්තන පද්ධතියේ නිකුතුව ප්‍රකාශයට පත් කර ඇත. ස්නායුක ජාලයක් ගොඩනැගීම සඳහා, ව්‍යාපෘතිය TensorFlow ගැඹුරු යන්ත්‍ර ඉගෙනුම් පුස්තකාලයේ හැකියාවන් භාවිතා කරයි. OpenNMT ව්‍යාපෘතිය මගින් සංවර්ධනය කරන ලද මොඩියුලවල කේතය Python වලින් ලියා MIT බලපත්‍රය යටතේ බෙදා හැරේ. ඉංග්‍රීසි, ජර්මානු සහ කැටලන් භාෂා සඳහා සූදානම් කළ ආකෘති සකස් කර ඇත; වෙනත් භාෂා සඳහා, ඔබට ස්වාධීනව OPUS ව්‍යාපෘතියේ දත්ත කට්ටලයක් මත පදනම්ව ආකෘතියක් නිර්මාණය කළ හැකිය (පුහුණුව සඳහා, ගොනු දෙකක් පද්ධතියට මාරු කරනු ලැබේ - එකක් වාක්‍ය සහිත ය. මූලාශ්‍ර භාෂාව, සහ දෙවැන්න මෙම වාක්‍යවල උසස් තත්ත්වයේ පරිවර්තනයක් සමඟ ඉලක්ක භාෂාවට ).

යන්ත්‍ර පරිවර්තන මෙවලම් නිර්මාණය කිරීමේ විශේෂඥ සමාගමක් වන SYSTRAN සහ යන්ත්‍ර ඉගෙනුම් පද්ධති සඳහා මානව භාෂා ආකෘති සංවර්ධනය කරන හාවඩ් පර්යේෂකයන් පිරිසකගේ සහභාගීත්වයෙන් ව්‍යාපෘතිය සංවර්ධනය කෙරේ. පරිශීලක අතුරුමුහුණත හැකි තරම් සරල කර ඇති අතර පරිවර්තන ප්‍රතිඵලය සුරැකීමට පෙළ සහ ගොනුවක් සහිත ආදාන ගොනුවක් නියම කිරීම පමණක් අවශ්‍ය වේ. විස්තීරණ පද්ධතිය මඟින් OpenNMT මත පදනම්ව අතිරේක ක්‍රියාකාරීත්වය ක්‍රියාත්මක කිරීමට හැකි වේ, උදාහරණයක් ලෙස, ස්වයංක්‍රීය සාරාංශ කිරීම, පෙළ වර්ගීකරණය සහ උපසිරැසි උත්පාදනය.

TensorFlow භාවිතය ඔබට GPU හි හැකියාවන් භාවිතා කිරීමට ඉඩ සලසයි (ස්නායු ජාලයක් පුහුණු කිරීමේ ක්‍රියාවලිය වේගවත් කිරීම සඳහා. නිෂ්පාදනයේ බෙදා හැරීම සරල කිරීම සඳහා, ව්‍යාපෘතිය C++ - CTranslate2 හි පරිවර්තකයේ ස්වයංපෝෂිත අනුවාදයක් ද සංවර්ධනය කරයි. , අතිරේක පරායත්තතා ගැන සඳහන් නොකර පූර්ව-පුහුණු ආකෘති භාවිතා කරයි.

නව අනුවාදය මූලික_learning_rate පරාමිතිය එක් කරන අතර ට්‍රාන්ස්ෆෝමර් මාදිලි උත්පාදක යන්ත්‍රය වින්‍යාස කිරීම සඳහා නව තර්ක කිහිපයක් (mha_bias සහ output_layer_bias) ක්‍රියාත්මක කරයි. ඉතිරිය දෝෂ නිවැරදි කිරීම් මගින් සලකුණු කර ඇත.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න