ඇමසන් භාෂා 51 කින් කථනය තේරුම් ගැනීම සඳහා දත්ත කට්ටලයක් ප්‍රකාශයට පත් කළේය

Amazon විසින් CC BY 4.0 බලපත්‍රයක් යටතේ "MASSIVE" (Slot Filling, Intent Classification, and Virtual-assistant Evaluation සඳහා බහුභාෂා Amazon SLURP) දත්ත කට්ටලය, යන්ත්‍ර ඉගෙනුම් පද්ධති සඳහා ආකෘති සහ ඔබේම ආකෘති පුහුණු කිරීම සඳහා භාවිතා කළ හැකි මෙවලම් ප්‍රකාශයට පත් කර ඇත. ස්වාභාවික භාෂාව පිළිබඳ තොරතුරු තේරුම් ගන්න (NLU, ස්වභාවික භාෂා අවබෝධය). මෙම කට්ටලයට භාෂා 51ක් සඳහා සකස් කරන ලද විවරණ සහ වර්ගීකරණය කළ පාඨ උච්චාරණ මිලියනයකට වඩා ඇතුළත් වේ.

මුලින් ඉංග්‍රීසි සඳහා ලබා ගත හැකි SLURP එකතුව, වෘත්තීය පරිවර්තකයින් භාවිතයෙන් වෙනත් භාෂා 50 කට ස්ථානගත කරන ලද දැවැන්ත කට්ටලය ගොඩනැගීම සඳහා යොමු කිරීමක් ලෙස භාවිතා කරන ලදී. Alexa හි ස්වභාවික භාෂා අවබෝධය (NLU) තාක්‍ෂණය පළමුව කථනය පෙළ බවට පරිවර්තනය කරයි, පසුව පරිශීලකයාගේ ප්‍රශ්නයේ සාරය තීරණය කිරීම සඳහා මූල පද තිබීම විශ්ලේෂණය කරන පෙළට බහු NLU ආකෘති යොදයි.

කට්ටලය නිර්මාණය කිරීම සහ ප්‍රකාශයට පත් කිරීමේ එක් ඉලක්කයක් වන්නේ හඬ සහායකයින් එකවර භාෂා කිහිපයකින් තොරතුරු සැකසීමට අනුවර්තනය කිරීම මෙන්ම හඬ සහායකයින්ගේ හැකියාවන් පුළුල් කරන යෙදුම් සහ සේවාවන් නිර්මාණය කිරීමට තෙවන පාර්ශවීය සංවර්ධකයින් දිරිමත් කිරීමයි. සංවර්ධකයින්ගේ අවධානය ආකර්ෂණය කර ගැනීම සඳහා, ප්‍රකාශිත දත්ත කට්ටලයක් භාවිතයෙන් හොඳම සාමාන්‍ය මාදිලිය නිර්මාණය කිරීමට Amazon තරඟයක් දියත් කළේය.

දැනට, හඬ සහායකයින් භාෂා කිහිපයකට පමණක් සහය දක්වන අතර නිශ්චිත භාෂාවකට සම්බන්ධ යන්ත්‍ර ඉගෙනුම් ආකෘති භාවිතා කරයි. විවිධ භාෂාවලින් තොරතුරු විග්‍රහ කිරීමට සහ සැකසීමට හැකියාව ඇති විශ්වීය ආකෘති සහ යන්ත්‍ර ඉගෙනුම් පද්ධති නිර්මාණය කිරීමෙන් මෙම අඩුපාඩුව තුරන් කිරීම MASSIVE ව්‍යාපෘතියේ අරමුණයි.

මූලාශ්රය: opennet.ru

අදහස් එක් කරන්න