அமேசான் 51 மொழிகளில் பேச்சைப் புரிந்துகொள்வதற்கான தரவுத்தொகுப்பை வெளியிட்டது

அமேசான் CC BY 4.0 உரிமத்தின் கீழ் "MASSIVE" (ஸ்லாட் நிரப்புதல், நோக்க வகைப்பாடு மற்றும் மெய்நிகர்-உதவி மதிப்பீடு ஆகியவற்றுக்கான பன்மொழி Amazon SLURP) தரவுத்தொகுப்பு, இயந்திர கற்றல் அமைப்புகளுக்கான மாதிரிகள் மற்றும் உங்கள் சொந்த மாதிரிகளைப் பயிற்றுவிப்பதற்கான கருவிகளை வெளியிட்டுள்ளது. இயற்கை மொழி பற்றிய தகவல்களைப் புரிந்து கொள்ளுங்கள் (NLU, இயற்கை மொழி புரிதல்). தொகுப்பில் 51 மொழிகளுக்காக தயாரிக்கப்பட்ட ஒரு மில்லியனுக்கும் அதிகமான சிறுகுறிப்பு மற்றும் வகைப்படுத்தப்பட்ட உரைச் சொற்கள் உள்ளன.

SLURP சேகரிப்பு, முதலில் ஆங்கிலத்தில் கிடைத்தது, இது மகத்தான தொகுப்பை உருவாக்குவதற்கான ஒரு குறிப்பாகப் பயன்படுத்தப்பட்டது, இது தொழில்முறை மொழிபெயர்ப்பாளர்களைப் பயன்படுத்தி 50 பிற மொழிகளில் மொழிபெயர்க்கப்பட்டது. அலெக்சாவின் இயல்பான மொழிப் புரிதல் (NLU) தொழில்நுட்பம் முதலில் பேச்சை உரையாக மாற்றுகிறது, பின்னர் பல NLU மாதிரிகளை உரையில் பயன்படுத்துகிறது, இது பயனரின் கேள்வியின் சாரத்தை தீர்மானிக்க முக்கிய வார்த்தைகளின் இருப்பை பகுப்பாய்வு செய்கிறது.

தொகுப்பை உருவாக்கி வெளியிடுவதன் குறிக்கோள்களில் ஒன்று, குரல் உதவியாளர்களை ஒரே நேரத்தில் பல மொழிகளில் தகவல்களைச் செயலாக்குவதற்கு மாற்றியமைப்பது, அத்துடன் குரல் உதவியாளர்களின் திறன்களை விரிவாக்கும் பயன்பாடுகள் மற்றும் சேவைகளை உருவாக்க மூன்றாம் தரப்பு டெவலப்பர்களை ஊக்குவிப்பது. டெவலப்பர்களின் கவனத்தை ஈர்க்க, அமேசான் வெளியிடப்பட்ட தரவுத்தொகுப்பைப் பயன்படுத்தி சிறந்த பொதுவான மாதிரியை உருவாக்க ஒரு போட்டியைத் தொடங்கியது.

தற்போது, ​​குரல் உதவியாளர்கள் சில மொழிகளை மட்டுமே ஆதரிக்கின்றனர் மற்றும் ஒரு குறிப்பிட்ட மொழியுடன் இணைக்கப்பட்ட இயந்திர கற்றல் மாதிரிகளைப் பயன்படுத்துகின்றனர். MASSIVE திட்டம் உலகளாவிய மாதிரிகள் மற்றும் பல்வேறு மொழிகளில் தகவல்களைப் பாகுபடுத்தி செயலாக்கும் திறன் கொண்ட இயந்திர கற்றல் அமைப்புகளை உருவாக்குவதன் மூலம் இந்தக் குறைபாட்டை நீக்குவதை நோக்கமாகக் கொண்டுள்ளது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்