NVIDIA, Mozilla Common Voice திட்டத்தில் $1.5 மில்லியன் முதலீடு செய்கிறது

NVIDIA Mozilla Common Voice திட்டத்தில் $1.5 மில்லியன் முதலீடு செய்கிறது. அடுத்த பத்து ஆண்டுகளில், குரல் தொழில்நுட்பம் கணினிகள் மற்றும் தொலைபேசிகள் முதல் டிஜிட்டல் உதவியாளர்கள் மற்றும் கியோஸ்க்குகள் வரையிலான சாதனங்களுடன் தொடர்புகொள்வதற்கான முக்கிய வழிகளில் ஒன்றாக மாறும் என்ற கணிப்பிலிருந்து பேச்சு அங்கீகார அமைப்புகளில் ஆர்வம் உருவாகிறது.

குரல் அமைப்புகளின் செயல்திறன், இயந்திர கற்றல் மாதிரிகளைப் பயிற்றுவிப்பதற்காகக் கிடைக்கும் குரல் தரவுகளின் அளவு மற்றும் பல்வேறு வகையைச் சார்ந்தது. இன்றைய குரல் தொழில்நுட்பம் முதன்மையாக ஆங்கில மொழி அங்கீகாரத்தில் கவனம் செலுத்துகிறது மற்றும் மொழிகள், உச்சரிப்புகள் மற்றும் பேச்சு முறைகளின் பரந்த வரிசையை உள்ளடக்குவதில்லை. பொதுக் குரல் தரவின் வளர்ச்சியை விரைவுபடுத்தவும், அதிக சமூகங்கள் மற்றும் தன்னார்வலர்களை ஈடுபடுத்தவும், முழுநேர திட்டப் பணியாளர்களின் எண்ணிக்கையை விரிவுபடுத்தவும் இந்த முதலீடு உதவும்.

பொதுவான குரல் திட்டமானது குரல் வடிவங்களின் தரவுத்தளத்தைக் குவிப்பதற்கு கூட்டுப் பணியை ஒழுங்கமைப்பதை நோக்கமாகக் கொண்டுள்ளது என்பதை நினைவூட்டுகிறோம், இது குரல்கள் மற்றும் பேச்சு பாணிகளின் பன்முகத்தன்மையை கணக்கில் எடுத்துக்கொள்கிறது. திரையில் காட்டப்படும் குரல் சொற்றொடர்களுக்கு பயனர்கள் அழைக்கப்படுவார்கள் அல்லது பிற பயனர்கள் சேர்த்த தரவின் தரத்தை மதிப்பிடுவார்கள். மனித பேச்சின் பொதுவான சொற்றொடர்களின் பல்வேறு உச்சரிப்புகளின் பதிவுகளுடன் திரட்டப்பட்ட தரவுத்தளமானது இயந்திர கற்றல் அமைப்புகளிலும் ஆராய்ச்சி திட்டங்களிலும் கட்டுப்பாடுகள் இல்லாமல் பயன்படுத்தப்படலாம்.

பொதுவான குரல் தொகுப்பில் தற்போது 164 பேருக்கு மேல் உச்சரிப்பு எடுத்துக்காட்டுகள் உள்ளன. சுமார் 9 ஆயிரம் மணிநேர குரல் தரவு 60 வெவ்வேறு மொழிகளில் குவிக்கப்பட்டுள்ளது. ரஷ்ய மொழிக்கான தொகுப்பு 1412 பங்கேற்பாளர்களையும் 111 மணிநேர பேச்சுப் பொருளையும் உள்ளடக்கியது, மற்றும் உக்ரேனிய மொழிக்கு - 459 பங்கேற்பாளர்கள் மற்றும் 30 மணிநேரம். ஒப்பிடுகையில், 66 ஆயிரத்துக்கும் மேற்பட்ட மக்கள் ஆங்கிலத்தில் பொருட்களைத் தயாரிப்பதில் பங்கேற்றனர், 1686 மணிநேர சரிபார்க்கப்பட்ட பேச்சைக் கட்டளையிட்டனர். முன்மொழியப்பட்ட தொகுப்புகள் பேச்சு அங்கீகாரம் மற்றும் தொகுப்பு மாதிரிகளை உருவாக்க இயந்திர கற்றல் அமைப்புகளில் பயன்படுத்தப்படலாம். தரவு பொது டொமைனாக (CC0) வெளியிடப்பட்டது.

வோஸ்க் தொடர்ச்சியான பேச்சு அங்கீகார நூலகத்தின் ஆசிரியரின் கூற்றுப்படி, பொதுவான குரல் தொகுப்பின் தீமைகள் குரல் பொருளின் ஒருதலைப்பட்சம் (20-30 வயதுடைய ஆண்களின் ஆதிக்கம் மற்றும் பெண்களின் குரல்களுடன் பொருள் இல்லாமை , குழந்தைகள் மற்றும் முதியவர்கள்), அகராதியில் மாறுபாடு இல்லாமை (அதே சொற்றொடர்களை மீண்டும் மீண்டும்) மற்றும் சிதைக்கும் MP3 வடிவத்தில் பதிவுகளின் விநியோகம்.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்