RHVoice 1.6.0 பேச்சு சின்தசைசர் வெளியீடு

திறந்த பேச்சு தொகுப்பு அமைப்பு RHVoice 1.6.0 வெளியிடப்பட்டது, ஆரம்பத்தில் ரஷ்ய மொழிக்கு உயர்தர ஆதரவை வழங்குவதற்காக உருவாக்கப்பட்டது, ஆனால் பின்னர் ஆங்கிலம், போர்த்துகீசியம், உக்ரைனியன், கிர்கிஸ், டாடர் மற்றும் ஜார்ஜியன் உள்ளிட்ட பிற மொழிகளுக்குத் தழுவியது. குறியீடு C++ இல் எழுதப்பட்டு LGPL 2.1 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது. குனு/லினக்ஸ், விண்டோஸ் மற்றும் ஆண்ட்ராய்டில் வேலை செய்வதை ஆதரிக்கிறது. நிரல் உரையை பேச்சுக்கு மாற்றுவதற்கான நிலையான TTS (உரை-க்கு-பேச்சு) இடைமுகங்களுடன் இணக்கமானது: SAPI5 (Windows), பேச்சு டிஸ்பேச்சர் (GNU/Linux) மற்றும் Android உரையிலிருந்து பேச்சு API, ஆனால் NVDA விலும் பயன்படுத்தலாம். திரை வாசிப்பான். RHVoice இன் உருவாக்கியவர் மற்றும் முக்கிய டெவலப்பர் ஓல்கா யாகோவ்லேவா ஆவார், அவர் முற்றிலும் பார்வையற்றவராக இருந்தாலும் திட்டத்தை உருவாக்குகிறார்.

புதிய பதிப்பு ரஷ்ய பேச்சுக்கு 5 புதிய குரல் விருப்பங்களைச் சேர்க்கிறது. அல்பேனிய மொழி ஆதரவு செயல்படுத்தப்பட்டது. உக்ரைனிய மொழிக்கான அகராதி புதுப்பிக்கப்பட்டது. ஈமோஜி கதாபாத்திரங்களின் குரல் நடிப்புக்கான ஆதரவு விரிவாக்கப்பட்டுள்ளது. ஆண்ட்ராய்டு இயங்குதளத்திற்கான பயன்பாட்டில் உள்ள பிழைகளை நீக்குவதற்கான பணிகள் செய்யப்பட்டுள்ளன, தனிப்பயன் அகராதிகளின் இறக்குமதி எளிமைப்படுத்தப்பட்டுள்ளது, மேலும் ஆண்ட்ராய்டு 11 இயங்குதளத்திற்கான ஆதரவு சேர்க்கப்பட்டுள்ளது. g2p உட்பட எஞ்சின் மையத்தில் புதிய அமைப்புகள் மற்றும் செயல்பாடுகள் சேர்க்கப்பட்டுள்ளன. வழக்கு, word_break மற்றும் சமப்படுத்தல் வடிப்பான்களுக்கான ஆதரவு.

RHVoice ஆனது HTS திட்டத்தின் வளர்ச்சிகளையும் (HMM/DNN- அடிப்படையிலான பேச்சு தொகுப்பு அமைப்பு) மற்றும் புள்ளியியல் மாதிரிகளுடன் கூடிய அளவுரு தொகுப்பு முறையையும் (HMM - மறைக்கப்பட்ட மார்கோவ் மாதிரியை அடிப்படையாகக் கொண்ட புள்ளியியல் அளவுரு தொகுப்பு) பயன்படுத்துகிறது என்பதை நினைவில் கொள்வோம். புள்ளிவிவர மாதிரியின் நன்மை குறைந்த மேல்நிலை செலவுகள் மற்றும் தேவையற்ற CPU சக்தி ஆகும். அனைத்து செயல்பாடுகளும் பயனரின் கணினியில் உள்நாட்டில் செய்யப்படுகின்றன. பேச்சுத் தரத்தின் மூன்று நிலைகள் ஆதரிக்கப்படுகின்றன (குறைந்த தரம், அதிக செயல்திறன் மற்றும் குறுகிய எதிர்வினை நேரம்).

புள்ளிவிவர மாதிரியின் எதிர்மறையானது, ஒப்பீட்டளவில் குறைந்த தரமான உச்சரிப்பாகும், இது இயற்கையான பேச்சின் துண்டுகளின் கலவையின் அடிப்படையில் பேச்சை உருவாக்கும் சின்தசைசர்களின் அளவை எட்டவில்லை, இருப்பினும் முடிவு மிகவும் தெளிவாக உள்ளது மற்றும் ஒலிபெருக்கியில் இருந்து ஒரு பதிவை ஒளிபரப்புவதை ஒத்திருக்கிறது. . ஒப்பிடுகையில், இயந்திர கற்றல் தொழில்நுட்பங்கள் மற்றும் ரஷ்ய மொழிக்கான மாதிரிகளின் தொகுப்பின் அடிப்படையில் திறந்த பேச்சு தொகுப்பு இயந்திரத்தை வழங்கும் சிலிரோ திட்டம் RHVoice ஐ விட தரத்தில் உயர்ந்தது.

ரஷ்ய மொழிக்கு 13 குரல் விருப்பங்கள் உள்ளன, மேலும் 5 ஆங்கிலத்திற்கு. குரல்கள் இயல்பான பேச்சு பதிவுகளின் அடிப்படையில் உருவாக்கப்படுகின்றன. அமைப்புகளில் நீங்கள் வேகம், சுருதி மற்றும் ஒலி அளவை மாற்றலாம். டெம்போவை மாற்ற சோனிக் லைப்ரரியைப் பயன்படுத்தலாம். உள்ளீட்டு உரையின் பகுப்பாய்வின் அடிப்படையில் மொழிகளை தானாகவே கண்டறிந்து மாற்றுவது சாத்தியமாகும் (எடுத்துக்காட்டாக, மற்றொரு மொழியில் உள்ள சொற்கள் மற்றும் மேற்கோள்களுக்கு, அந்த மொழிக்கு சொந்தமான ஒரு தொகுப்பு மாதிரியைப் பயன்படுத்தலாம்). குரல் சுயவிவரங்கள் ஆதரிக்கப்படுகின்றன, வெவ்வேறு மொழிகளுக்கான குரல்களின் சேர்க்கைகளை வரையறுக்கிறது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்