RHVoice 1.8.0 பேச்சு சின்தசைசர் வெளியீடு

திறந்த பேச்சு தொகுப்பு அமைப்பு RHVoice 1.8.0 வெளியிடப்பட்டது, ஆரம்பத்தில் ரஷ்ய மொழிக்கு உயர்தர ஆதரவை வழங்குவதற்காக உருவாக்கப்பட்டது, ஆனால் பின்னர் ஆங்கிலம், போர்த்துகீசியம், உக்ரைனியன், கிர்கிஸ், டாடர் மற்றும் ஜார்ஜியன் உள்ளிட்ட பிற மொழிகளுக்குத் தழுவியது. குறியீடு C++ இல் எழுதப்பட்டு LGPL 2.1 உரிமத்தின் கீழ் விநியோகிக்கப்படுகிறது. குனு/லினக்ஸ், விண்டோஸ் மற்றும் ஆண்ட்ராய்டில் வேலை செய்வதை ஆதரிக்கிறது. நிரல் உரையை பேச்சுக்கு மாற்றுவதற்கான நிலையான TTS (உரை-க்கு-பேச்சு) இடைமுகங்களுடன் இணக்கமானது: SAPI5 (Windows), பேச்சு டிஸ்பேச்சர் (GNU/Linux) மற்றும் Android உரையிலிருந்து பேச்சு API, ஆனால் NVDA விலும் பயன்படுத்தலாம். திரை வாசிப்பான். RHVoice இன் உருவாக்கியவர் மற்றும் முக்கிய டெவலப்பர் ஓல்கா யாகோவ்லேவா ஆவார், அவர் முற்றிலும் பார்வையற்றவராக இருந்தாலும் திட்டத்தை உருவாக்குகிறார்.

ஆண்ட்ராய்டு இயங்குதளத்திற்கான பதிப்பு 1.8 புதிய குரல் மற்றும் மொழி தரவு மேலாண்மை அமைப்பை அறிமுகப்படுத்துகிறது, இது மொபைல் பயன்பாட்டைப் புதுப்பிக்காமல் குரல் தரவு புதுப்பிப்புகளைப் பதிவிறக்க அனுமதிக்கிறது. சேர்க்கப்பட்ட குரல்கள் மற்றும் மொழிகளுக்கான தரவு புதுப்பிப்புகள் தானாகவே சரிபார்க்கப்படும். கூடுதலாக, புதிய வெளியீடு போலந்து மொழிக்கான ஆதரவை அறிமுகப்படுத்துகிறது மற்றும் மாசிடோனிய மொழிக்கான புதிய குரலைச் சேர்க்கிறது. என்விடிஏ ஸ்கிரீன் ரீடரின் சமீபத்திய ஆல்பா மற்றும் பீட்டா வெளியீடுகளுடன் இணக்கம் உறுதி செய்யப்படுகிறது. ஸ்பீச் டிஸ்பாச்சர் இல்லாதபோது லினக்ஸ் இயங்குதளத்தை உருவாக்குவதில் ஏற்பட்ட நிலையான சிக்கல்கள்.

RHVoice ஆனது HTS திட்டத்தின் வளர்ச்சிகளையும் (HMM/DNN- அடிப்படையிலான பேச்சு தொகுப்பு அமைப்பு) மற்றும் புள்ளியியல் மாதிரிகளுடன் கூடிய அளவுரு தொகுப்பு முறையையும் (HMM - மறைக்கப்பட்ட மார்கோவ் மாதிரியை அடிப்படையாகக் கொண்ட புள்ளியியல் அளவுரு தொகுப்பு) பயன்படுத்துகிறது என்பதை நினைவில் கொள்வோம். புள்ளிவிவர மாதிரியின் நன்மை குறைந்த மேல்நிலை செலவுகள் மற்றும் தேவையற்ற CPU சக்தி ஆகும். அனைத்து செயல்பாடுகளும் பயனரின் கணினியில் உள்நாட்டில் செய்யப்படுகின்றன. பேச்சுத் தரத்தின் மூன்று நிலைகள் ஆதரிக்கப்படுகின்றன (குறைந்த தரம், அதிக செயல்திறன் மற்றும் குறுகிய எதிர்வினை நேரம்).

புள்ளிவிவர மாதிரியின் எதிர்மறையானது, ஒப்பீட்டளவில் குறைந்த தரமான உச்சரிப்பாகும், இது இயற்கையான பேச்சின் துண்டுகளின் கலவையின் அடிப்படையில் பேச்சை உருவாக்கும் சின்தசைசர்களின் அளவை எட்டவில்லை, இருப்பினும் முடிவு மிகவும் தெளிவாக உள்ளது மற்றும் ஒலிபெருக்கியில் இருந்து ஒரு பதிவை ஒளிபரப்புவதை ஒத்திருக்கிறது. . ஒப்பிடுகையில், இயந்திர கற்றல் தொழில்நுட்பங்கள் மற்றும் ரஷ்ய மொழிக்கான மாதிரிகளின் தொகுப்பின் அடிப்படையில் திறந்த பேச்சு தொகுப்பு இயந்திரத்தை வழங்கும் சிலிரோ திட்டம் RHVoice ஐ விட தரத்தில் உயர்ந்தது.

ரஷ்ய மொழிக்கு 14 குரல் விருப்பங்கள் உள்ளன, மேலும் 6 ஆங்கிலத்திற்கு. குரல்கள் இயல்பான பேச்சு பதிவுகளின் அடிப்படையில் உருவாக்கப்படுகின்றன. அமைப்புகளில் நீங்கள் வேகம், சுருதி மற்றும் ஒலி அளவை மாற்றலாம். டெம்போவை மாற்ற சோனிக் லைப்ரரியைப் பயன்படுத்தலாம். உள்ளீட்டு உரையின் பகுப்பாய்வின் அடிப்படையில் மொழிகளை தானாகவே கண்டறிந்து மாற்றுவது சாத்தியமாகும் (எடுத்துக்காட்டாக, மற்றொரு மொழியில் உள்ள சொற்கள் மற்றும் மேற்கோள்களுக்கு, அந்த மொழிக்கு சொந்தமான ஒரு தொகுப்பு மாதிரியைப் பயன்படுத்தலாம்). குரல் சுயவிவரங்கள் ஆதரிக்கப்படுகின்றன, வெவ்வேறு மொழிகளுக்கான குரல்களின் சேர்க்கைகளை வரையறுக்கிறது.

ஆதாரம்: opennet.ru

கருத்தைச் சேர்