RHVoice 1.8.0 स्पीच सिन्थेसाइजर जारी गरियो

खुला भाषण संश्लेषण प्रणाली RHVoice 1.8.0 जारी गरिएको थियो, प्रारम्भमा रूसी भाषाको लागि उच्च-गुणस्तर समर्थन प्रदान गर्न विकसित गरिएको थियो, तर त्यसपछि अंग्रेजी, पोर्तुगाली, युक्रेनी, किर्गिज, टाटार र जर्जियन लगायत अन्य भाषाहरूको लागि अनुकूलित गरियो। कोड C++ मा लेखिएको छ र LGPL 2.1 लाइसेन्स अन्तर्गत वितरण गरिएको छ। GNU/Linux, Windows र Android मा काम गर्न समर्थन गर्दछ। यो कार्यक्रम पाठलाई भाषणमा रूपान्तरण गर्नको लागि मानक TTS (टेक्स्ट-टू-स्पीच) इन्टरफेसहरूसँग उपयुक्त छ: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) र Android Text-to-Speech API, तर NVDA मा पनि प्रयोग गर्न सकिन्छ। स्क्रिन रिडर। RHVoice को सृष्टिकर्ता र मुख्य विकासकर्ता ओल्गा याकोभलेभा हुन्, जसले पूर्णतया दृष्टिविहीन भएर पनि परियोजनाको विकास गर्छिन्।

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

हामीलाई याद गरौं कि RHVoice ले HTS परियोजना (HMM/DNN-आधारित स्पीच सिन्थेसिस प्रणाली) को विकास र सांख्यिकीय मोडेलहरू (HMM - हिडन मार्कोभ मोडेलमा आधारित सांख्यिकीय प्यारामेट्रिक संश्लेषण) को साथ प्यारामेट्रिक संश्लेषण विधि प्रयोग गर्दछ। सांख्यिकीय मोडेलको फाइदा कम ओभरहेड लागत र अनावश्यक CPU शक्ति हो। सबै कार्यहरू स्थानीय रूपमा प्रयोगकर्ताको प्रणालीमा गरिन्छ। वाक् गुणस्तरको तीन स्तरहरू समर्थित छन् (जति कम गुणस्तर, उच्च प्रदर्शन र छोटो प्रतिक्रिया समय)।

सांख्यिकीय मोडेलको नकारात्मक पक्ष भनेको उच्चारणको तुलनात्मक रूपमा कम गुणस्तर हो, जुन सिन्थेसाइजरहरूको स्तरमा पुग्दैन जसले प्राकृतिक भाषणको टुक्राहरूको संयोजनमा आधारित भाषण उत्पन्न गर्दछ, तर यद्यपि परिणाम धेरै सुपाठ्य छ र लाउडस्पीकरबाट रेकर्डिङ प्रसारण जस्तो देखिन्छ। । तुलनाको लागि, सिलेरो प्रोजेक्ट, जसले मेसिन लर्निङ टेक्नोलोजीहरूमा आधारित खुला स्पीच सिन्थेसिस इन्जिन र रूसी भाषाका लागि मोडेलहरूको सेट प्रदान गर्दछ, गुणस्तरमा RHVoice भन्दा उच्च छ।

त्यहाँ रूसी भाषाको लागि 14 आवाज विकल्पहरू उपलब्ध छन्, र अंग्रेजीको लागि 6। आवाजहरू प्राकृतिक भाषणको रेकर्डिङमा आधारित हुन्छन्। सेटिङहरूमा तपाईं गति, पिच र भोल्युम परिवर्तन गर्न सक्नुहुन्छ। ध्वनि पुस्तकालय टेम्पो परिवर्तन गर्न प्रयोग गर्न सकिन्छ। इनपुट पाठको विश्लेषणमा आधारित भाषाहरू स्वचालित रूपमा पत्ता लगाउन र स्विच गर्न सम्भव छ (उदाहरणका लागि, अर्को भाषामा शब्दहरू र उद्धरणहरूका लागि, त्यो भाषाको मूल संश्लेषण मोडेल प्रयोग गर्न सकिन्छ)। भ्वाइस प्रोफाइलहरू समर्थित छन्, विभिन्न भाषाहरूको लागि आवाजहरूको संयोजन परिभाषित गर्दै।

स्रोत: opennet.ru

एक टिप्पणी थप्न