RHVoice 1.8.0 Ried Synthesizer Verëffentlechung

D'Open Speech Synthese System RHVoice 1.8.0 gouf verëffentlecht, am Ufank entwéckelt fir qualitativ héichwäerteg Ënnerstëtzung fir déi russesch Sprooch ze bidden, awer duerno fir aner Sproochen ugepasst, dorënner Englesch, Portugisesch, Ukrainesch, Kirgisesch, Tatar a Georgian. De Code ass an C++ geschriwwen an ënner der LGPL 2.1 Lizenz verdeelt. Ënnerstëtzt Aarbecht op GNU / Linux, Windows an Android. De Programm ass kompatibel mat Standard TTS (Text-zu-Speech) Interfaces fir Text a Ried ze konvertéieren: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) an Android Text-To-Speech API, awer kann och an der NVDA benotzt ginn Écran Lieser. De Schëpfer an den Haaptentwéckler vu RHVoice ass Olga Yakovleva, déi de Projet entwéckelt trotz komplett blann.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Loosst eis drun erënneren datt RHVoice d'Entwécklungen vum HTS-Projet benotzt (HMM / DNN-baséiert Speech Synthesis System) an déi parametresch Synthesemethod mat statistesche Modeller (Statistical Parametric Synthesis baséiert op HMM - Hidden Markov Model). De Virdeel vum statistesche Modell ass niddereg Overhead Käschten an onerfueren CPU Kraaft. All Operatioune ginn lokal op de System vum Benotzer duerchgefouert. Dräi Niveaue vu Riedqualitéit ginn ënnerstëtzt (wat manner Qualitéit ass, wat méi héich ass d'Performance an déi méi kuerz d'Reaktiounszäit).

Den Nodeel vum statistesche Modell ass déi relativ niddreg Aussproochqualitéit, déi net den Niveau vun de Synthesizer erreecht, déi Ried generéieren op Basis vun enger Kombinatioun vu Fragmenter vun der natierlecher Ried, awer trotzdem ass d'Resultat ganz liesbar a gläicht d'Ausstrahlung vun enger Opnam aus engem Lautsprecher. . Zum Verglach ass de Silero-Projet, deen en oppene Riedssynthesemotor baséiert op Maschinnléiertechnologien an eng Rei vu Modeller fir d'russesch Sprooch ubitt, ass héich Qualitéit wéi RHVoice.

Et gi 14 Stëmmoptiounen verfügbar fir d'russesch Sprooch, a 6 fir Englesch. D'Stëmmen gi geformt op Basis vun Opzeechnunge vun der natierlecher Ried. An den Astellungen kënnt Dir d'Geschwindegkeet, Pitch a Volumen änneren. D'Sonic Bibliothéik kann benotzt ginn fir den Tempo z'änneren. Et ass méiglech Sproochen automatesch z'entdecken an ze wiesselen op Basis vun der Analyse vum Inputtext (zum Beispill, fir Wierder an Zitater an enger anerer Sprooch, kann e Synthesemodell gebierteg zu där Sprooch benotzt ginn). Stëmmprofile ginn ënnerstëtzt, déi Kombinatioune vu Stëmme fir verschidde Sproochen definéieren.

Source: opennet.ru

Setzt e Commentaire