Veröffentlichung des Sprachsynthesizers RHVoice 1.2.4, entwickelt für die russische Sprache

Die Veröffentlichung des offenen Sprachsynthesesystems RHVoice 1.2.4 wurde veröffentlicht, das ursprünglich entwickelt wurde, um eine hochwertige Unterstützung für die russische Sprache zu bieten, dann aber für andere Sprachen angepasst wurde, darunter Englisch, Portugiesisch, Ukrainisch, Kirgisisch, Tatarisch und Georgisch. Der Code ist in C++ geschrieben und wird unter der LGPL 2.1-Lizenz vertrieben. Unterstützt die Arbeit unter GNU/Linux, Windows und Android. Das Programm ist mit Standard-TTS-Schnittstellen (Text-to-Speech) zur Konvertierung von Text in Sprache kompatibel: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) und Android Text-To-Speech API, kann aber auch im NVDA verwendet werden Bildschirmleser.

Das Programm nutzt die Methode der parametrischen Synthese mit statistischen Modellen (Statistical Parametric Synthesis based on HMM – Hidden Markov Model). Der Vorteil des statistischen Modells sind geringe Overhead-Kosten und eine geringe CPU-Leistung. Alle Vorgänge werden lokal auf dem System des Benutzers ausgeführt. Es werden drei Stufen der Sprachqualität unterstützt (je niedriger die Qualität, desto höher die Leistung und desto kürzer die Reaktionszeit).

Unterstützt das Einstellen und Ändern von Stimmen. Für die russische Sprache stehen 9 Stimmoptionen zur Verfügung, für Englisch 5. Die Stimmen werden auf der Grundlage von Aufnahmen natürlicher Sprache gebildet. Aufgrund der Verwendung eines statistischen Modells erreicht die Qualität der Aussprache nicht das Niveau von Synthesizern, die Sprache auf der Grundlage einer Kombination von Fragmenten natürlicher Sprache erzeugen, aber dennoch ist das Ergebnis durchaus verständlich und ähnelt der Übertragung einer Aufnahme aus einem Lautsprecher .

In den Einstellungen können Sie Geschwindigkeit, Tonhöhe und Lautstärke ändern. Zur Änderung des Tempos kann die Sonic-Bibliothek genutzt werden. Es ist möglich, Sprachen basierend auf der Analyse des Eingabetextes automatisch zu erkennen und zu wechseln (für Wörter und Zitate in einer anderen Sprache kann beispielsweise ein für diese Sprache natives Synthesemodell verwendet werden). Es werden Sprachprofile unterstützt, die Stimmenkombinationen für verschiedene Sprachen definieren.

Source: opennet.ru

Kommentar hinzufügen