🥇Die Veröffentlichung des Sprachsynthesizers RHVoice 1.2.4, entwickelt für die russische Sprache

Die neue Version des offenen Sprachsynthesesystems RHVoice 1.2.4 wurde veröffentlicht. Ursprünglich entwickelt, um eine qualitativ hochwertige Unterstützung der russischen Sprache zu gewährleisten, wurde es inzwischen auch für andere Sprachen wie Englisch, Portugiesisch, Ukrainisch, Kirgisisch, Tatarisch und Georgisch angepasst. Der Code ist in C++ geschrieben und wird unter der Lizenz LGPL 2.1 vertrieben. Es sind Kompatibilität und Betrieb auf GNU/Linux, Windows und Android gegeben. Das Programm ist mit den üblichen TTS-Schnittstellen (text-to-speech) für die Umwandlung von Text in Sprache kompatibel: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) und Android Text-To-Speech API, kann jedoch auch mit dem Screenreader NVDA verwendet werden.

In der Software wird eine parametrische Synthesemethode mit statistischen Modellen (Statistical Parametric Synthesis auf Basis von HMM – Hidden Markov Model) angewandt. Der Vorteil des statistischen Modells liegt in den geringen Overheadkosten und der Unabhängigkeit von der CPU-Leistung. Alle Operationen werden lokal auf dem Benutzersystem ausgeführt. Es werden drei Qualitätsstufen für die Sprachsynthese unterstützt (je niedriger die Qualität, desto höher die Leistung und kürzer die Reaktionszeit).

Es kann eine Anpassung und Änderung der Stimmen vorgenommen werden. Für die russische Sprache stehen 9 Sprachvarianten zur Verfügung, für Englisch 5. Die Stimmen basieren auf Aufnahmen natürlicher Sprache. Aufgrund der Verwendung eines statistischen Modells erreicht die Aussprache nicht das Niveau von Synthesizern, die Sprache auf Basis von Kombinationen von Fragmenten natürlicher Sprache generieren. Dennoch ist das Ergebnis gut verständlich und erinnert an die Übertragung einer Aufnahme über einen Lautsprecher.

In den Einstellungen können Geschwindigkeit, Tonhöhe und Lautstärke verändert werden. Für die Anpassung des Tempos kann die Sonic-Bibliothek verwendet werden. Es ist möglich, die Sprache automatisch zu erkennen und basierend auf der Analyse des Eingabetextes zu wechseln (zum Beispiel kann für Wörter und Zitate in einer anderen Sprache das native Modell für diese Sprache verwendet werden). Sprachprofile werden unterstützt, die Kombinationen von Stimmen für verschiedene Sprachen definieren.

Quelle: opennet.ru

Veröffentlichung des Sprachsynthesizers RHVoice 1.2.4, der für die russische Sprache entwickelt wurde.

Juri Gagarin