Rus dili için geliştirilen konuşma sentezleyici RHVoice 1.2.4'ün piyasaya sürülmesi

Açık konuşma sentezi sistemi RHVoice 1.2.4'ün sürümü yayınlandı; başlangıçta Rus dili için yüksek kaliteli destek sağlamak üzere geliştirildi, ancak daha sonra İngilizce, Portekizce, Ukraynaca, Kırgızca, Tatarca ve Gürcüce gibi diğer dillere de uyarlandı. Kod C++ dilinde yazılmıştır ve LGPL 2.1 lisansı altında dağıtılmaktadır. GNU/Linux, Windows ve Android üzerinde çalışmayı destekler. Program, metni konuşmaya dönüştürmek için standart TTS (metin-konuşma) arayüzleriyle uyumludur: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) ve Android Text-to-Speech API, ancak NVDA'da da kullanılabilir. ekran okuyucu.

Program, istatistiksel modeller ile parametrik sentez yöntemini kullanır (HMM'ye dayalı İstatistiksel Parametrik Sentez - Gizli Markov Modeli). İstatistiksel modelin avantajı düşük genel giderler ve iddiasız CPU gücüdür. Tüm işlemler kullanıcının sisteminde yerel olarak gerçekleştirilir. Üç düzeyde konuşma kalitesi desteklenir (kalite ne kadar düşük olursa, performans o kadar yüksek ve tepki süresi o kadar kısa olur).

Sesleri ayarlamayı ve değiştirmeyi destekler. Rusça için 9, İngilizce için 5 ses seçeneği mevcuttur.Sesler, doğal konuşma kayıtlarına göre oluşturulur. İstatistiksel bir modelin kullanılması nedeniyle, telaffuzun kalitesi, doğal konuşma parçalarının bir kombinasyonuna dayalı olarak konuşma üreten sentezleyicilerin seviyesine ulaşmaz, ancak yine de sonuç oldukça anlaşılırdır ve bir hoparlörden yapılan kayıt yayınına benzemektedir. .

Ayarlarda hızı, perdeyi ve ses seviyesini değiştirebilirsiniz. Sonic kütüphanesi tempoyu değiştirmek için kullanılabilir. Giriş metninin analizine göre dilleri otomatik olarak tespit etmek ve değiştirmek mümkündür (örneğin, başka bir dildeki kelimeler ve alıntılar için o dile özgü bir sentez modeli kullanılabilir). Farklı diller için ses kombinasyonlarını tanımlayan ses profilleri desteklenir.

Kaynak: opennet.ru

Yorum ekle