RHVoice 1.6.0 ярианы синтезатор хувилбар

Нээлттэй ярианы синтезийн систем RHVoice 1.6.0 гарсан бөгөөд эхэндээ орос хэлийг өндөр чанартайгаар дэмжих зорилгоор боловсруулсан боловч дараа нь англи, португал, украин, киргиз, татар, гүрж зэрэг бусад хэлэнд дасан зохицсон. Код нь C++ хэл дээр бичигдсэн бөгөөд LGPL 2.1 лицензийн дагуу түгээгддэг. GNU/Linux, Windows болон Android дээр ажиллахыг дэмждэг. Энэ програм нь текстийг яриа болгон хөрвүүлэх стандарт TTS (текстээс яриа) интерфэйсүүдтэй нийцдэг: SAPI5 (Windows), ярианы диспетчер (GNU/Linux) болон Android Text-to-Speech API, гэхдээ NVDA-д бас ашиглаж болно. дэлгэц уншигч. RHVoice-ийн бүтээгч, гол хөгжүүлэгч нь Ольга Яковлева бөгөөд тэрээр бүрэн хараагүй байсан ч төслийг боловсруулдаг.

В новой версии добавлено 5 новых вариантов голосов для русской речи. Реализована поддержка албанского языка. Обновлён словарь для украинского языка. Расширена поддержка озвучивания символов emoji. Проведена работа по устранению ошибок в приложении для платформы Android, упрощён импорт пользовательских словарей, а также добавлена поддержка платформы Android 11. В ядро движка добавлены новые настройки и функциональные возможности, включая g2p.case, word_break и поддержку фильтров эквализации.

RHVoice нь HTS төслийн бүтээн байгуулалтыг (HMM/DNN-д суурилсан ярианы синтезийн систем) болон статистик загвартай нийлэгжүүлэх параметрийн аргыг (HMM дээр суурилсан статистик параметрийн синтез - Далд Марковын загвар) ашигладаг гэдгийг эргэн санацгаая. Статистик загварын давуу тал нь зардал багатай, CPU-ийн хүч чадал багатай байдаг. Бүх үйлдлүүд нь хэрэглэгчийн систем дээр локал байдлаар хийгддэг. Ярианы чанарын гурван түвшнийг дэмждэг (чанар бага байх тусам гүйцэтгэл өндөр, хариу үйлдэл үзүүлэх хугацаа богино байх болно).

Статистик загварын сул тал нь дуудлагын харьцангуй бага чанар бөгөөд энэ нь байгалийн ярианы хэсгүүдийн хослол дээр үндэслэн яриа үүсгэдэг синтезаторын түвшинд хүрч чаддаггүй боловч үр дүн нь нэлээд ойлгомжтой бөгөөд чанга яригчаас бичлэг цацаж байгаатай адил юм. . Харьцуулбал, машин сургалтын технологи, орос хэлний багц загвар дээр суурилсан нээлттэй ярианы синтезийн хөдөлгүүрээр хангадаг Silero төсөл нь чанарын хувьд RHVoice-ээс давуу юм.

Орос хэл дээр 13, англи хэл дээр 5 дуу хоолойны сонголтууд байдаг. Дуу хоолойнууд нь байгалийн ярианы бичлэг дээр тулгуурлан бүтээгдсэн. Тохиргоонд та хурд, дууны түвшин, дууны хэмжээг өөрчлөх боломжтой. Sonic номын санг хурдыг өөрчлөхөд ашиглаж болно. Оруулсан текстийн дүн шинжилгээнд үндэслэн хэлийг автоматаар илрүүлж, солих боломжтой (жишээлбэл, өөр хэл дээрх үг, ишлэлд тухайн хэлнээс гаралтай синтезийн загварыг ашиглаж болно). Янз бүрийн хэлний дуу хоолойны хослолыг тодорхойлдог дуут профайлыг дэмждэг.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх