Нашри синтезатори нутқи RHVoice 1.8.0

Системаи кушодаи синтези нутқи RHVoice 1.8.0 бароварда шуд, ки дар аввал барои таъмини дастгирии босифати забони русӣ таҳия шудааст, вале баъдан барои забонҳои дигар, аз ҷумла англисӣ, португалӣ, украинӣ, қирғизӣ, тоторӣ ва гурҷӣ мутобиқ карда шудааст. Рамз дар C++ навишта шудааст ва таҳти иҷозатномаи LGPL 2.1 паҳн карда мешавад. Корҳоро дар GNU/Linux, Windows ва Android дастгирӣ мекунад. Барнома бо интерфейсҳои стандартии TTS (матн ба нутқ) барои табдили матн ба нутқ мувофиқ аст: SAPI5 (Windows), Диспетчери нутқ (GNU/Linux) ва Android Text-to-Speech API, аммо онро дар NVDA низ истифода бурдан мумкин аст. хонандаи экран. Офаридгор ва таҳиягари асосии RHVoice Олга Яковлева мебошад, ки сарфи назар аз нобино буданаш лоиҳаро таҳия мекунад.

В версии 1.8 для платформы Android предложена новая система управления голосовыми и языковыми данными, позволяющая загружать обновления голосовых данных без обновления мобильного приложения. Проверка появления обновлений данных для добавленных голосов и языков производится автоматически. Кроме того, в новом выпуске реализована поддержка польского языка и добавлен новый голос для македонского языка. Обеспечена совместимость со свежими альфа- и бета-выпусками экранного ридера NVDA. Устранены проблемы со сборкой на платформе Linux, возникавшие при отсутствии Speech Dispatcher.

Ёдовар мешавем, ки RHVoice коркардҳои лоиҳаи HTS (Системаи синтези нутқ дар асоси HMM/DNN) ва усули синтези параметриро бо моделҳои оморӣ (Synthesis Statistical Parametric Synthesis дар асоси HMM - Hidden Markov Model) истифода мебарад. Бартарии модели оморӣ хароҷоти ками изофӣ ва қудрати бебаҳои CPU мебошад. Ҳама амалиётҳо ба таври маҳаллӣ дар системаи корбар анҷом дода мешаванд. Се сатҳи сифати нутқ дастгирӣ карда мешавад (сифат чӣ қадар паст бошад, иҷроиш ҳамон қадар баландтар ва вақти реаксия ҳамон қадар кӯтоҳтар мешавад).

Камбудии модели оморӣ сифати нисбатан пасти талаффуз аст, ки он ба сатҳи синтезаторҳое, ки нутқро дар асоси омезиши порчаҳои нутқи табиӣ тавлид мекунанд, намерасанд, аммо бо вуҷуди ин натиҷа комилан қобили хондан аст ва ба пахши сабт аз баландгӯяк шабоҳат дорад. . Барои муқоиса, лоиҳаи Silero, ки муҳаррики синтези кушоди нутқро дар асоси технологияҳои омӯзиши мошинсозӣ ва маҷмӯи моделҳои забони русиро таъмин мекунад, аз ҷиҳати сифат аз RHVoice бартарӣ дорад.

Барои забони русӣ 14 варианти овозӣ ва барои забони англисӣ 6 вариант мавҷуд аст. Овозҳо дар асоси сабтҳои нутқи табиӣ сохта шудаанд. Дар танзимот шумо метавонед суръат, баландӣ ва садоро тағир диҳед. Китобхонаи Sonic метавонад барои тағир додани суръат истифода шавад. Дар асоси таҳлили матни воридотӣ ба таври худкор забонҳоро ошкор ва иваз кардан мумкин аст (масалан, барои калимаҳо ва иқтибосҳо дар забони дигар, модели синтези модарии он забонро истифода бурдан мумкин аст). Профилҳои овозӣ дастгирӣ карда мешаванд, ки маҷмӯи овозҳоро барои забонҳои гуногун муайян мекунанд.

Манбаъ: opennet.ru

Илова Эзоҳ