RHVoice 1.6.0, як системаи синтези нутқи кушодаасос, бароварда шуд. Дар аввал он барои таъмини дастгирии босифат барои забони русӣ таҳия шуда буд, аммо баъдан барои забонҳои дигар, аз ҷумла англисӣ, португалӣ, украинӣ, қирғизӣ, тоторӣ ва гурҷӣ мутобиқ карда шуд. Ин рамз бо забони C++ навишта шудааст ва тибқи иҷозатномаи LGPL 2.1 паҳн карда мешавад. Дастгирии GNU/Linux низ дастгирӣ карда мешавад.Linux, Windows и AndroidБарнома бо интерфейсҳои маъмулии TTS (матн ба нутқ) барои табдил додани матн ба нутқ мувофиқ аст: SAPI5 (Windows), Диспетчери нутқ (GNU/Linux) ва Android API-и матн ба нутқ, аммо инчунин метавонад бо хонандаи экрани NVDA истифода шавад. Офаридгор ва таҳиягари асосии RHVoice Ольга Яковлева аст, ки сарфи назар аз нобиноӣ, ба таҳияи лоиҳа идома медиҳад.
Нусхаи нав 5 варианти нави овозӣ барои нутқи русӣ илова мекунад. Дастгирии забони албанӣ амалӣ карда шуд. Луғати украинӣ навсозӣ шуд. Дастгирии талаффузи эмодзиҳо васеъ карда шуд. Ислоҳи хатогиҳо дар барномаи платформа амалӣ карда шуд. Android, воридоти луғатҳои корбарон содда карда шуд ва дастгирии платформа илова карда шуд Android 11. Ба ядрои муҳаррик танзимот ва функсияҳои нав, аз ҷумла g2p.case, word_break ва дастгирии филтрҳои баробаркунӣ, илова карда шуданд.
Ёдовар мешавем, ки RHVoice коркардҳои лоиҳаи HTS (Системаи синтези нутқ дар асоси HMM/DNN) ва усули синтези параметриро бо моделҳои оморӣ (Synthesis Statistical Parametric Synthesis дар асоси HMM - Hidden Markov Model) истифода мебарад. Бартарии модели оморӣ хароҷоти ками изофӣ ва қудрати бебаҳои CPU мебошад. Ҳама амалиётҳо ба таври маҳаллӣ дар системаи корбар анҷом дода мешаванд. Се сатҳи сифати нутқ дастгирӣ карда мешавад (сифат чӣ қадар паст бошад, иҷроиш ҳамон қадар баландтар ва вақти реаксия ҳамон қадар кӯтоҳтар мешавад).
Камбудии модели оморӣ сифати нисбатан пасти талаффуз аст, ки он ба сатҳи синтезаторҳое, ки нутқро дар асоси омезиши порчаҳои нутқи табиӣ тавлид мекунанд, намерасанд, аммо бо вуҷуди ин натиҷа комилан қобили хондан аст ва ба пахши сабт аз баландгӯяк шабоҳат дорад. . Барои муқоиса, лоиҳаи Silero, ки муҳаррики синтези кушоди нутқро дар асоси технологияҳои омӯзиши мошинсозӣ ва маҷмӯи моделҳои забони русиро таъмин мекунад, аз ҷиҳати сифат аз RHVoice бартарӣ дорад.
Барои забони русӣ 13 варианти овозӣ ва барои забони англисӣ 5 вариант мавҷуд аст. Овозҳо дар асоси сабтҳои нутқи табиӣ сохта шудаанд. Дар танзимот шумо метавонед суръат, баландӣ ва садоро тағир диҳед. Китобхонаи Sonic метавонад барои тағир додани суръат истифода шавад. Дар асоси таҳлили матни воридотӣ ба таври худкор забонҳоро ошкор ва иваз кардан мумкин аст (масалан, барои калимаҳо ва иқтибосҳо дар забони дигар, модели синтези модарии он забонро истифода бурдан мумкин аст). Профилҳои овозӣ дастгирӣ карда мешаванд, ки маҷмӯи овозҳоро барои забонҳои гуногун муайян мекунанд.
Манбаъ: opennet.ru
