Sgaoileadh synthesizer cainnt RHVoice 1.8.0

Chaidh an siostam synthesis cainnt fosgailte RHVoice 1.8.0 a leigeil ma sgaoil, a chaidh a leasachadh an toiseach gus taic àrd-inbhe a thoirt don chànan Ruiseanach, ach an uairsin air atharrachadh airson cànanan eile, nam measg Beurla, Portuguese, Ucràinis, Kyrgyz, Tatar agus Georgian. Tha an còd sgrìobhte ann an C ++ agus air a chuairteachadh fo chead LGPL 2.1. A’ toirt taic do dh’ obair air GNU/Linux, Windows agus Android. Tha am prògram co-chòrdail ri eadar-aghaidh àbhaisteach TTS (teacsa-gu-cainnt) airson teacsa a thionndadh gu cainnt: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) agus Android Text-To-Speech API, ach faodar a chleachdadh cuideachd anns an NVDA leughadair sgrion. Is e an neach-cruthachaidh agus prìomh leasaiche RHVoice Olga Yakovleva, a bhios a 'leasachadh a' phròiseict a dh'aindeoin a bhith gu tur dall.

Tha dreach 1.8 airson an àrd-ùrlar Android a’ toirt a-steach siostam riaghlaidh dàta guth is cànain ùr a leigeas leat ùrachaidhean dàta guth a luchdachadh sìos gun a bhith ag ùrachadh an aplacaid gluasadach. Thèid ùrachadh dàta airson guthan agus cànanan a bharrachd a sgrùdadh gu fèin-ghluasadach. A bharrachd air an sin, tha am brath ùr a’ toirt a-steach taic don Phòlainn agus a’ cur guth ùr ris a’ chànan Macedonian. Tha co-chòrdalachd leis na fiosan alpha agus beta as ùire den leughadair sgrion NVDA air a dhèanamh cinnteach. Duilgheadasan stèidhichte le bhith a’ togail air an àrd-ùrlar Linux a thachair nuair nach robh Speech Dispatcher an làthair.

Cuimhnichidh sinn gu bheil RHVoice a’ cleachdadh leasachaidhean pròiseact HTS (Siostam Synthesis Òraid stèidhichte air HMM/DNN) agus an dòigh synthesis parametric le modalan staitistigeil (Synthesis Parametric Staitistigeil stèidhichte air HMM - Modail Hidden Markov). Is e buannachd a’ mhodail staitistigeil cosgaisean os-cionn ìosal agus cumhachd CPU gun fheum. Bidh a h-uile gnìomh air a dhèanamh gu h-ionadail air siostam an neach-cleachdaidh. Thathas a’ toirt taic do thrì ìrean de chàileachd cainnt (mar as ìsle an càileachd, is ann as àirde an coileanadh agus mar as giorra an ùine freagairt).

Is e an eas-bhuannachd den mhodail staitistigeil càileachd fuaimneachaidh an ìre mhath ìosal, nach ruig an ìre de synthesizers a ghineas cainnt stèidhichte air measgachadh de mhìrean de chainnt nàdarrach, ach a dh’ aindeoin sin tha an toradh gu math furasta a leughadh agus tha e coltach ri bhith a’ craoladh clàradh bho glaodhaire. . Airson coimeas a dhèanamh, tha am pròiseact Silero, a tha a’ toirt seachad einnsean synthesis cainnt fosgailte stèidhichte air teicneòlasan ionnsachaidh inneal agus seata de mhodalan airson cànan na Ruis, nas fheàrr ann an càileachd na RHVoice.

Tha 14 roghainnean guth rim faighinn airson na Ruisis, agus 6 airson Beurla.Tha na guthan air an cruthachadh stèidhichte air clàraidhean de chainnt nàdarrach. Anns na roghainnean faodaidh tu astar, pitch agus tomhas-lìonaidh atharrachadh. Faodar an leabharlann Sonic a chleachdadh gus an tempo atharrachadh. Tha e comasach cànanan a lorg agus atharrachadh gu fèin-ghluasadach stèidhichte air mion-sgrùdadh air an teacsa cuir a-steach (mar eisimpleir, airson faclan agus luachan ann an cànan eile, faodar modal synthesis a tha dùthchasach don chànan sin a chleachdadh). Tha pròifilean gutha a’ faighinn taic, a’ mìneachadh measgachadh de ghuthan airson diofar chànanan.

Source: fosgailtenet.ru

Cuir beachd ann