Sgaoileadh synthesizer cainnt RHVoice 1.6.0

Chaidh an siostam synthesis cainnt fosgailte RHVoice 1.6.0 a leigeil ma sgaoil, a chaidh a leasachadh an toiseach gus taic àrd-inbhe a thoirt don chànan Ruiseanach, ach an uairsin air atharrachadh airson cànanan eile, nam measg Beurla, Portuguese, Ucràinis, Kyrgyz, Tatar agus Georgian. Tha an còd sgrìobhte ann an C ++ agus air a chuairteachadh fo chead LGPL 2.1. A’ toirt taic do dh’ obair air GNU/Linux, Windows agus Android. Tha am prògram co-chòrdail ri eadar-aghaidh àbhaisteach TTS (teacsa-gu-cainnt) airson teacsa a thionndadh gu cainnt: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) agus Android Text-To-Speech API, ach faodar a chleachdadh cuideachd anns an NVDA leughadair sgrion. Is e an neach-cruthachaidh agus prìomh leasaiche RHVoice Olga Yakovleva, a bhios a 'leasachadh a' phròiseict a dh'aindeoin a bhith gu tur dall.

Tha an dreach ùr a’ cur 5 roghainnean guth ùra ris airson cainnt Ruiseanach. Tha taic cànain Albàinianach air a chur an gnìomh. Chaidh am faclair airson a’ chànan ucràinis ùrachadh. Tha taic airson cleasachd guth de charactaran emoji air a leudachadh. Chaidh obair a dhèanamh gus cuir às do mhearachdan san tagradh airson àrd-ùrlar Android, chaidh toirt a-steach fhaclairean àbhaisteach a dhèanamh nas sìmplidhe, agus chaidh taic airson àrd-ùrlar Android 11 a chuir ris. Chaidh suidheachaidhean agus feartan ùra a chuir ri cridhe an einnsean, a’ toirt a-steach g2p. cùis, word_break agus taic airson sìoltachain co-ionannachd.

Cuimhnichidh sinn gu bheil RHVoice a’ cleachdadh leasachaidhean pròiseact HTS (Siostam Synthesis Òraid stèidhichte air HMM/DNN) agus an dòigh synthesis parametric le modalan staitistigeil (Synthesis Parametric Staitistigeil stèidhichte air HMM - Modail Hidden Markov). Is e buannachd a’ mhodail staitistigeil cosgaisean os-cionn ìosal agus cumhachd CPU gun fheum. Bidh a h-uile gnìomh air a dhèanamh gu h-ionadail air siostam an neach-cleachdaidh. Thathas a’ toirt taic do thrì ìrean de chàileachd cainnt (mar as ìsle an càileachd, is ann as àirde an coileanadh agus mar as giorra an ùine freagairt).

Is e an eas-bhuannachd den mhodail staitistigeil càileachd fuaimneachaidh an ìre mhath ìosal, nach ruig an ìre de synthesizers a ghineas cainnt stèidhichte air measgachadh de mhìrean de chainnt nàdarrach, ach a dh’ aindeoin sin tha an toradh gu math furasta a leughadh agus tha e coltach ri bhith a’ craoladh clàradh bho glaodhaire. . Airson coimeas a dhèanamh, tha am pròiseact Silero, a tha a’ toirt seachad einnsean synthesis cainnt fosgailte stèidhichte air teicneòlasan ionnsachaidh inneal agus seata de mhodalan airson cànan na Ruis, nas fheàrr ann an càileachd na RHVoice.

Tha 13 roghainnean guth rim faighinn airson na Ruisis, agus 5 airson Beurla.Tha na guthan air an cruthachadh stèidhichte air clàraidhean de chainnt nàdarrach. Anns na roghainnean faodaidh tu astar, pitch agus tomhas-lìonaidh atharrachadh. Faodar an leabharlann Sonic a chleachdadh gus an tempo atharrachadh. Tha e comasach cànanan a lorg agus atharrachadh gu fèin-ghluasadach stèidhichte air mion-sgrùdadh air an teacsa cuir a-steach (mar eisimpleir, airson faclan agus luachan ann an cànan eile, faodar modal synthesis a tha dùthchasach don chànan sin a chleachdadh). Tha pròifilean gutha a’ faighinn taic, a’ mìneachadh measgachadh de ghuthan airson diofar chànanan.

Source: fosgailtenet.ru

Cuir beachd ann