RHVoice 1.8.0 ahots-sintetizadorea kaleratzea

RHVoice 1.8.0 ahots-sintesi sistema irekia kaleratu zen, hasieran errusiar hizkuntzari kalitate handiko euskarria eskaintzeko garatua, baina gero beste hizkuntza batzuetarako egokitu zen, ingelesa, portugesa, ukrainera, kirgizera, tatariera eta georgiera barne. Kodea C++-n idatzita dago eta LGPL 2.1 lizentziapean banatzen da. GNU/Linux, Windows eta Android-en lanak onartzen ditu. Programa bateragarria da TTS (text-to-speech) interfaze estandarrekin testua ahots bihurtzeko: SAPI5 (Windows), Speech Dispatcher (GNU/Linux) eta Android Text-To-Speech API, baina NVDAn ere erabil daiteke. pantaila-irakurgailua. RHVoice-ren sortzaile eta garatzaile nagusia Olga Yakovleva da, guztiz itsua izan arren proiektua garatzen duena.

Android plataformarako 1.8 bertsioak ahotsaren eta hizkuntzaren datuak kudeatzeko sistema berri bat aurkezten du, mugikorreko aplikazioa eguneratu gabe ahotsaren datuen eguneraketak deskargatzeko aukera ematen duena. Gehitutako ahotsen eta hizkuntzen datuen eguneraketak automatikoki egiaztatzen dira. Horrez gain, argitalpen berriak poloniar hizkuntzarako laguntza eskaintzen du eta mazedoniar hizkuntzarako ahots berria gehitzen du. NVDA pantaila-irakurgailuaren alfa eta beta bertsio berrienekin bateragarritasuna bermatuta dago. Speech Dispatcher ez zegoenean gertatutako Linux plataforman eraikitzeko arazoak konpondu dira.

Gogora dezagun RHVoice-k HTS proiektuaren (HMM/DNN-en oinarritutako Speech Synthesis System) eta eredu estatistikoekin (Statistical Parametric Synthesis oinarritutako HMM - Hidden Markov Model - Hidden Markov Model-ekin) eta sintesi parametriko metodoaren garapenak erabiltzen dituela. Eredu estatistikoaren abantaila gainkostu txikiak eta CPU potentzia eskasak dira. Eragiketa guztiak lokalean egiten dira erabiltzailearen sisteman. Hiru hizketa-kalitate-maila onartzen dira (zenbat eta kalitate txikiagoa, errendimendu handiagoa eta erreakzio denbora laburragoa).

Eredu estatistikoaren alde txarra ahoskabearen kalitate nahiko baxua da, ez baita hizkera naturalaren zatien konbinazioan oinarritutako hizkera sortzen duten sintetizadoreen mailara iristen, baina, hala ere, emaitza nahiko irakurgarria da eta bozgorailutik grabazio bat igortzearen antza du. . Konparazio baterako, Silero proiektua, ikaskuntza automatikoko teknologietan eta errusiar hizkuntzarako eredu-multzo batean oinarritutako hizketa-sintesi motor ireki bat eskaintzen duena, RHVoice-ren kalitatean hobea da.

Errusiako hizkuntzarako 14 ahots-aukera daude eskuragarri, eta ingeleserako 6. Ahotsak hizkera naturalaren grabaketetan oinarrituta daude. Ezarpenetan abiadura, tonua eta bolumena alda ditzakezu. Sonic liburutegia tempoa aldatzeko erabil daiteke. Sarrerako testuaren azterketan oinarrituta hizkuntza automatikoki detektatu eta alda daiteke (adibidez, beste hizkuntza bateko hitzak eta komatxoak egiteko, hizkuntza horretako jatorrizko sintesi eredua erabil daiteke). Ahots profilak onartzen dira, hizkuntza ezberdinetarako ahotsen konbinazioak definituz.

Iturria: opennet.ru

Gehitu iruzkin berria