RHVoice 1.6.0 స్పీచ్ సింథసైజర్ విడుదల

ఓపెన్ స్పీచ్ సింథసిస్ సిస్టమ్ RHVoice 1.6.0 విడుదల చేయబడింది, ప్రారంభంలో రష్యన్ భాషకు అధిక-నాణ్యత మద్దతును అందించడానికి అభివృద్ధి చేయబడింది, కానీ తర్వాత ఇంగ్లీష్, పోర్చుగీస్, ఉక్రేనియన్, కిర్గిజ్, టాటర్ మరియు జార్జియన్‌లతో సహా ఇతర భాషలకు స్వీకరించబడింది. కోడ్ C++లో వ్రాయబడింది మరియు LGPL 2.1 లైసెన్స్ క్రింద పంపిణీ చేయబడింది. GNU/Linux, Windows మరియు Androidలో పని చేయడానికి మద్దతు ఇస్తుంది. ప్రోగ్రామ్ టెక్స్ట్‌ను స్పీచ్‌గా మార్చడానికి ప్రామాణిక TTS (టెక్స్ట్-టు-స్పీచ్) ఇంటర్‌ఫేస్‌లకు అనుకూలంగా ఉంటుంది: SAPI5 (Windows), స్పీచ్ డిస్పాచర్ (GNU/Linux) మరియు Android టెక్స్ట్-టు-స్పీచ్ API, కానీ NVDAలో కూడా ఉపయోగించవచ్చు. స్క్రీన్ రీడర్. RHVoice యొక్క సృష్టికర్త మరియు ప్రధాన డెవలపర్ ఓల్గా యాకోవ్లెవా, అతను పూర్తిగా అంధుడైనప్పటికీ ప్రాజెక్ట్‌ను అభివృద్ధి చేస్తాడు.

కొత్త వెర్షన్ రష్యన్ ప్రసంగం కోసం 5 కొత్త వాయిస్ ఎంపికలను జోడిస్తుంది. అల్బేనియన్ భాష మద్దతు అమలు చేయబడింది. ఉక్రేనియన్ భాష కోసం నిఘంటువు నవీకరించబడింది. ఎమోజి పాత్రల వాయిస్ నటనకు మద్దతు విస్తరించబడింది. Android ప్లాట్‌ఫారమ్ కోసం అప్లికేషన్‌లో లోపాలను తొలగించడానికి పని జరిగింది, అనుకూల నిఘంటువుల దిగుమతి సరళీకృతం చేయబడింది మరియు Android 11 ప్లాట్‌ఫారమ్‌కు మద్దతు జోడించబడింది. g2pతో సహా ఇంజిన్ కోర్‌కి కొత్త సెట్టింగ్‌లు మరియు కార్యాచరణ జోడించబడ్డాయి. కేస్, వర్డ్_బ్రేక్ మరియు ఈక్వలైజేషన్ ఫిల్టర్‌లకు మద్దతు.

RHVoice HTS ప్రాజెక్ట్ (HMM/DNN-ఆధారిత స్పీచ్ సింథసిస్ సిస్టమ్) అభివృద్ధిని మరియు గణాంక నమూనాలతో పారామెట్రిక్ సింథసిస్ పద్ధతిని ఉపయోగిస్తుందని గుర్తు చేద్దాం (HMM ఆధారంగా స్టాటిస్టికల్ పారామెట్రిక్ సింథసిస్ - హిడెన్ మార్కోవ్ మోడల్). స్టాటిస్టికల్ మోడల్ యొక్క ప్రయోజనం తక్కువ ఓవర్‌హెడ్ ఖర్చులు మరియు డిమాండ్ చేయని CPU పవర్. అన్ని కార్యకలాపాలు వినియోగదారు సిస్టమ్‌లో స్థానికంగా నిర్వహించబడతాయి. ప్రసంగ నాణ్యత యొక్క మూడు స్థాయిలకు మద్దతు ఉంది (తక్కువ నాణ్యత, అధిక పనితీరు మరియు తక్కువ ప్రతిచర్య సమయం).

గణాంక నమూనా యొక్క ప్రతికూలత సాపేక్షంగా తక్కువ నాణ్యత ఉచ్ఛారణ, ఇది సహజ ప్రసంగం యొక్క శకలాలు కలయిక ఆధారంగా ప్రసంగాన్ని రూపొందించే సింథసైజర్‌ల స్థాయిని చేరుకోదు, అయినప్పటికీ ఫలితం చాలా స్పష్టంగా ఉంటుంది మరియు లౌడ్‌స్పీకర్ నుండి రికార్డింగ్‌ను ప్రసారం చేయడాన్ని పోలి ఉంటుంది. . పోలిక కోసం, మెషిన్ లెర్నింగ్ టెక్నాలజీల ఆధారంగా ఓపెన్ స్పీచ్ సింథసిస్ ఇంజిన్‌ను మరియు రష్యన్ భాష కోసం మోడల్‌ల సెట్‌ను అందించే సిలెరో ప్రాజెక్ట్ నాణ్యతలో RHVoice కంటే మెరుగైనది.

రష్యన్ భాష కోసం 13 వాయిస్ ఎంపికలు అందుబాటులో ఉన్నాయి మరియు ఆంగ్లం కోసం 5. స్వరాలు సహజ ప్రసంగం యొక్క రికార్డింగ్‌ల ఆధారంగా రూపొందించబడ్డాయి. సెట్టింగ్‌లలో మీరు వేగం, పిచ్ మరియు వాల్యూమ్‌ను మార్చవచ్చు. టెంపోను మార్చడానికి సోనిక్ లైబ్రరీని ఉపయోగించవచ్చు. ఇన్‌పుట్ టెక్స్ట్ యొక్క విశ్లేషణ ఆధారంగా భాషలను స్వయంచాలకంగా గుర్తించడం మరియు మార్చడం సాధ్యమవుతుంది (ఉదాహరణకు, మరొక భాషలోని పదాలు మరియు కోట్‌ల కోసం, ఆ భాషకు చెందిన సింథసిస్ మోడల్‌ను ఉపయోగించవచ్చు). వాయిస్ ప్రొఫైల్‌లకు మద్దతు ఉంది, వివిధ భాషల కోసం వాయిస్‌ల కలయికలను నిర్వచిస్తుంది.

మూలం: opennet.ru

ఒక వ్యాఖ్యను జోడించండి