Սբերբանկի էկոհամակարգի մաս կազմող ՀԶՆ ընկերությունների խումբը հայտարարեց խոսքի սինթեզի առաջադեմ հարթակի մշակման մասին, որը, ինչպես ասվում է, ապահովում է ցանկացած տեքստի սահուն և արտահայտիչ ընթերցում:
Ներկայացված լուծումը խոսքի սինթեզի համակարգի երրորդ սերունդն է։ Բարձրորակ աուդիո ազդանշանները ստեղծվում են նեյրոնային ցանցի բարդ մոդելների միջոցով: Մշակողները պնդում են, որ այս ալգորիթմների արդյունքը ռուսալեզու խոսքի ամենաիրատեսական սինթեզն է։
Պլատֆորմը ներառում է սթրեսը կանխատեսելու մոդուլ բառերով, որոնք դեռևս չկան հիմնական բառարանում։ Բացի այդ, տրամադրվում է ընդհանուր ուղղագրական սխալների ավտոմատ ուղղում: Տեքստի խորը լեզվաբանական վերլուծության շնորհիվ նույնիսկ դժվարին դեպքերում արտասանությունը կհամապատասխանի լեզվի նորմերին։
Հարթակի մեկ այլ առավելությունն այն է, որ այն չի պահանջում թանկարժեք սերվերներ՝ հագեցած GPU արագացուցիչներով։ Դուք կարող եք օգտագործել տեխնոլոգիան երկու եղանակով՝ ամպային ծառայության միջոցով կամ այն ինտեգրելով ձեր սեփական լուծմանը:
Մշակման կիրառման հնարավոր ոլորտներից են չաթ-բոտերը և ձայնային օգնականները, տեղեկատվության և ծանուցման ծառայությունները, ձայնային ծառայությունները զանգի ընթացքում ցանկացած տեքստի ակնթարթային սինթեզով և այլն։
«Հաճախորդների հետ շփման ավտոմատացված սցենարներում տեխնոլոգիան թույլ է տալիս անհատապես շփվել յուրաքանչյուր բաժանորդի հետ, քանի որ չկան ֆիքսված հաղորդագրություններ, և զանգի ընթացքում կարելի է սինթեզել ցանկացած տեքստ», - ասում են մշակողները:
Դուք կարող եք փորձել տեխնոլոգիան
Source: 3dnews.ru