Невронските мрежи го доведоа квалитетот на синтезата на рускиот говор на ново ниво

Групата компании за МРЦ, дел од екосистемот на Сбербанк, најави развој на напредна платформа за синтеза на говор, за која се вели дека обезбедува непречено и експресивно читање на секој текст.

Презентираното решение е трета генерација на системот за синтеза на говор. Висококвалитетните аудио сигнали се генерираат со сложени модели на невронски мрежи. Програмерите тврдат дека резултатот од овие алгоритми е најреалната синтеза на говорот на руски јазик.

Невронските мрежи го доведоа квалитетот на синтезата на рускиот говор на ново ниво

Платформата вклучува модул за предвидување на стрес со зборови кои сè уште не се во основниот речник. Дополнително, обезбедена е автоматска корекција на вообичаените правописни грешки. Благодарение на длабоката лингвистичка анализа на текстот, изговорот ќе одговара на нормите на јазикот дури и во тешки случаи.

Друга предност на платформата е тоа што не бара скапи сервери опремени со акцелератори на графичкиот процесор. Технологијата можете да ја користите на два начина: преку облак услуга или со нејзино интегрирање во сопственото решение.


Невронските мрежи го доведоа квалитетот на синтезата на рускиот говор на ново ниво

Меѓу можните области на примена на развојот се чет-ботови и гласовни асистенти, услуги за информации и известувања, говорни услуги со инстант синтеза на кој било текст за време на повик итн.

„Во автоматизирани сценарија на комуникација со клиентите, технологијата ви овозможува да комуницирате поединечно со секој претплатник, бидејќи нема фиксни пораки, а секој текст може да се синтетизира за време на повикот“, велат програмерите.

Можете да ја испробате технологијата тука



Извор: 3dnews.ru

Додадете коментар