Невронните мрежи изведоха качеството на синтеза на руска реч на ново ниво

Групата от компании MDG, част от екосистемата на Sberbank, обяви разработването на усъвършенствана платформа за синтез на реч, за която се твърди, че осигурява гладко и изразително четене на всеки текст.

Представеното решение е трето поколение на системата за синтез на реч. Висококачествените аудио сигнали се генерират от сложни модели на невронни мрежи. Разработчиците твърдят, че резултатът от тези алгоритми е най-реалистичният синтез на рускоезична реч.

Невронните мрежи изведоха качеството на синтеза на руска реч на ново ниво

Платформата включва модул за прогнозиране на ударение в думи, които все още не са в базовия речник. Освен това е осигурена автоматична корекция на често срещаните правописни грешки. Благодарение на дълбокия лингвистичен анализ на текста, произношението ще съответства на нормите на езика дори в трудни случаи.

Друго предимство на платформата е, че не изисква скъпи сървъри, оборудвани с GPU ускорители. Можете да използвате технологията по два начина: чрез облачна услуга или като я интегрирате във вашето собствено решение.


Невронните мрежи изведоха качеството на синтеза на руска реч на ново ниво

Сред възможните области на приложение на разработката са чатботове и гласови асистенти, информационни и уведомителни услуги, гласови услуги с незабавен синтез на произволен текст по време на разговор и др.

„При автоматизирани сценарии на комуникация с клиенти технологията ви позволява да взаимодействате индивидуално с всеки абонат, тъй като няма фиксирани съобщения и всеки текст може да бъде синтезиран по време на разговора“, казват разработчиците.

Можете да опитате технологията тук



Източник: 3dnews.ru

Добавяне на нов коментар