Групата от компании MDG, част от екосистемата на Sberbank, обяви разработването на усъвършенствана платформа за синтез на реч, за която се твърди, че осигурява гладко и изразително четене на всеки текст.
Представеното решение е трето поколение на системата за синтез на реч. Висококачествените аудио сигнали се генерират от сложни модели на невронни мрежи. Разработчиците твърдят, че резултатът от тези алгоритми е най-реалистичният синтез на рускоезична реч.
Платформата включва модул за прогнозиране на ударение в думи, които все още не са в базовия речник. Освен това е осигурена автоматична корекция на често срещаните правописни грешки. Благодарение на дълбокия лингвистичен анализ на текста, произношението ще съответства на нормите на езика дори в трудни случаи.
Друго предимство на платформата е, че не изисква скъпи сървъри, оборудвани с GPU ускорители. Можете да използвате технологията по два начина: чрез облачна услуга или като я интегрирате във вашето собствено решение.
Сред възможните области на приложение на разработката са чатботове и гласови асистенти, информационни и уведомителни услуги, гласови услуги с незабавен синтез на произволен текст по време на разговор и др.
„При автоматизирани сценарии на комуникация с клиенти технологията ви позволява да взаимодействате индивидуално с всеки абонат, тъй като няма фиксирани съобщения и всеки текст може да бъде синтезиран по време на разговора“, казват разработчиците.
Можете да опитате технологията
Източник: 3dnews.ru