Nevrale nettverk har brakt kvaliteten på russisk talesyntese til et nytt nivå

MDG-gruppen av selskaper, en del av Sberbank-økosystemet, kunngjorde utviklingen av en avansert talesynteseplattform, som sies å sikre jevn og uttrykksfull lesing av enhver tekst.

Den presenterte løsningen er tredje generasjon av talesyntesesystemet. Lydsignaler av høy kvalitet genereres av komplekse nevrale nettverksmodeller. Utviklerne hevder at resultatet av disse algoritmene er den mest realistiske syntesen av russiskspråklig tale.

Nevrale nettverk har brakt kvaliteten på russisk talesyntese til et nytt nivå

Plattformen inkluderer en modul for å forutsi stress i ord som ennå ikke er i basisordboken. I tillegg er det gitt automatisk retting av vanlige stavefeil. Takket være dyp språklig analyse av teksten, vil uttalen samsvare med språkets normer selv i vanskelige tilfeller.

En annen fordel med plattformen er at den ikke krever dyre servere utstyrt med GPU-akseleratorer. Du kan bruke teknologien på to måter: gjennom en skytjeneste eller ved å integrere den i din egen løsning.


Nevrale nettverk har brakt kvaliteten på russisk talesyntese til et nytt nivå

Blant de mulige bruksområdene for utviklingen er chatbots og taleassistenter, informasjons- og varslingstjenester, taletjenester med umiddelbar syntese av hvilken som helst tekst under en samtale, etc.

"I automatiserte scenarier for kommunikasjon med klienter lar teknologien deg samhandle individuelt med hver abonnent, siden det ikke er noen faste meldinger, og hvilken som helst tekst kan syntetiseres under samtalen," sier utviklerne.

Du kan prøve teknologien her



Kilde: 3dnews.ru

Legg til en kommentar