As redes neurais levaram a qualidade da síntese da fala russa a um novo nível

O grupo de empresas MDG, parte do ecossistema Sberbank, anunciou o desenvolvimento de uma plataforma avançada de síntese de fala, que garante uma leitura suave e expressiva de qualquer texto.

A solução apresentada é a terceira geração do sistema de síntese de voz. Sinais de áudio de alta qualidade são gerados por modelos complexos de redes neurais. Os desenvolvedores afirmam que o resultado desses algoritmos é a síntese mais realista da fala em russo.

As redes neurais levaram a qualidade da síntese da fala russa a um novo nível

A plataforma inclui um módulo para previsão de acento em palavras que ainda não constam do dicionário base. Além disso, é fornecida correção automática de erros ortográficos comuns. Graças à profunda análise linguística do texto, a pronúncia corresponderá às normas da língua mesmo em casos difíceis.

Outra vantagem da plataforma é que ela não requer servidores caros equipados com aceleradores GPU. Você pode usar a tecnologia de duas maneiras: por meio de um serviço em nuvem ou integrando-a à sua própria solução.


As redes neurais levaram a qualidade da síntese da fala russa a um novo nível

Entre as possíveis áreas de aplicação do desenvolvimento estão chatbots e assistentes de voz, serviços de informação e notificação, serviços de voz com síntese instantânea de qualquer texto durante uma chamada, etc.

“Em cenários automatizados de comunicação com clientes, a tecnologia permite interagir individualmente com cada assinante, já que não há mensagens fixas e qualquer texto pode ser sintetizado durante a ligação”, afirmam os desenvolvedores.

Você pode experimentar a tecnologia aqui



Fonte: 3dnews.ru

Adicionar um comentário