O grupo de empresas MDG, parte do ecossistema Sberbank, anunciou o desenvolvimento de uma plataforma avançada de síntese de fala, que garante uma leitura suave e expressiva de qualquer texto.
A solução apresentada é a terceira geração do sistema de síntese de voz. Sinais de áudio de alta qualidade são gerados por modelos complexos de redes neurais. Os desenvolvedores afirmam que o resultado desses algoritmos é a síntese mais realista da fala em russo.
A plataforma inclui um módulo para previsão de acento em palavras que ainda não constam do dicionário base. Além disso, é fornecida correção automática de erros ortográficos comuns. Graças à profunda análise linguística do texto, a pronúncia corresponderá às normas da língua mesmo em casos difíceis.
Outra vantagem da plataforma é que ela não requer servidores caros equipados com aceleradores GPU. Você pode usar a tecnologia de duas maneiras: por meio de um serviço em nuvem ou integrando-a à sua própria solução.
Entre as possíveis áreas de aplicação do desenvolvimento estão chatbots e assistentes de voz, serviços de informação e notificação, serviços de voz com síntese instantânea de qualquer texto durante uma chamada, etc.
“Em cenários automatizados de comunicação com clientes, a tecnologia permite interagir individualmente com cada assinante, já que não há mensagens fixas e qualquer texto pode ser sintetizado durante a ligação”, afirmam os desenvolvedores.
Você pode experimentar a tecnologia
Fonte: 3dnews.ru