O Google Translatotron é uma tecnologia de tradução de fala simultânea que imita a voz do usuário

Desenvolvedores do Google apresentaram um novo projeto no qual criaram uma tecnologia capaz de traduzir frases faladas de um idioma para outro. A principal diferença entre o novo tradutor, denominado Translatotron, e seus análogos é que ele trabalha exclusivamente com som, sem utilizar texto intermediário. Esta abordagem permitiu agilizar significativamente o trabalho do tradutor. Outro ponto digno de nota é que o sistema imita com bastante precisão a frequência e o tom do alto-falante.

O Translatotron foi criado graças a um trabalho contínuo que durou vários anos. Os pesquisadores do Google vêm considerando a possibilidade de conversão direta de fala há muito tempo, mas até recentemente não conseguiram implementar seus planos.

O Google Translatotron é uma tecnologia de tradução de fala simultânea que imita a voz do usuário

Os sistemas de tradução simultânea usados ​​hoje geralmente funcionam de acordo com o mesmo algoritmo. Na fase inicial, o discurso original é transformado em texto. O texto em um idioma é então transformado em texto no outro idioma. Depois disso, o texto resultante é convertido em fala no idioma desejado. Este método funciona bem, mas tem suas desvantagens. Em cada etapa podem ocorrer erros que se sobrepõem e levam à diminuição da qualidade da tradução.

Para alcançar o resultado desejado, os pesquisadores estudaram espectrogramas sonoros. Eles tentaram fazer com que um espectrograma em um idioma se transformasse em um espectrograma em outro idioma, pulando as etapas de conversão de áudio em texto.


O Google Translatotron é uma tecnologia de tradução de fala simultânea que imita a voz do usuário

Vale ressaltar que apesar da complexidade de tal transformação, o processamento da fala ocorre em uma etapa, e não em três, como acontecia antes. Tendo à sua disposição poder computacional suficiente, o Translatotron realizará a tradução simultânea com muito mais rapidez. Outro ponto importante é que esta abordagem permite preservar as características e a entonação da voz original.

Nesta fase, o Translatotron não pode ostentar a mesma alta precisão de tradução que os sistemas padrão. Apesar disso, os pesquisadores afirmam que a maior parte das traduções realizadas tem qualidade suficiente. No futuro, o trabalho no Translatotron continuará, pois os pesquisadores pretendem melhorar a tradução simultânea de fala.



Fonte: 3dnews.ru

Adicionar um comentário