Google Translatotron é unha tecnoloxía de tradución de voz simultánea que imita a voz do usuario

Os desenvolvedores de Google presentaron un novo proxecto no que crearon unha tecnoloxía capaz de traducir frases faladas dunha lingua a outra. A principal diferenza entre o novo tradutor, chamado Translatotron, e os seus análogos é que funciona exclusivamente con son, sen utilizar texto intermedio. Este enfoque permitiu acelerar significativamente o traballo do tradutor. Outro punto a destacar é que o sistema imita con bastante precisión a frecuencia e o ton do altofalante.

Translatotron creouse grazas a un traballo continuo que levou varios anos. Os investigadores de Google estiveron considerando a posibilidade dunha conversión directa de voz durante moito tempo, pero ata hai pouco non puideron implementar os seus plans.

Google Translatotron é unha tecnoloxía de tradución de voz simultánea que imita a voz do usuario

Os sistemas de tradución simultánea empregados na actualidade funcionan con máis frecuencia segundo o mesmo algoritmo. Na fase inicial, o discurso orixinal transfórmase en texto. Despois, o texto nunha lingua transfórmase en texto na outra lingua. Despois diso, o texto resultante convértese en voz no idioma desexado. Este método funciona ben, pero non está exento de inconvenientes. En cada fase poden producirse erros que se solapan entre si e provocan unha diminución da calidade da tradución.

Para conseguir o resultado desexado, os investigadores estudaron espectrogramas de son. Intentaron facer que un espectrograma nun idioma se convertese nun espectrograma noutro idioma, saltándose os pasos de conversión de audio en texto.


Google Translatotron é unha tecnoloxía de tradución de voz simultánea que imita a voz do usuario

Cómpre sinalar que a pesar da complexidade de tal transformación, o procesamento da fala ocorre nun paso, e non en tres, como era o caso antes. Tendo á súa disposición unha cantidade suficiente de potencia de cálculo, Translatotron realizará a tradución simultánea moito máis rápido. Outro punto importante é que este enfoque permítelle preservar as características e a entoación da voz orixinal.

Neste momento, Translatotron non pode presumir da mesma alta precisión de tradución que os sistemas estándar. A pesar diso, os investigadores aseguran que a maioría das traducións realizadas son de calidade suficiente. No futuro, o traballo en Translatotron continuará, xa que os investigadores pretenden mellorar a tradución simultánea de voz.



Fonte: 3dnews.ru

Engadir un comentario