谷歌的开发人员提出了一个新项目,他们创建了一种能够将口语句子从一种语言翻译成另一种语言的技术。 新翻译器 Translatotron 与其类似产品之间的主要区别在于,它仅使用声音,而不使用中间文本。 这种方法可以显着加快翻译的工作速度。 另一个值得注意的点是该系统相当准确地模仿了扬声器的频率和音调。
Translatotron 的诞生得益于数年的持续努力。 谷歌的研究人员长期以来一直在考虑直接语音转换的可能性,但直到最近他们还无法实施他们的计划。
当今使用的同声翻译系统通常根据相同的算法工作。 在初始阶段,将原始语音转换为文本。 然后,一种语言的文本将转换为另一种语言的文本。 此后,生成的文本将转换为所需语言的语音。 这种方法效果很好,但也并非没有缺点。 在每个阶段,可能会出现相互重叠的错误,从而导致翻译质量下降。
为了达到预期的结果,研究人员研究了声谱图。 他们试图将一种语言的声谱图变成另一种语言的声谱图,跳过将音频转换为文本的步骤。
值得注意的是,尽管这种转换很复杂,但语音处理是一步完成的,而不是像之前的情况那样分三步进行。 Translatotron 拥有足够的计算能力,可以更快地进行同声翻译。 另一个重要的一点是,这种方法可以让您保留原始声音的特征和语调。
现阶段,Translatotron 还无法拥有与标准系统相同的高翻译精度。 尽管如此,研究人员表示,大多数翻译的质量都足够。 未来,Translatotron 的工作将继续进行,因为研究人员打算让同步语音翻译变得更好。
来源: 3dnews.ru