Google Translatotron 是一種模仿用戶聲音的同步語音翻譯技術

谷歌的開發人員提出了一個新項目,他們創建了一種能夠將口語句子從一種語言翻譯成另一種語言的技術。 這款名為 Translatotron 的新翻譯器與其類似產品之間的主要區別在於,它僅使用聲音,而不使用中間文字。 這種方法可以顯著加快翻譯的工作速度。 另一個值得注意的點是該系統相當準確地模仿了揚聲器的頻率和音調。

Translatotron 的誕生得益於數年的持​​續努力。 谷歌的研究人員長期以來一直在考慮直接語音轉換的可能性,但直到最近他們還無法實施他們的計劃。

Google Translatotron 是一種模仿用戶聲音的同步語音翻譯技術

當今使用的同聲翻譯系統通常根據相同的演算法工作。 在初始階段,將原始語音轉換為文字。 然後,一種語言的文字將轉換為另一種語言的文字。 此後,生成的文字將轉換為所需語言的語音。 這種方法效果很好,但並非沒有缺點。 在每個階段,可能會出現相互重疊的錯誤,從而導致翻譯品質下降。

為了達到預期的結果,研究人員研究了聲譜圖。 他們試圖將一種語言的聲譜圖變成另一種語言的聲譜圖,並跳過將音訊轉換為文字的步驟。


Google Translatotron 是一種模仿用戶聲音的同步語音翻譯技術

值得注意的是,儘管這種轉換很複雜,但語音處理是一步完成的,而不是像之前的情況那樣分三步驟進行。 Translatotron 擁有足夠的運算能力,可以更快地進行同聲翻譯。 另一個重要的一點是,這種方法可以讓您保留原始聲音的特徵和語調。

現階段,Translatotron 還無法擁有與標準系統相同的高翻譯精度。 儘管如此,研究人員表示,大多數翻譯的品質都足夠。 未來,Translatotron 的工作將繼續進行,因為研究人員打算讓同步語音翻譯變得更好。



來源: 3dnews.ru

添加評論