Lyra 1.3 開放式音訊編解碼器更新

谷歌發布了Lyra 1.3音訊編解碼器,旨在在傳輸資訊量有限的情況下實現高品質的語音傳輸。 使用 Lyra 編解碼器時,位元速率為 3.2 kbps、6 kbps 和 9.2 kbps 時的語音品質大約相當於使用 Opus 編解碼器時位元速率為 10 kbps、13 kbps 和 14 kbps 時的語音品質。 為了解決這個問題,除了傳統的音訊壓縮和訊號轉換方法之外,Lyra還使用了基於機器學習系統的語音模型,它允許您根據典型的語音特徵重新建立遺失的資訊。 參考程式碼實作是用 C++ 編寫的,並根據 Apache 2.0 許可證分發。

與 1.2 月提出的徹底重新設計的 Lyra 1.3 版本(轉換為新的神經網路架構)不同,32 版本優化了機器學習模型,而沒有更改架構。 新版本使用 8 位元整數而不是 43 位元浮點數來儲存權重並執行算術運算,在 Pixel 20 Pro 智慧型手機上進行測試時,模型大小減少了 6%,速度提高了 XNUMX%。 語音品質保持在相同水平,但傳輸資料的格式發生了變化,並且與先前的版本不相容。

來源: opennet.ru

添加評論