谷歌已經開放了 Lyra 音訊編解碼器缺少的源代碼

Google 發布了 Lyra 0.0.2 音訊編解碼器的更新,該編解碼器經過最佳化,可在使用非常慢的通訊通道時實現最佳語音品質。 該編解碼器於四月初開放,但與專有的數學庫一起提供。 在 0.0.2 版本中,這個缺點已經被消除,並且為指定的庫創建了一個開放的替代品——sparse_matmul,它與編解碼器本身一樣,是在 Apache 2.0 許可證下分發的。 其他改進包括將 Bazel 建置系統與 GCC 編譯器結合使用的能力,以及在 Linux 中預設使用此捆綁包而不是 Bazel+Clang。

讓我們回想一下,就低速傳輸語音資料的品質而言,Lyra 明顯優於使用數位訊號處理方法的傳統編解碼器。 為了在傳輸資訊量有限的情況下實現高品質的語音傳輸,除了傳統的音訊壓縮和訊號轉換方法外,Lyra還採用了基於機器學習系統的語音模型,可讓您根據資訊重新建立遺失的資訊。典型的言語特徵。 用於生成聲音的模型是使用 70 多種語言的數千小時錄音進行訓練的。 所提出的實現的性能足以滿足中價智慧型手機上的即時語音編碼和解碼,訊號傳輸延遲為 90 毫秒。

來源: opennet.ru

添加評論