Lyra 1.3 オープンオーディオコーデックのアップデート

Google は、限られた量の送信情報条件で高品質の音声送信を実現することを目的とした Lyra 1.3 オーディオ コーデックのリリースを公開しました。 Lyra コーデックを使用する場合の 3.2 kbps、6 kbps、および 9.2 kbps のビットレートでの音声品質は、Opus コーデックを使用する場合の 10 kbps、13 kbps、および 14 kbps のビットレートとほぼ同等です。 この問題を解決するために、Lyra は従来の音声圧縮と信号変換の方法に加えて、機械学習システムに基づく音声モデルを使用します。これにより、典型的な音声の特徴に基づいて欠落した情報を再作成できます。 リファレンス コードの実装は C++ で書かれており、Apache 2.0 ライセンスに基づいて配布されます。

1.2月に提案され、新しいニューラルネットワークアーキテクチャに変換された大幅に再設計されたLyra 1.3リリースとは異なり、バージョン32ではアーキテクチャを変更せずに機械学習モデルが最適化されています。 新しいバージョンでは、8 ビット浮動小数点数の代わりに 43 ビット整数を使用して重みを保存し、算術演算を実行します。その結果、Pixel 20 Pro スマートフォンでのテスト時にモデル サイズが 6% 削減され、速度が XNUMX% 向上しました。 音声品質は同じレベルに維持されましたが、送信データの形式が変更され、以前のリリースと互換性がなくなりました。

出所: オープンネット.ru

コメントを追加します