Googleは、Lyraオーディオコーデックの不足しているソースを公開しました

Google は、非常に遅い通信チャネルを使用する場合に最大の音声品質を達成するように最適化された Lyra 0.0.2 オーディオ コーデックのアップデートを公開しました。このコーデックは 0.0.2 月初旬に公開されましたが、独自の数学ライブラリと組み合わせて提供されました。バージョン 2.0 では、この欠点が解消され、指定されたライブラリ - sparse_matmul に対してオープンな代替物が作成されました。これは、コーデック自体と同様に、Apache XNUMX ライセンスの下で配布されます。その他の改善点には、GCC コンパイラーで Bazel ビルド システムを使用できる機能や、Linux で Bazel+Clang の代わりにデフォルトでこのバンドルが使用される機能などが含まれます。

低速で送信される音声データの品質の点で、Lyra はデジタル信号処理方式を使用する従来のコーデックよりも大幅に優れていることを思い出してください。 Lyra では、限られた情報量で高品質な音声伝送を実現するため、従来の音声圧縮や信号変換に加え、機械学習システムに基づいた音声モデルを採用し、欠落した情報を再現します。典型的な音声の特徴。サウンドの生成に使用されるモデルは、70 以上の言語で数千時間に及ぶ音声録音を使用してトレーニングされました。提案された実装のパフォーマンスは、信号伝送遅延が 90 ミリ秒で、中価格帯のスマートフォンでのリアルタイム音声エンコードおよびデコードには十分です。

出所: オープンネット.ru

コメントを追加します