Opus 1.5 音頻編解碼器可用

經過近一年的開發,致力於開發免費視訊和音訊編解碼器的組織 Xiph.Org 發布了 Opus 1.5 音訊編解碼器,為高位元率串流音訊提供高品質的編碼和最小的延遲頻寬受限應用中的壓縮和語音壓縮VoIP 電話。編碼器和解碼器參考實作已根據 BSD 授權獲得許可。 Opus 格式的完整規範是公開的、免費的,並被批准為網路標準 (RFC 6716)。

該編解碼器結合了 Xiph.org 的 CELT 編解碼器和 Skype 的開源 SILK 編解碼器的最佳技術而創建。 除了Skype和Xiph.Org之外,Mozilla、Octasic、Broadcom和Google等公司也參與了Opus的開發。 Opus所涉及的專利由參與開發的公司授予無限制使用,無需支付專利費。 所有與 Opus 相關的知識產權和專利許可都會自動委託給使用 Opus 的應用程序和產品,無需額外批准。 替代第三方實現的範圍和創建沒有限制。 然而,如果針對 Opus 的任何用戶提起影響 Opus 技術的專利訴訟,則所有授予的權利將被撤銷。

Opus 具有高編碼質量和最小延遲,適用於帶寬受限的 VoIP 電話應用的高比特率流音頻壓縮和語音壓縮。 此前,Opus 被評為 64Kbit 最佳編解碼器(Opus 的表現優於 Apple HE-AAC、Nero HE-AAC、Vorbis 和 AAC LC 等競爭對手)。 開箱即用支持 Opus 的產品包括 Firefox 瀏覽器、GStreamer 框架和 FFmpeg 包。

作品的主要特點:

  • 比特率從 5 到 510 Kbit/s;
  • 採樣頻率8至48KHz;
  • 幀持續時間從 2.5 到 120 毫秒;
  • 支持恆定(CBR)和可變(VBR)比特率;
  • 支持窄帶和寬帶音頻;
  • 語音和音樂支持;
  • 立體聲和單聲道支持;
  • 支持碼率、帶寬、幀大小動態設置;
  • 能夠在幀丟失的情況下恢復音頻流(PLC);
  • 支持最多255個通道(多流幀)
  • 使用浮點和定點算術實現的可用性。

Opus 1.5 的主要創新:

  • 編碼器和解碼器擴展了機器學習技術的使用。
  • 實現了深度冗餘(DRED)機制,利用機器學習來恢復因資料包遺失而遺失的音訊片段。
  • 使用 Deep PLC(丟包隱藏)機器學習引擎改進了在丟幀情況下音訊串流的恢復。
  • 提高了低位元率 (~ 6 Kbps) 下的語音品質。
  • 使用 AVX2 (x86) 和 Neon (ARM) 指令集新增了額外的最佳化。
  • 增加了對 4 階和 5 階 Ambisonics 環繞聲格式的支持,該格式不僅考慮水平面的聲音傳播,還考慮垂直面的聲音傳播(以確定來自上方或下方的聲源)。

緊接著,Opus 1.5.1 發布了,它解決了使用 Meson 建置系統進行建置的問題(使用 CMake 進行的建置不受該問題的影響)。

來源: opennet.ru

添加評論