Доступний аудіокодек Opus 1.5

Після майже року розробки організація Xiph.Org, що займається розробкою вільних відео- та аудіокодеків, представила реліз аудіокодека Opus 1.5, що забезпечує високу якість кодування та мінімальну затримку як при стисканні потокового звуку з високим бітрейтом, так і при стисканні голосу в обмежених пропускній здатності. VoIP-телефонії. Еталонні реалізації кодувальника та декодувальника поширюються під ліцензією BSD. Повні специфікації формату Opus загальнодоступні, безкоштовні та затверджені як інтернет-стандарт (RFC 6716).

Кодек створений шляхом комбінації найкращих технологій із розробленого організацією Xiph.org кодека CELT та відкритого компанією Skype кодеку SILK. Окрім Skype та Xiph.Org у розробці Opus також взяли участь такі компанії, як Mozilla, Octasic, Broadcom та Google. Задіяні в Opus патенти надані компаніями, що брали участь у розробці, для необмеженого користування без виплати ліцензійних відрахувань. Всі пов'язані з Opus інтелектуальні права та ліцензії на патенти автоматично делегуються для програм, що використовують Opus, та продуктів, без необхідності додаткового узгодження. Відсутні обмеження на сферу застосування та створення альтернативних сторонніх реалізацій. При цьому всі надані права відкликаються у випадку розв'язання патентного розгляду технології Opus проти будь-якого користувача Opus.

Opus відрізняється високою якістю кодування та мінімальною затримкою як при стисканні потокового звуку з високим бітрейтом, так і при стисканні голосу в обмежених за пропускною здатністю додатках VoIP-телефонії. Раніше Opus був визнаний найкращим кодеком при використанні бітрейту 64Kbit (Opus випередив таких конкурентів, як Apple HE-AAC, Nero HE-AAC, Vorbis та AAC LC). З продуктів, що підтримують Opus із коробки, можна відзначити браузер Firefox, фреймворк GStreamer та пакет FFmpeg.

Основні можливості Opus:

  • Бітрейт від 5 до 510 Кбіт/с;
  • Частота дискретизації від 8 до 48 КГц;
  • Тривалість кадрів від 2.5 до 120 мілісекунд;
  • Підтримка постійного (CBR) та змінного (VBR) бітрейтів;
  • Підтримка вузькосмугового та широкосмугового звуку;
  • Підтримка голосу та музики;
  • Підтримка стерео та моно;
  • Підтримка динамічного налаштування бітрейту, пропускної спроможності та розміру кадру;
  • Можливість відновлення звукового потоку у разі втрати кадрів (PLC);
  • Підтримка до 255 каналів (багатопотокові кадри)
  • Доступність реалізацій з використанням арифметики з плаваючою та фіксованою комою.

Ключові нововведення Opus 1.5:

  • У кодувальнику та декодувальнику розширено застосування технологій машинного навчання.
  • Реалізовано механізм "Deep Redundancy" (DRED), що використовує машинне навчання для відновлення фрагментів звуку, втрачених через втрату пакетів.
  • Покращено відновлення звукового потоку у разі втрати кадрів за допомогою механізму машинного навчання Deep PLC (Packet Loss Concealment).
  • Поліпшено якість передачі промови на низьких бітрейтах (~ 6 Кбіт/с).
  • Додано додаткові оптимізації, що використовують набори інструкцій AVX2 (x86) та Neon (ARM).
  • Додана підтримка формату об'ємного звучання Ambisonics 4-го та 5-го порядку, що враховує поширення звуку не тільки у горизонтальній площині, а й у вертикальній (для визначення зверху чи знизу джерело звуку).

За гарячими слідами сформовано випуск Opus 1.5.1, у якому усунуто проблеми зі складанням з використанням складальної системи Meson (складання з використанням CMake проблема не торкнулася).

Джерело: opennet.ru

Додати коментар або відгук