Dostępny kodek audio Opus 1.5

После почти года разработки организация Xiph.Org, занимающаяся разработкой свободных видео- и аудиокодеков, представила релиз аудиокодека Opus 1.5, обеспечивающего высокое качество кодирования и минимальную задержку как при сжатии потокового звука с высоким битрейтом, так и при сжатии голоса в ограниченных по пропускной способности приложениях VoIP-телефонии. Эталонные реализации кодировщика и декодировщика распространяются под лицензией BSD. Полные спецификации формата Opus общедоступны, бесплатны и утверждены в качестве интернет-стандарта (RFC 6716).

Kodek jest tworzony przez połączenie najlepszych technologii z kodeka CELT firmy Xiph.org i kodeka open source SILK firmy Skype. Oprócz Skype i Xiph.Org w rozwoju Opus brały udział również takie firmy jak Mozilla, Octasic, Broadcom i Google. Patenty związane z Opus są przyznawane przez firmy zaangażowane w rozwój do nieograniczonego użytku bez uiszczania opłat licencyjnych. Wszystkie prawa własności intelektualnej i licencje patentowe związane z Opus są automatycznie przekazywane do aplikacji i produktów korzystających z Opus, bez potrzeby dodatkowego zatwierdzenia. Nie ma ograniczeń co do zakresu i tworzenia alternatywnych wdrożeń firm trzecich. Jednak wszystkie przyznane prawa zostają cofnięte w przypadku postępowania patentowego dotyczącego technologii Opus przeciwko jakiemukolwiek użytkownikowi Opus.

Opus charakteryzuje się wysoką jakością kodowania i minimalnym opóźnieniem zarówno w przypadku kompresji strumieniowego dźwięku o dużej przepływności, jak i kompresji głosu w aplikacjach telefonii VoIP o ograniczonej przepustowości. Wcześniej Opus został wybrany najlepszym kodekiem przy 64Kbit (Opus pokonał konkurentów, takich jak Apple HE-AAC, Nero HE-AAC, Vorbis i AAC LC). Produkty obsługujące Opus po wyjęciu z pudełka obejmują przeglądarkę Firefox, platformę GStreamer i pakiet FFmpeg.

Główne cechy Opusa:

  • Szybkość transmisji od 5 do 510 Kbit/s;
  • Częstotliwość próbkowania od 8 do 48 KHz;
  • Czas trwania ramki od 2.5 do 120 milisekund;
  • Obsługa stałych (CBR) i zmiennych (VBR) przepływności;
  • Obsługa dźwięku wąskopasmowego i szerokopasmowego;
  • Wsparcie głosowe i muzyczne;
  • Obsługa stereo i mono;
  • Obsługa dynamicznego ustawiania szybkości transmisji bitów, przepustowości i rozmiaru ramki;
  • Możliwość przywrócenia strumienia audio w przypadku utraty ramki (PLC);
  • Obsługa do 255 kanałów (ramki wielostrumieniowe)
  • Dostępność implementacji wykorzystujących arytmetykę zmiennoprzecinkową i stałoprzecinkową.

Kluczowe innowacje w Opus 1.5:

  • В кодировщике и декодировщике расширено применение технологий машинного обучения.
  • Реализован механизм «Deep Redundancy» (DRED), использующий машинное обучение для восстановления фрагментов звука, утраченных из-за потери пакетов.
  • Улучшено восстановление звукового потока в случае потери кадров при помощи механизма машинного обучения Deep PLC (Packet Loss Concealment).
  • Улучшено качество передачи речи на низких битрейтах (~ 6 Кбит/с).
  • Добавлены дополнительные оптимизации, использующие наборы инструкций AVX2 (x86) и Neon (ARM).
  • Добавлена поддержка формата объёмного звучания Ambisonics 4-го и 5-го порядка, учитывающего распространение звука не только в горизонтальной плоскости, но и в вертикальной (для определения сверху или снизу источник звука).

По горячим следам сформирован выпуск Opus 1.5.1, в котором устранены проблемы со сборкой с использованием сборочной системы Meson (сборку с использованием CMake проблема не затронула).

Źródło: opennet.ru

Dodaj komentarz