Dostępny kodek audio Opus 1.5

Po prawie roku rozwoju Xiph.Org, organizacja, która rozwija darmowe kodeki wideo i audio, wydała Opus 1.5, kodek audio, który zapewnia wysokiej jakości kodowanie i minimalne opóźnienie zarówno dla strumieniowego przesyłania dźwięku o wysokiej przepływności, jak i kompresji głosu w aplikacjach telefonii VoIP o ograniczonej przepustowości. Referencyjne implementacje kodera i dekodera są dystrybuowane na licencji BSD. Pełne specyfikacje formatu Opus są publicznie dostępne, bezpłatne i zatwierdzone jako standard internetowy (RFC 6716).

Kodek jest tworzony przez połączenie najlepszych technologii z kodeka CELT firmy Xiph.org i kodeka open source SILK firmy Skype. Oprócz Skype i Xiph.Org w rozwoju Opus brały udział również takie firmy jak Mozilla, Octasic, Broadcom i Google. Patenty związane z Opus są przyznawane przez firmy zaangażowane w rozwój do nieograniczonego użytku bez uiszczania opłat licencyjnych. Wszystkie prawa własności intelektualnej i licencje patentowe związane z Opus są automatycznie przekazywane do aplikacji i produktów korzystających z Opus, bez potrzeby dodatkowego zatwierdzenia. Nie ma ograniczeń co do zakresu i tworzenia alternatywnych wdrożeń firm trzecich. Jednak wszystkie przyznane prawa zostają cofnięte w przypadku postępowania patentowego dotyczącego technologii Opus przeciwko jakiemukolwiek użytkownikowi Opus.

Opus charakteryzuje się wysoką jakością kodowania i minimalnym opóźnieniem zarówno w przypadku kompresji strumieniowego dźwięku o dużej przepływności, jak i kompresji głosu w aplikacjach telefonii VoIP o ograniczonej przepustowości. Wcześniej Opus został wybrany najlepszym kodekiem przy 64Kbit (Opus pokonał konkurentów, takich jak Apple HE-AAC, Nero HE-AAC, Vorbis i AAC LC). Produkty obsługujące Opus po wyjęciu z pudełka obejmują przeglądarkę Firefox, platformę GStreamer i pakiet FFmpeg.

Główne cechy Opusa:

  • Szybkość transmisji od 5 do 510 Kbit/s;
  • Częstotliwość próbkowania od 8 do 48 KHz;
  • Czas trwania ramki od 2.5 do 120 milisekund;
  • Obsługa stałych (CBR) i zmiennych (VBR) przepływności;
  • Obsługa dźwięku wąskopasmowego i szerokopasmowego;
  • Wsparcie głosowe i muzyczne;
  • Obsługa stereo i mono;
  • Obsługa dynamicznego ustawiania szybkości transmisji bitów, przepustowości i rozmiaru ramki;
  • Możliwość przywrócenia strumienia audio w przypadku utraty ramki (PLC);
  • Obsługa do 255 kanałów (ramki wielostrumieniowe)
  • Dostępność implementacji wykorzystujących arytmetykę zmiennoprzecinkową i stałoprzecinkową.

Kluczowe innowacje w Opus 1.5:

  • Koder i dekoder rozszerzyły zastosowanie technologii uczenia maszynowego.
  • Zaimplementowano mechanizm głębokiej redundancji (DRED), który wykorzystuje uczenie maszynowe do przywracania fragmentów audio utraconych w wyniku utraty pakietów.
  • Ulepszone przywracanie strumienia audio w przypadku utraty ramek dzięki mechanizmowi uczenia maszynowego Deep PLC (Packet Loss Concealment).
  • Poprawiona jakość transmisji mowy przy niskich przepływnościach (~6 kbps).
  • Dodano dodatkowe optymalizacje wykorzystujące zestawy instrukcji AVX2 (x86) i Neon (ARM).
  • Dodano obsługę formatu dźwięku przestrzennego Ambisonics czwartego i piątego rzędu, który bierze pod uwagę propagację dźwięku nie tylko w płaszczyźnie poziomej, ale także w płaszczyźnie pionowej (aby ustalić, czy źródło dźwięku znajduje się powyżej, czy poniżej).

Tuż po tym opublikowano wersję Opus 1.5.1, w której naprawiono problemy z kompilacją przy użyciu systemu Meson (kompilacja przy użyciu CMake nie była dotknięta tym problemem).

Źródło: opennet.ru

Kup niezawodny hosting dla stron z ochroną DDoS, serwery VPS VDS 🔥 Kup niezawodny hosting stron internetowych z ochroną DDoS, serwery VPS VDS | ProHoster