После почти года разработки организация Xiph.Org, занимающаяся разработкой свободных видео- и аудиокодеков, представила релиз аудиокодека Opus 1.5, обеспечивающего высокое качество кодирования и минимальную задержку как при сжатии потокового звука с высоким битрейтом, так и при сжатии голоса в ограниченных по пропускной способности приложениях VoIP-телефонии. Эталонные реализации кодировщика и декодировщика распространяются под лицензией BSD. Полные спецификации формата Opus общедоступны, бесплатны и утверждены в качестве интернет-стандарта (RFC 6716).
Kodek je vytvořen kombinací nejlepších technologií z kodeku CELT od Xiph.org a open source kodeku SILK od Skype. Na vývoji Opusu se kromě Skypu a Xiph.Org podílely i společnosti jako Mozilla, Octasic, Broadcom nebo Google. Patenty zapojené do Opusu jsou udělovány společnostmi zapojenými do vývoje pro neomezené použití bez placení licenčních poplatků. Všechna práva k duševnímu vlastnictví a patentové licence související s Opusem jsou automaticky delegovány na aplikace a produkty využívající Opus, bez nutnosti dalšího schválení. Neexistují žádná omezení pro rozsah a vytváření alternativních implementací třetích stran. Všechna udělená práva jsou však zrušena v případě patentového řízení ovlivňujícího technologie Opus proti kterémukoli uživateli Opus.
Opus se vyznačuje vysokou kvalitou kódování a minimální latencí jak pro kompresi streamovaného zvuku s vysokou bitovou rychlostí, tak pro kompresi hlasu pro aplikace VoIP telefonie s omezenou šířkou pásma. Dříve byl Opus zvolen nejlepším kodekem na 64 kbit (Opus překonal konkurenty jako Apple HE-AAC, Nero HE-AAC, Vorbis a AAC LC). Mezi produkty, které podporují Opus, patří prohlížeč Firefox, framework GStreamer a balíček FFmpeg.
Hlavní rysy Opusu:
- Bitrate od 5 do 510 Kbit/s;
- vzorkovací frekvence od 8 do 48 kHz;
- Doba trvání snímku od 2.5 do 120 milisekund;
- Podpora konstantních (CBR) a proměnných (VBR) datových toků;
- Podpora pro úzkopásmový a širokopásmový zvuk;
- Podpora hlasu a hudby;
- Podpora stereo a mono;
- Podpora dynamického nastavení datového toku, šířky pásma a velikosti rámce;
- Schopnost obnovit audio stream v případě ztráty rámce (PLC);
- Podpora až 255 kanálů (multistreamové snímky)
- Dostupnost implementací pomocí aritmetiky s plovoucí a pevnou řádovou čárkou.
Klíčové inovace v Opusu 1.5:
- В кодировщике и декодировщике расширено применение технологий машинного обучения.
- Реализован механизм «Deep Redundancy» (DRED), использующий машинное обучение для восстановления фрагментов звука, утраченных из-за потери пакетов.
- Улучшено восстановление звукового потока в случае потери кадров при помощи механизма машинного обучения Deep PLC (Packet Loss Concealment).
- Улучшено качество передачи речи на низких битрейтах (~ 6 Кбит/с).
- Добавлены дополнительные оптимизации, использующие наборы инструкций AVX2 (x86) и Neon (ARM).
- Добавлена поддержка формата объёмного звучания Ambisonics 4-го и 5-го порядка, учитывающего распространение звука не только в горизонтальной плоскости, но и в вертикальной (для определения сверху или снизу источник звука).
По горячим следам сформирован выпуск Opus 1.5.1, в котором устранены проблемы со сборкой с использованием сборочной системы Meson (сборку с использованием CMake проблема не затронула).
Zdroj: opennet.ru