QEMU, FFmpeg, BPG, QuickJS, TinyGL жана TinyCC долбоорлорун негиздеген француз математиги Фабрис Беллард TSAC аудио коддоо форматын жана аудио файлдарды кысуу жана ачуу үчүн тиешелүү куралдарды жарыялады. Формат музыканын жана сүйлөөнүн алгылыктуу сапатын сактоо менен, мисалы, моно үчүн 5.5 кб/сек жана стерео үчүн 7.5 кб/сек ылдамдыкта маалыматтарды берүүгө багытталган. TSACти колдонуу 3.5 мүнөткө созулган музыкалык композицияны жана 44.1 кГц (стерео) тандап алуу жыштыгы менен 192 КБ файлга топтоого мүмкүндүк берет, ал тажрыйбасыз жөнөкөй адамдын кулагына оригиналынан дээрлик айырмаланбайт. Долбоордун коду MIT лицензиясы боюнча таратылат.
Дескрипт аудио кодеги TSAC түзүү үчүн негиз катары колдонулган, ал стерео үндү колдоо үчүн кеңейтилген жана "трансформатор" архитектурасы менен нейрондук тармакка негизделген башка машина үйрөнүү моделин колдонууга өткөрүлүп берилген, бул кысууну жогорулатууга мүмкүндүк берген. адамдын угуу кабылдоо моделин эске алуу менен жоголгон деталдарды калыбына келтирүү менен катышы. Модель кысылган формада 200 МБга жакынды ээлейт жана детерминистикалык өкүлчүлүктө форматталган, бул колдонулган CPU/GPUга жана эсептөөлөргө тартылган жиптердин санына карабастан бирдей натыйжага кепилдик берет.
Кодер эсептөөлөр үчүн CPU гана иштете алат (AVX2 нускамалары тездетүү үчүн колдоого алынат), бирок жогорку өндүрүмдүүлүккө жетүү үчүн GPU колдонуу сунушталат. Учурдагы түрүндө, CUDA API'ни Ampere, ADA жана Hopper микроархитектураларына (RTX 3090, RTX 4090, RTX A6000, A100 жана H100) негизделген NVIDIA GPU'ларын колдонуу менен ылдамдатуу үчүн колдонсо болот, кеминде 4 ГБ видео эстутуму бар. FFmpeg коддоо алдында аудио файлдарды айландыруу үчүн колдонулат.
Мындан тышкары, Bellar компаниясынын ts_zip утилитасын жаңыртууну белгилей кетүү керек, ал машиналык үйрөнүү системасына жана RWKV 169M v4 чоң тил моделине негизделген токенди алдын ала айтуу механизмин колдонуу менен тексттик маалыматтарды натыйжалуу кысуу үчүн иштелип чыккан. Wikipedia архивин кысууда ts_zip маалыматтарды 7.3 эсеге, ал эми ядро кодун кысууда маалыматтарды кысууну иштеткен. Linux 1.2x — 7.8x. Салыштыруу үчүн, xz утилитасын колдонгон кысуу деңгээлдери тиешелүүлүгүнө жараша 4.7x жана 5.5x болгон. Жогорку кысуу натыйжалуулугунун айырмасы - бул төмөнкү кысуу ылдамдыгы жана жогорку ресурстарга болгон талаптар (жок дегенде 4 ГБ оперативдик эс тутум). RTX 4090 GPU бар системада кысуу көрсөткүчү болжол менен 1 МБ/с түзөт.
Source: opennet.ru
