ΠžΡΠ½ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒ QEMU ΠΈ FFmpeg ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Π·Π²ΡƒΠΊΠΎΠ²ΠΎΠΉ ΠΊΠΎΠ΄Π΅ΠΊ TSAC

Ѐранцузский ΠΌΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΠΊ Ѐабрис Π‘Π΅Π»Π»Π°Ρ€ (Fabrice Bellard), основавший Π² своё врСмя ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Ρ‹ QEMU, FFmpeg, BPG, QuickJS, TinyGL ΠΈ TinyCC, ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π» Ρ„ΠΎΡ€ΠΌΠ°Ρ‚ кодирования Π·Π²ΡƒΠΊΠ° TSAC ΠΈ связанный с Π½ΠΈΠΌ инструмСнтарий для сТатия ΠΈ распаковки Π·Π²ΡƒΠΊΠΎΠ²Ρ‹Ρ… Ρ„Π°ΠΉΠ»ΠΎΠ². Π€ΠΎΡ€ΠΌΠ°Ρ‚ ΠΎΡ€ΠΈΠ΅Π½Ρ‚ΠΈΡ€ΠΎΠ²Π°Π½ Π½Π° ΠΏΠ΅Ρ€Π΅Π΄Π°Ρ‡Ρƒ Π΄Π°Π½Π½Ρ‹Ρ… с ΠΎΡ‡Π΅Π½ΡŒ Π½ΠΈΠ·ΠΊΠΈΠΌ Π±ΠΈΡ‚Ρ€Π΅ΠΉΡ‚ΠΎΠΌ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, 5.5 kb/s для ΠΌΠΎΠ½ΠΎ ΠΈ 7.5 kb/s для стСрСо, ΠΏΡ€ΠΈ сохранСнии ΠΏΡ€ΠΈΠ΅ΠΌΠ»Π΅ΠΌΠΎΠ³ΠΎ качСства ΠΌΡƒΠ·Ρ‹ΠΊΠΈ ΠΈ Ρ€Π΅Ρ‡ΠΈ. ИспользованиС TSAC позволяСт ΡƒΠΏΠ°ΠΊΠΎΠ²Π°Ρ‚ΡŒ ΠΌΡƒΠ·Ρ‹ΠΊΠ°Π»ΡŒΠ½ΡƒΡŽ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΡŽ, Π΄Π»ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ 3.5 ΠΌΠΈΠ½ΡƒΡ‚ ΠΈ с частотой дискрСтизации 44.1 kHz (стСрСо), Π² Ρ„Π°ΠΉΠ» Ρ€Π°Π·ΠΌΠ΅Ρ€ΠΎΠΌ 192 ΠšΠ‘, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠΎΡ‡Ρ‚ΠΈ Π½Π΅ΠΎΡ‚Π»ΠΈΡ‡ΠΈΠΌ ΠΎΡ‚ ΠΎΡ€ΠΈΠ³ΠΈΠ½Π°Π»Π° Π½Π° слух Π½Π΅ΠΈΡΠΊΡƒΡˆΡ‘Π½Π½ΠΎΠ³ΠΎ обыватСля. Код ΠΏΡ€ΠΎΠ΅ΠΊΡ‚Π° распространяСтся ΠΏΠΎΠ΄ Π»ΠΈΡ†Π΅Π½Π·ΠΈΠ΅ΠΉ MIT.

Π’ качСствС основы ΠΏΡ€ΠΈ создании TSAC использован Π·Π²ΡƒΠΊΠΎΠ²ΠΎΠΉ ΠΊΠΎΠ΄Π΅ΠΊ Descript, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ Ρ€Π°ΡΡˆΠΈΡ€Π΅Π½ для ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠΈ стСрСозвука ΠΈ ΠΏΠ΅Ρ€Π΅Π²Π΅Π΄Ρ‘Π½ Π½Π° использованиС Π΄Ρ€ΡƒΠ³ΠΎΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния Π½Π° Π±Π°Π·Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти с Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ «Ρ‚рансформСр», позволившСй ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΡ‚ΡŒ ΡΡ‚Π΅ΠΏΠ΅Π½ΡŒ сТатия Π·Π° счёт рСконструкции утСрянных Π΄Π΅Ρ‚Π°Π»Π΅ΠΉ с ΡƒΡ‡Ρ‘Ρ‚ΠΎΠΌ ΠΌΠΎΠ΄Π΅Π»ΠΈ чСловСчСского слухового восприятия. МодСль Π·Π°Π½ΠΈΠΌΠ°Π΅Ρ‚ ΠΎΠΊΠΎΠ»ΠΎ 200 ΠœΠ‘ Π² сТатом Π²ΠΈΠ΄Π΅ ΠΈ ΠΎΡ„ΠΎΡ€ΠΌΠ»Π΅Π½Π° Π² Π΄Π΅Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Π½Π½ΠΎΠΉ прСдставлСнии, ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ΅ Π³Π°Ρ€Π°Π½Ρ‚ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΈΠ΅ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠ³ΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° нСзависимо ΠΎΡ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅ΠΌΡ‹Ρ… CPU/GPU ΠΈ числа задСйствованных ΠΏΡ€ΠΈ вычислСниях ΠΏΠΎΡ‚ΠΎΠΊΠΎΠ².

ΠšΠΎΠ΄ΠΈΡ€ΠΎΠ²Ρ‰ΠΈΠΊ ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ с использованиСм для вычислСний Ρ‚ΠΎΠ»ΡŒΠΊΠΎ CPU (для ускорСния ΠΏΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°ΡŽΡ‚ΡΡ инструкции AVX2), Π½ΠΎ для достиТСния высокой ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ рСкомСндуСтся Π·Π°Π΄Π΅ΠΉΡΡ‚Π²ΠΎΠ²Π°Ρ‚ΡŒ GPU. Π’ Ρ‚Π΅ΠΊΡƒΡ‰Π΅ΠΌ Π²ΠΈΠ΄Π΅ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒΡΡ API CUDA для ускорСния с использованиСм GPU NVIDIA Π½Π° Π±Π°Π·Π΅ ΠΌΠΈΠΊΡ€ΠΎΠ°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ Ampere, ADA ΠΈ Hopper (RTX 3090, RTX 4090, RTX A6000, A100 ΠΈ H100), ΠΈΠΌΠ΅ΡŽΡ‰ΠΈΡ… ΠΊΠ°ΠΊ ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ 4 Π“Π‘ видСопамяти. Для прСобразования Π·Π²ΡƒΠΊΠΎΠ²Ρ‹Ρ… Ρ„Π°ΠΉΠ»ΠΎΠ² ΠΏΠ΅Ρ€Π΅Π΄ ΠΊΠΎΠ΄ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ примСняСтся FFmpeg.

originalstereo 6.21 kb/smono 4.71 kb/sstereo 2.57 kb/s

Π”ΠΎΠΏΠΎΠ»Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ‚ΠΌΠ΅Ρ‚ΠΈΡ‚ΡŒ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ Ρ€Π°Π·Π²ΠΈΠ²Π°Π΅ΠΌΠΎΠΉ Π‘Π΅Π»Π»Π°Ρ€ΠΎΠΌ ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρ‹ ts_zip, ΠΏΡ€Π΅Π΄Π½Π°Π·Π½Π°Ρ‡Π΅Π½Π½ΠΎΠΉ для эффСктивного сТатия тСкстовых Π΄Π°Π½Π½Ρ‹Ρ…, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΌΠ΅Ρ…Π°Π½ΠΈΠ·ΠΌ прСдсказания Ρ‚ΠΎΠΊΠ΅Π½ΠΎΠ² Π½Π° основС систСмы машинного обучСния ΠΈ большой языковой ΠΌΠΎΠ΄Π΅Π»ΠΈ RWKV 169M v4. ΠŸΡ€ΠΈ сТатии Π°Ρ€Ρ…ΠΈΠ²Π° Π²ΠΈΠΊΠΈΠΏΠ΅Π΄ΠΈΠΈ ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Π° ts_zip ΠΏΠΎΠ·Π²ΠΎΠ»ΠΈΠ»Π° ΡΠΆΠ°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ Π² 7.3 Ρ€Π°Π·Π°, Π° ΠΏΡ€ΠΈ сТатии ΠΊΠΎΠ΄Π° ядра Linux 1.2 — Π² 7.8 Ρ€Π°Π·. Для сравнСния ΡƒΡ€ΠΎΠ²Π½ΠΈ сТатия ΠΏΡ€ΠΈ использовании ΡƒΡ‚ΠΈΠ»ΠΈΡ‚Ρ‹ xz составили 4.7 ΠΈ 5.5 Ρ€Π°Π·, соотвСтствСнно. Π¦Π΅Π½ΠΎΠΉ высокой эффСктивности сТатия являСтся низкая ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒ сТатия ΠΈ большиС трСбования ΠΊ рСсурсам (ΠΌΠΈΠ½ΠΈΠΌΡƒΠΌ 4 Π“Π‘ ΠžΠ—Π£). На систСмС с GPU RTX 4090 ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ΄ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ сТатия составляСт ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ 1 MB/s.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ: opennet.ru