به‌روزرسانی کدک صوتی Lyra 1.3 باز شد

گوگل انتشار کدک صوتی Lyra 1.3 را با هدف دستیابی به انتقال صدا با کیفیت بالا در شرایط حجم محدود اطلاعات ارسالی منتشر کرده است. کیفیت گفتار در نرخ بیت 3.2 کیلوبیت بر ثانیه، 6 کیلوبیت بر ثانیه و 9.2 کیلوبیت در ثانیه هنگام استفاده از کدک Lyra تقریباً معادل نرخ بیت 10 کیلوبیت بر ثانیه، 13 کیلوبیت بر ثانیه و 14 کیلوبیت در ثانیه هنگام استفاده از کدک Opus است. برای حل این مشکل، علاوه بر روش‌های مرسوم فشرده‌سازی صدا و تبدیل سیگنال، Lyra از مدل گفتاری مبتنی بر سیستم یادگیری ماشینی استفاده می‌کند که به شما امکان می‌دهد اطلاعات گمشده را بر اساس ویژگی‌های گفتاری معمولی بازسازی کنید. پیاده سازی کد مرجع به زبان C++ نوشته شده و تحت مجوز آپاچی 2.0 توزیع شده است.

برخلاف نسخه جدید Lyra 1.2 که در اکتبر ارائه شد و به معماری جدید شبکه عصبی ترجمه شد، نسخه 1.3 مدل یادگیری ماشین را بدون تغییرات معماری بهینه می‌کند. نسخه جدید از اعداد صحیح 32 بیتی به جای اعداد ممیز شناور 8 بیتی برای ذخیره وزن ها و انجام عملیات حسابی استفاده می کند که نتیجه آن کاهش 43 درصدی سایز مدل و افزایش 20 درصدی هنگام تست روی گوشی هوشمند Pixel 6 Pro است. کیفیت گفتار در همان سطح حفظ شد، اما قالب داده های ارسالی تغییر کرده است و با نسخه های قبلی سازگار نیست.

منبع: opennet.ru

اضافه کردن نظر