گوگل انتشار کدک صوتی Lyra 1.3 را با هدف دستیابی به انتقال صدا با کیفیت بالا در شرایط حجم محدود اطلاعات ارسالی منتشر کرده است. کیفیت گفتار در نرخ بیت 3.2 کیلوبیت بر ثانیه، 6 کیلوبیت بر ثانیه و 9.2 کیلوبیت در ثانیه هنگام استفاده از کدک Lyra تقریباً معادل نرخ بیت 10 کیلوبیت بر ثانیه، 13 کیلوبیت بر ثانیه و 14 کیلوبیت در ثانیه هنگام استفاده از کدک Opus است. برای حل این مشکل، علاوه بر روشهای مرسوم فشردهسازی صدا و تبدیل سیگنال، Lyra از مدل گفتاری مبتنی بر سیستم یادگیری ماشینی استفاده میکند که به شما امکان میدهد اطلاعات گمشده را بر اساس ویژگیهای گفتاری معمولی بازسازی کنید. پیاده سازی کد مرجع به زبان C++ نوشته شده و تحت مجوز آپاچی 2.0 توزیع شده است.
برخلاف نسخه جدید Lyra 1.2 که در اکتبر ارائه شد و به معماری جدید شبکه عصبی ترجمه شد، نسخه 1.3 مدل یادگیری ماشین را بدون تغییرات معماری بهینه میکند. نسخه جدید از اعداد صحیح 32 بیتی به جای اعداد ممیز شناور 8 بیتی برای ذخیره وزن ها و انجام عملیات حسابی استفاده می کند که نتیجه آن کاهش 43 درصدی سایز مدل و افزایش 20 درصدی هنگام تست روی گوشی هوشمند Pixel 6 Pro است. کیفیت گفتار در همان سطح حفظ شد، اما قالب داده های ارسالی تغییر کرده است و با نسخه های قبلی سازگار نیست.
منبع: opennet.ru