گوگل منابع گمشده کدک صوتی Lyra را باز کرده است

گوگل به روز رسانی کدک صوتی Lyra 0.0.2 را منتشر کرده است که برای دستیابی به حداکثر کیفیت صدا در هنگام استفاده از کانال های ارتباطی بسیار کند بهینه شده است. کدک در اوایل آوریل افتتاح شد، اما همراه با یک کتابخانه ریاضی اختصاصی عرضه شد. در نسخه 0.0.2، این اشکال برطرف شده و یک جایگزین باز برای کتابخانه مشخص شده - sparse_matmul ایجاد شده است که مانند خود کدک، تحت مجوز Apache 2.0 توزیع می شود. از دیگر پیشرفت ها می توان به امکان استفاده از سیستم ساخت Bazel با کامپایلر GCC و استفاده از این بسته نرم افزاری به طور پیش فرض در لینوکس به جای Bazel+Clang اشاره کرد.

به یاد بیاوریم که از نظر کیفیت داده های صوتی ارسال شده در سرعت های پایین، Lyra به طور قابل توجهی برتر از کدک های سنتی است که از روش های پردازش سیگنال دیجیتال استفاده می کنند. برای دستیابی به انتقال صدای با کیفیت بالا در شرایط حجم محدود اطلاعات ارسالی، علاوه بر روش‌های مرسوم فشرده‌سازی صدا و تبدیل سیگنال، Lyra از مدل گفتاری مبتنی بر سیستم یادگیری ماشینی استفاده می‌کند که به شما امکان می‌دهد اطلاعات از دست رفته را بر اساس آن بازآفرینی کنید. ویژگی های گفتاری معمولی مدل مورد استفاده برای تولید صدا با استفاده از چندین هزار ساعت ضبط صدا به بیش از 70 زبان آموزش داده شد. عملکرد اجرای پیشنهادی برای رمزگذاری و رمزگشایی گفتار در زمان واقعی در تلفن های هوشمند ارزان قیمت، با تاخیر انتقال سیگنال 90 میلی ثانیه کافی است.

منبع: opennet.ru

اضافه کردن نظر