ګوګل د لیرا V2 خلاصې سرچینې آډیو کوډیک خپروي

ګوګل د Lyra V2 آډیو کوډیک معرفي کړی، کوم چې د ماشین زده کړې تخنیکونه کاروي ترڅو په خورا ورو مخابراتي چینلونو کې د لوړ غږ کیفیت ترلاسه کړي. نوې نسخه د نوي عصبي شبکې جوړښت ته لیږد ، د اضافي پلیټ فارمونو ملاتړ ، د بټریټ کنټرول پراخه ظرفیتونه ، ښه فعالیت او لوړ غږ کیفیت وړاندې کوي. د حوالې کوډ پلي کول په C++ کې لیکل شوي او د اپاچي 2.0 جواز لاندې ویشل شوي.

په ټیټ سرعت کې د لیږدول شوي غږ ډیټا کیفیت په شرایطو کې ، لیرا د دودیز کوډیکونو څخه د پام وړ غوره دی چې د ډیجیټل سیګنال پروسس کولو میتودونه کاروي. د محدود مقدار لیږد شوي معلوماتو شرایطو کې د لوړ کیفیت غږ لیږد ترلاسه کولو لپاره ، د آډیو کمپریشن او سیګنال تبادلې دودیزو میتودونو سربیره ، لیرا د ماشین زده کړې سیسټم پراساس د وینا ماډل کاروي ، کوم چې تاسو ته اجازه درکوي د ورک شوي معلوماتو پراساس بیا رامینځته کړئ. د وینا ځانګړنې

کوډیک کې کوډ کوونکی او کوډ کوونکی شامل دي. د انکوډر الګوریتم په هرو 20 ملی ثانیو کې د غږ ډیټا پیرامیټرو استخراج کولو ته راښکته کیږي ، دوی فشاروي او ترلاسه کونکي ته یې په شبکه کې له 3.2kbps څخه تر 9.2kbps بټریټ سره لیږدوي. د رسیدونکي په پای کې، ډیکوډر د لیږد شوي آډیو پیرامیټونو پراساس د اصلي وینا سیګنال بیا رغولو لپاره تولیدي ماډل کاروي ، پدې کې د لوګاریتمیک چاک سپیکٹروګرامونه شامل دي چې د مختلف فریکونسۍ رینجونو کې د وینا انرژي ځانګړتیاوې په پام کې نیسي او د ماډلونو په پام کې نیولو سره چمتو شوي. د انسان د اوریدلو ادراک.

Lyra V2 د SoundStream convolutional عصبي شبکې پراساس یو نوی تولیدي ماډل کاروي ، کوم چې ټیټ کمپیوټري اړتیاوې لري ، حتی د ټیټ بریښنا سیسټمونو کې ریښتیني وخت کوډ کولو ته اجازه ورکوي. هغه ماډل چې د غږ تولید لپاره کارول کیږي په 90 ژبو کې د څو زره ساعتونو غږ ثبتولو په کارولو سره روزل شوی و. TensorFlow Lite د ماډل اجرا کولو لپاره کارول کیږي. د وړاندیز شوي پلي کولو فعالیت د ټیټ نرخ حد کې په سمارټ فونونو کې د وینا کوډ کولو او کوډ کولو لپاره کافي دی.

د مختلف تولیدي ماډل کارولو سربیره ، نوې نسخه د RVQ (د پاتې ویکتور کوانټایزر) کوانټایزر سره د لینکونو کوډیک جوړښت کې شاملولو لپاره هم د پام وړ دی ، کوم چې د ډیټا لیږدولو دمخه د لیږونکي اړخ کې اجرا کیږي ، او د ترلاسه کونکي اړخ کې. د معلوماتو ترلاسه کولو وروسته. کوانټایزر د کوډیک لخوا تولید شوي پیرامیټونه د پاکټونو په سیټونو کې بدلوي، د ټاکل شوي بټریټ په اړه معلومات کوډ کول. د کیفیت د مختلفو کچو چمتو کولو لپاره، کوانټایزرونه د دریو بټریټونو (3.2 kps، 6 kbps او 9.2 kbps) لپاره چمتو شوي، څومره چې بیټریټ لوړ وي، کیفیت یې ښه وي، مګر د بینډ ویت اړتیاوې لوړې وي.

ګوګل د لیرا V2 خلاصې سرچینې آډیو کوډیک خپروي

نوي جوړښت د سیګنال لیږد ځنډ له 100 څخه تر 20 ملی ثانیو پورې کم کړی. د پرتله کولو لپاره، د WebRTC لپاره Opus کوډیک په ازمول شوي بټریټ کې د 26.5ms، 46.5ms او 66.5ms ځنډ ښودلی. د کوډر او کوډر فعالیت هم د پام وړ وده کړې - د تیرې نسخې په پرتله 5 ځله ګړندی. د مثال په توګه، په Pixel 6 Pro سمارټ فون کې، نوی کوډیک په 20 ms کې د 0.57-ms نمونه کوډ کوي او ډیکوډ کوي، کوم چې د ریښتیني وخت لیږد لپاره د اړتیا څخه 35 ځله ګړندی دی.

د فعالیت سربیره، دا هم ممکنه وه چې د غږ بیا رغونې کیفیت ښه کړي - د مشرا پیمان له مخې، د 3.2 kbps، 6 kbps او 9.2 kbps بټریټ کې د وینا کیفیت کله چې د Lyra V2 کوډیک کارول د 10 kbps، 13 بټریټ سره مطابقت لري. Kbps او 14 kbps کله چې د Opus کوډیک کاروئ.

سرچینه: opennet.ru

Add a comment