Lyra 1.3 բաց աուդիո կոդեկ թարմացում

Google-ը հրապարակել է Lyra 1.3 աուդիո կոդեկի թողարկումը՝ ուղղված սահմանափակ քանակությամբ փոխանցվող տեղեկատվության պայմաններում ձայնի բարձր որակի փոխանցմանը։ Խոսքի որակը 3.2 կբիթ/վրկ, 6 կբ/վ և 9.2 կբ/վ արագությամբ, երբ օգտագործվում է Lyra կոդեկը, մոտավորապես համարժեք է 10 կբիթ/վրկ, 13 կբ/վ և 14 կբիթ/վրկ արագությանը Opus կոդեկից օգտվելիս: Այս խնդիրը լուծելու համար, բացի աուդիո սեղմման և ազդանշանի փոխակերպման սովորական մեթոդներից, Lyra-ն օգտագործում է խոսքի մոդել, որը հիմնված է մեքենայական ուսուցման համակարգի վրա, որը թույլ է տալիս վերստեղծել բացակայող տեղեկատվությունը՝ հիմնված խոսքի բնորոշ բնութագրերի վրա: Հղման կոդի ներդրումը գրված է C++-ով և տարածվում է Apache 2.0 լիցենզիայի ներքո:

Ի տարբերություն հոկտեմբերին առաջարկված Lyra 1.2-ի արմատապես վերամշակված թողարկման, որը թարգմանվել է նոր նեյրոնային ցանցի ճարտարապետությամբ, 1.3 տարբերակը օպտիմալացնում է մեքենայական ուսուցման մոդելը առանց ճարտարապետական ​​փոփոխությունների: Նոր տարբերակը 32-բիթանոց լողացող կետի փոխարեն օգտագործում է 8-բիթանոց ամբողջ թվեր՝ կշիռները պահելու և թվաբանական գործողություններ կատարելու համար, ինչը հանգեցնում է մոդելի չափի 43%-ով կրճատմանը և Pixel 20 Pro սմարթֆոնի վրա փորձարկման ժամանակ 6%-ով արագացման: Խոսքի որակը պահպանվել է նույն մակարդակի վրա, սակայն փոխանցված տվյալների ձևաչափը փոխվել է և համատեղելի չէ նախորդ թողարկումների հետ:

Source: opennet.ru

Добавить комментарий