Google-ը բացել է Lyra աուդիո կոդեկի բացակայող աղբյուրները

Google-ը հրապարակել է Lyra 0.0.2 աուդիո կոդեկի թարմացում, որն օպտիմիզացված է ձայնի առավելագույն որակի հասնելու համար շատ դանդաղ հաղորդակցման ուղիների օգտագործման դեպքում: Կոդեկը բացվել է ապրիլի սկզբին, սակայն մատակարարվել է սեփական մաթեմատիկական գրադարանի հետ համատեղ: 0.0.2 տարբերակում այս թերությունը վերացվել է, և նշված գրադարանի համար բաց փոխարինում է ստեղծվել՝ sparse_matmul, որը, ինչպես ինքնին կոդեկը, տարածվում է Apache 2.0 լիցենզիայի ներքո: Այլ բարելավումները ներառում են Bazel build համակարգը GCC կոմպիլյատորով օգտագործելու հնարավորությունը և այս փաթեթի օգտագործումը լռելյայնորեն Linux-ում Bazel+Clang-ի փոխարեն:

Հիշենք, որ ցածր արագությամբ փոխանցվող ձայնային տվյալների որակի առումով Lyra-ն զգալիորեն գերազանցում է ավանդական կոդեկներին, որոնք օգտագործում են թվային ազդանշանի մշակման մեթոդներ: Հաղորդվող տեղեկատվության սահմանափակ քանակի պայմաններում ձայնի բարձր որակի փոխանցման հասնելու համար, բացի աուդիո սեղմման և ազդանշանի փոխակերպման սովորական մեթոդներից, Lyra-ն օգտագործում է խոսքի մոդել, որը հիմնված է մեքենայական ուսուցման համակարգի վրա, որը թույլ է տալիս վերստեղծել բաց թողնված տեղեկատվությունը. բնորոշ խոսքի բնութագրերը. Ձայնի գեներացման համար օգտագործված մոդելը վերապատրաստվել է՝ օգտագործելով մի քանի հազար ժամ ձայնագրություններ ավելի քան 70 լեզուներով: Առաջարկվող իրագործման կատարումը բավարար է իրական ժամանակի խոսքի կոդավորման և վերծանման համար միջին գնի սմարթֆոնների վրա՝ ազդանշանի փոխանցման 90 միլիվայրկյան ուշացումով:

Source: opennet.ru

Добавить комментарий