Collabora-ն ներկայացրել է մեքենայական ուսուցման համակարգ՝ վիդեո սեղմման համար

Collabora-ն հրապարակել է մեքենայական ուսուցման համակարգի ներդրում՝ վիդեոկոնֆերանսների սեղմման արդյունավետությունը բարելավելու համար, որը թույլ է տալիս մասնակցի դեմքով տեսանյութ փոխանցելու դեպքում 10 անգամ նվազեցնել պահանջվող թողունակությունը՝ պահպանելով որակը H.264 մակարդակում: . Իրականացումը գրված է Python-ում՝ օգտագործելով PyTorch շրջանակը և բաց է GPLv3 լիցենզիայի ներքո:

Մեթոդը թույլ է տալիս վերակառուցել դեմքի մանրամասները, որոնք կորել են փոխանցման ժամանակ սեղմման բարձր մակարդակով։ Մեքենայի ուսուցման մոդելը ստեղծում է խոսող գլխի անիմացիա՝ հիմնված առանձին փոխանցված բարձրորակ դեմքի պատկերի և ստացված տեսանյութի վրա՝ հետևելով տեսանյութում դեմքի արտահայտության և գլխի դիրքի փոփոխություններին: Ուղարկողի կողմից տեսանյութը փոխանցվում է շատ ցածր բիթային արագությամբ, իսկ ստացողի կողմից այն մշակվում է մեքենայական ուսուցման համակարգի միջոցով: Որակի հետագա բարձրացման համար ստեղծված տեսանյութը կարող է մշակվել Super-Resolution մոդելի միջոցով:



Source: opennet.ru

Добавить комментарий