Ipinakilala ng Collabora ang isang machine learning system para sa video compression

Naglathala ang Collabora ng isang implementasyon ng machine learning para sa pagpapabuti ng kahusayan sa compression ng video conferencing. Ang sistemang ito ay nagbabawas ng mga kinakailangan sa bandwidth nang sampung beses kapag nagpapadala ng video na may mukha ng isang kalahok, habang pinapanatili ang kalidad sa antas ng H.264. Ang implementasyon ay nakasulat sa Python gamit ang PyTorch framework at open source sa ilalim ng lisensyang GPLv3.

Ang pamamaraang ito ay nagbibigay-daan para sa muling pagbuo ng mga detalye ng mukha na nawala habang isinasagawa ang highly compressed transmission. Ang isang machine learning model ay bumubuo ng isang talking head animation batay sa isang hiwalay na ipinadalang mataas na kalidad na imahe ng mukha at ng natanggap na video, na sinusubaybayan ang mga pagbabago sa ekspresyon ng mukha at posisyon ng ulo sa video. Sa panig ng nagpadala, ang video ay ipinapadala sa napakababang bitrate at pinoproseso ng isang machine learning system sa panig ng receiver. Para sa karagdagang pagpapahusay ng kalidad, ang nabuong video ay maaaring iproseso gamit ang Super-Resolution model.

Play na video


Pinagmulan: opennet.ru