Collabora het 'n masjienleerstelsel vir videokompressie bekendgestel

Collabora het 'n implementering van 'n masjienleerstelsel gepubliseer om die kompressiedoeltreffendheid van videokonferensies te verbeter, wat dit moontlik maak om, in die geval van die oordrag van video met 'n deelnemer se gesig, die vereiste bandwydte met 10 keer te verminder, terwyl kwaliteit op die H.264-vlak behou word. . Die implementering is in Python geskryf deur die PyTorch-raamwerk te gebruik en is oop onder die GPLv3-lisensie.

Die metode laat jou toe om gesigbesonderhede wat tydens oordrag verlore gegaan het, met 'n hoë vlak van kompressie te rekonstrueer. Die masjienleermodel genereer 'n pratende kop-animasie gebaseer op 'n afsonderlik oorgedra hoë-gehalte gesigsbeeld en die gevolglike video, en volg veranderinge in gesigsuitdrukking en kopposisie in die video. Aan die sender se kant word die video teen 'n baie lae bitsnelheid versend, en aan die ontvanger se kant word dit deur 'n masjienleerstelsel verwerk. Om die kwaliteit verder te verbeter, kan die gegenereerde video verwerk word met behulp van die Super-resolusie-model.



Bron: opennet.ru

Voeg 'n opmerking