Collabora presentou un sistema de aprendizaxe automática para a compresión de vídeo

Collabora publicou unha implementación dun sistema de aprendizaxe automática para mellorar a eficiencia de compresión das videoconferencias, que permite, no caso de transmitir vídeo coa cara dun participante, reducir en 10 veces o ancho de banda necesario mantendo a calidade a nivel H.264. . A implementación está escrita en Python usando o marco PyTorch e está aberta baixo a licenza GPLv3.

O método permítelle reconstruír detalles faciais que se perderon durante a transmisión cun alto nivel de compresión. O modelo de aprendizaxe automática xera unha animación de cabeza parlante baseada nunha imaxe facial de alta calidade transmitida por separado e o vídeo resultante, facendo un seguimento dos cambios na expresión facial e na posición da cabeza no vídeo. Por parte do remitente, o vídeo transmítese a unha taxa de bits moi baixa, e por parte do destinatario é procesado por un sistema de aprendizaxe automática. Para mellorar aínda máis a calidade, o vídeo xerado pódese procesar mediante o modelo Super-Resolution.



Fonte: opennet.ru

Engadir un comentario