Collabora 推出了用于视频压缩的机器学习系统

Collabora 发布了一种机器学习系统的实现,可以提高视频会议的压缩效率,在传输参与者脸部视频的情况下,可以将所需带宽减少 10 倍,同时保持 H.264 级别的质量。 该实现是使用 PyTorch 框架用 Python 编写的,并在 GPLv3 许可证下开放。

该方法允许您重建在高压缩级别的传输过程中丢失的面部细节。 机器学习模型根据单独传输的高质量面部图像和生成的视频生成会说话的头部动画,跟踪视频中面部表情和头部位置的变化。 在发送方,视频以非常低的比特率传输,而在接收方,视频由机器学习系统处理。 为了进一步提高质量,可以使用超分辨率模型处理生成的视频。



来源: opennet.ru

添加评论