谷歌已经开放了 Lyra 音频编解码器缺失的源代码

Google 发布了 Lyra 0.0.2 音频编解码器的更新,该编解码器经过优化,可在使用非常慢的通信通道时实现最佳语音质量。 该编解码器于四月初开放,但与专有的数学库一起提供。 在 0.0.2 版本中,这个缺点已经被消除,并且为指定的库创建了一个开放的替代品——sparse_matmul,它与编解码器本身一样,是在 Apache 2.0 许可证下分发的。 其他改进包括将 Bazel 构建系统与 GCC 编译器结合使用的能力,以及在 Linux 中默认使用此捆绑包而不是 Bazel+Clang。

让我们回想一下,就低速传输语音数据的质量而言,Lyra 明显优于使用数字信号处理方法的传统编解码器。 为了在传输信息量有限的情况下实现高质量的语音传输,除了传统的音频压缩和信号转换方法外,Lyra还采用了基于机器学习系统的语音模型,可以让您根据信息重新创建丢失的信息。典型的言语特征。 用于生成声音的模型是使用 70 多种语言的数千小时录音进行训练的。 所提出的实现的性能足以满足中价智能手机上的实时语音编码和解码,信号传输延迟为 90 毫秒。

来源: opennet.ru

添加评论