Mise à jour du codec audio ouvert Lyra 1.3

Google a publié la sortie du codec audio Lyra 1.3, visant à obtenir une transmission vocale de haute qualité dans des conditions de quantité limitée d'informations transmises. La qualité de la parole à des débits binaires de 3.2 kbps, 6 kbps et 9.2 kbps lors de l'utilisation du codec Lyra est approximativement équivalente à des débits binaires de 10 kbps, 13 kbps et 14 kbps lors de l'utilisation du codec Opus. Pour résoudre ce problème, en plus des méthodes conventionnelles de compression audio et de conversion de signal, Lyra utilise un modèle vocal basé sur un système d'apprentissage automatique, qui vous permet de recréer les informations manquantes sur la base des caractéristiques vocales typiques. L'implémentation du code de référence est écrite en C++ et distribuée sous la licence Apache 2.0.

Contrairement à la version radicalement repensée de Lyra 1.2 proposée en octobre, traduite dans une nouvelle architecture de réseau neuronal, la version 1.3 optimise le modèle d'apprentissage automatique sans modifications architecturales. La nouvelle version utilise des entiers de 32 bits au lieu de nombres à virgule flottante de 8 bits pour stocker les poids et effectuer des opérations arithmétiques, ce qui entraîne une réduction de 43 % de la taille du modèle et une accélération de 20 % lors des tests sur un smartphone Pixel 6 Pro. La qualité vocale a été maintenue au même niveau, mais le format des données transmises a changé et n'est pas compatible avec les versions précédentes.

Source: opennet.ru

Ajouter un commentaire