Lyra 1.3 offenes Audio-Codec-Update

Google hat die Veröffentlichung des Audio-Codecs Lyra 1.3 veröffentlicht, der darauf abzielt, eine qualitativ hochwertige Sprachübertragung unter Bedingungen einer begrenzten Menge an übertragenen Informationen zu erreichen. Die Sprachqualität bei Bitraten von 3.2 kbps, 6 kbps und 9.2 kbps bei Verwendung des Lyra-Codecs entspricht ungefähr Bitraten von 10 kbps, 13 kbps und 14 kbps bei Verwendung des Opus-Codecs. Um dieses Problem zu lösen, nutzt Lyra zusätzlich zu herkömmlichen Methoden der Audiokomprimierung und Signalkonvertierung ein Sprachmodell auf Basis eines maschinellen Lernsystems, das es ermöglicht, die fehlenden Informationen anhand typischer Sprachmerkmale nachzubilden. Die Referenzcode-Implementierung ist in C++ geschrieben und wird unter der Apache 2.0-Lizenz vertrieben.

Im Gegensatz zur radikal überarbeiteten Version von Lyra 1.2, die im Oktober vorgeschlagen wurde und in eine neue neuronale Netzwerkarchitektur übersetzt wurde, optimiert Version 1.3 das Modell des maschinellen Lernens ohne Änderungen an der Architektur. Die neue Version verwendet 32-Bit-Ganzzahlen anstelle von 8-Bit-Gleitkommazahlen, um Gewichte zu speichern und arithmetische Operationen auszuführen, was zu einer Reduzierung der Modellgröße um 43 % und einer Geschwindigkeitssteigerung von 20 % beim Testen auf einem Pixel 6 Pro-Smartphone führt. Die Sprachqualität blieb auf dem gleichen Niveau, das Format der übertragenen Daten hat sich jedoch geändert und ist nicht mit früheren Versionen kompatibel.

Source: opennet.ru

Kommentar hinzufügen