Google huet den Lyra V2 Audio Codec agefouert, deen MaschinnlĂ©iere Technike benotzt fir maximal StĂ«mmqualitĂ©it iwwer ganz lues KommunikatiounskanĂ€l z'erreechen. DĂ©i nei Versioun weist en Iwwergang zu enger neier neuraler Netzwierkarchitektur, ĂnnerstĂ«tzung fir zousĂ€tzlech Plattformen, erweidert Bitrate KontrollfĂ€egkeeten, verbessert Leeschtung a mĂ©i hĂ©ich AudioqualitĂ©it. D'Referenzcode Implementatioun ass an C++ geschriwwen a verdeelt Ă«nner der Apache 2.0 Lizenz.
Wat d'Qualitéit vun iwwerdroe Stëmmdaten bei niddrege Geschwindegkeet ugeet, ass Lyra wesentlech besser wéi traditionell Codecs déi digital Signalveraarbechtungsmethoden benotzen. Fir héichqualitativ Stëmmiwwerdroung a Bedéngungen vun enger limitéierter Quantitéit vun iwwerdroenen Informatioun z'erreechen, zousÀtzlech zu konventionelle Methoden fir Audiokompressioun a Signalkonversioun, benotzt Lyra e Riedmodell baséiert op engem Maschinnléieresystem, deen Iech erlaabt déi fehlend Informatioun op Basis vun typesch Ried Charakteristiken.
De Codec enthĂ€lt en Encoder an en Decoder. Den Algorithmus vum Encoder geet erof fir StĂ«mmdatenparameter all 20 Millisekonnen ze extrahieren, se ze komprimĂ©ieren an ze iwwerdroen un den EmpfĂ€nger iwwer e Netzwierk mat enger Bitrate vun 3.2kbps bis 9.2kbps. Um EmpfĂ€nger Enn benotzt den Decoder e generativen Modell fir dat ursprĂ©nglecht Riedssignal op Basis vun den iwwerdroenen Audioparameter ze rekonstruĂ©ieren, dĂ©i logarithmesch Kalkspektrogramme enthalen, dĂ©i d'Energiecharakteristike vun der Ried a verschiddene Frequenzbereich berĂŒcksichtegen a virbereet ginn Ă«nner BerĂŒcksichtegung vu Modeller vun mĂ«nschlecht Gehörperceptioun.
Lyra V2 benotzt en neie generativen Modell baséiert op dem SoundStream konvolutionalen neuralen Netzwierk, deen niddereg computational Ufuerderunge huet, wat EchtzÀit Dekodéierung och op Low-Power Systemer erlaabt. De Modell benotzt fir den Toun ze generéieren gouf mat e puer dausend Stonne Stëmmopnamen a méi wéi 90 Sproochen trainéiert. TensorFlow Lite gëtt benotzt fir de Modell auszeféieren. D'Performance vun der proposéierter Implementatioun ass genuch fir Riedkodéierung an Dekodéierung op Smartphones am ënneschten PrÀisbereich.
ZousĂ€tzlech fir en anere generative Modell ze benotzen, ass dĂ©i nei Versioun och bemierkenswĂ€ert fir d'Inklusioun an der Codec-Architektur vu Linken mam RVQ (Residual Vector Quantizer) Quantizer, deen op der SĂ€it vum Sender ausgefĂŒhrt gĂ«tt ier Dir Daten iwwerdroe gĂ«tt, an op der SĂ€it vum EmpfĂ€nger. no DonnĂ©eĂ« krĂ©ien. De Quantizer konvertĂ©iert d'Parameteren, dĂ©i vum Codec produzĂ©iert ginn, a Sets vu Paketen, kodĂ©iert Informatioun a Relatioun mat der gewielter Bitrate. Fir verschidde QualitĂ©itsniveauen ze bidden, gi QuantisĂ©ierer fir drĂ€i Bitrate (3.2 kps, 6 kbps an 9.2 kbps) zur VerfĂŒgung gestallt, wat mĂ©i hĂ©ich ass de Bitrate, wat besser d'QualitĂ©it, awer wat mĂ©i hĂ©ich d'Bandbreedungsfuerderunge sinn.

Déi nei Architektur huet d'Signaliwwerdroungsverzögerungen vun 100 op 20 Millisekonnen reduzéiert. Zum Verglach huet den Opus Codec fir WebRTC Latenzen vun 26.5ms, 46.5ms an 66.5ms bei de geteste Bitrates bewisen. D'Performance vum Encoder an Decoder ass och wesentlech eropgaang - bis zu 5 Mol méi séier am Verglach mat der viregter Versioun. Zum Beispill, um Pixel 6 Pro Smartphone, codéiert an decodéiert den neie Codec eng 20 ms Probe an 0.57 ms, wat 35 Mol méi séier ass wéi néideg fir EchtzÀit Iwwerdroung.
ZousÀtzlech zu der Leeschtung war et och méiglech d'Qualitéit vun der Toun Restauratioun ze verbesseren - laut der MUSHRA Skala, Sproochqualitéit bei Bitrates vun 3.2 kbps, 6 kbps an 9.2 kbps wann Dir de Lyra V2 Codec benotzt entsprécht Bitrate vun 10 kbps, 13 kbps an 14 kbps wann Dir den Opus Codec benotzt.
Source: opennet.ru
