Lyra 1.3 öppen ljudcodec-uppdatering

Google har publicerat släppet av Lyra 1.3 audio codec, som syftar till att uppnå högkvalitativ röstöverföring under förhållanden med en begränsad mängd överförd information. Talkvalitet vid bithastigheter på 3.2 kbps, 6 kbps och 9.2 kbps när du använder Lyra-codec är ungefär lika med bithastigheter på 10 kbps, 13 kbps och 14 kbps när du använder Opus-codec. För att lösa detta problem, förutom konventionella metoder för ljudkomprimering och signalkonvertering, använder Lyra en talmodell baserad på ett maskininlärningssystem, som låter dig återskapa den saknade informationen baserat på typiska talegenskaper. Implementeringen av referenskoden är skriven i C++ och distribueras under Apache 2.0-licensen.

Till skillnad från den radikalt omdesignade versionen av Lyra 1.2 som föreslogs i oktober, översatt till en ny neural nätverksarkitektur, optimerar version 1.3 maskininlärningsmodellen utan arkitektoniska förändringar. Den nya versionen använder 32-bitars heltal istället för 8-bitars flyttal för att lagra vikter och utföra aritmetiska operationer, vilket resulterar i en 43 % minskning av modellstorleken och en 20 % snabbare hastighet vid testning på en Pixel 6 Pro-smarttelefon. Talkvaliteten bibehölls på samma nivå, men formatet på den överförda datan har ändrats och är inte kompatibel med tidigare utgåvor.

Källa: opennet.ru

Lägg en kommentar