Google har släppt ljudkodeken Lyra 1.3, som syftar till att uppnå högkvalitativ röstöverföring under förhållanden med begränsad volym överförd information. Talkvaliteten vid bithastigheter på 3.2 kbps, 6 kbps och 9.2 kbps när Lyra-kodeken används är ungefär lika med bithastigheter på 10 kbps, 13 kbps och 14 kbps när Opus-kodeken används. För att lösa detta problem använder Lyra, utöver konventionella metoder för ljudkomprimering och signalkonvertering, en talmodell baserad på ett maskininlärningssystem, vilket gör att du kan återskapa saknad information baserat på typiska talegenskaper. Referensimplementeringen av koden är skriven i C++ och distribueras under Apache 2.0-licensen.
Till skillnad från den helt omdesignade Lyra 1.2-versionen som släpptes i oktober, vilken överfördes till en ny neural nätverksarkitektur, optimerade version 1.3 maskininlärningsmodellen utan arkitektoniska förändringar. Den nya versionen använder 32-bitars heltal istället för 8-bitars flyttal för att lagra vikter och utföra aritmetiska operationer, vilket resulterade i en minskning av modellstorleken med 43 % och en acceleration på 20 % i modellkörningen vid testning på en Pixel 6 Pro-smartphone. Talkvaliteten bibehölls på samma nivå, men formatet på den överförda datan har ändrats och är inte kompatibelt med tidigare versioner.
Källa: opennet.ru
