Lyra 1.3 åpen lydkodekoppdatering

Google har publisert utgivelsen av Lyra 1.3-lydkodeken, med sikte på å oppnå stemmeoverføring av høy kvalitet under forhold med en begrenset mengde overført informasjon. Talekvalitet ved bithastigheter på 3.2 kbps, 6 kbps og 9.2 kbps ved bruk av Lyra-kodeken tilsvarer omtrent bithastigheter på 10 kbps, 13 kbps og 14 kbps ved bruk av Opus-kodeken. For å løse dette problemet, i tillegg til konvensjonelle metoder for lydkomprimering og signalkonvertering, bruker Lyra en talemodell basert på et maskinlæringssystem, som lar deg gjenskape den manglende informasjonen basert på typiske taleegenskaper. Referansekodeimplementeringen er skrevet i C++ og distribuert under Apache 2.0-lisensen.

I motsetning til den radikalt redesignede utgivelsen av Lyra 1.2 som ble foreslått i oktober, oversatt til en ny nevrale nettverksarkitektur, optimaliserer versjon 1.3 maskinlæringsmodellen uten arkitektoniske endringer. Den nye versjonen bruker 32-bits heltall i stedet for 8-bits flyttall for å lagre vekter og utføre aritmetiske operasjoner, noe som resulterer i en 43 % reduksjon i modellstørrelse og en 20 % hastighetsøkning ved testing på en Pixel 6 Pro-smarttelefon. Talekvaliteten ble opprettholdt på samme nivå, men formatet på de overførte dataene har endret seg og er ikke kompatibel med tidligere utgivelser.

Kilde: opennet.ru

Legg til en kommentar