Google har öppnat de saknade källorna för Lyra audio codec

Google har publicerat en uppdatering av Lyra 0.0.2 audio codec, som är optimerad för att uppnå maximal röstkvalitet vid användning av mycket långsamma kommunikationskanaler. Codecen öppnades i början av april, men levererades i samband med ett proprietärt matematiskt bibliotek. I version 0.0.2 har denna nackdel eliminerats och en öppen ersättning har skapats för det angivna biblioteket - sparse_matmul, som, liksom själva codec, distribueras under Apache 2.0-licensen. Andra förbättringar inkluderar möjligheten att använda Bazel-byggsystemet med GCC-kompilatorn och användningen av detta paket som standard i Linux istället för Bazel+Clang.

Låt oss komma ihåg att när det gäller kvaliteten på sänd röstdata vid låga hastigheter är Lyra betydligt överlägsen traditionella codecs som använder digitala signalbehandlingsmetoder. För att uppnå högkvalitativ röstöverföring under förhållanden med en begränsad mängd överförd information, utöver konventionella metoder för ljudkomprimering och signalkonvertering, använder Lyra en talmodell baserad på ett maskininlärningssystem, som låter dig återskapa den saknade informationen baserat på typiska talegenskaper. Modellen som användes för att generera ljudet tränades med flera tusen timmars röstinspelningar på mer än 70 språk. Prestandan för den föreslagna implementeringen är tillräcklig för talkodning och avkodning i realtid på smartphones med mellanpris, med en signalöverföringsfördröjning på 90 millisekunder.

Källa: opennet.ru

Lägg en kommentar