Google har åbnet de manglende kilder til Lyra audio codec

Google har udgivet en opdatering til Lyra 0.0.2 audio codec, som er optimeret til at opnå maksimal stemmekvalitet ved brug af meget langsomme kommunikationskanaler. Codec'et blev åbnet i begyndelsen af ​​april, men blev leveret sammen med et proprietært matematisk bibliotek. I version 0.0.2 er denne ulempe blevet elimineret, og der er oprettet en åben erstatning for det angivne bibliotek - sparse_matmul, der ligesom selve codec'et distribueres under Apache 2.0-licensen. Andre forbedringer inkluderer muligheden for at bruge Bazel-byggesystemet med GCC-kompileren og brugen af ​​denne bundt som standard i Linux i stedet for Bazel+Clang.

Lad os huske på, at med hensyn til kvaliteten af ​​transmitterede stemmedata ved lave hastigheder, er Lyra betydeligt bedre end traditionelle codecs, der bruger digitale signalbehandlingsmetoder. For at opnå stemmetransmission af høj kvalitet under forhold med en begrænset mængde transmitteret information, ud over konventionelle metoder til lydkomprimering og signalkonvertering, bruger Lyra en talemodel baseret på et maskinlæringssystem, som giver dig mulighed for at genskabe den manglende information baseret på typiske taleegenskaber. Modellen, der blev brugt til at generere lyden, blev trænet ved hjælp af flere tusinde timers stemmeoptagelser på mere end 70 sprog. Ydeevnen af ​​den foreslåede implementering er tilstrækkelig til talekodning og -afkodning i realtid på smartphones til mellempris, med en signaltransmissionsforsinkelse på 90 millisekunder.

Kilde: opennet.ru

Tilføj en kommentar