Google malfermis la mankantajn fontojn por la sonkodeko Lyra

Google publikigis ĝisdatigon de la sonkodeko Lyra 0.0.2, kiu estas optimumigita por atingi maksimuman voĉkvaliton kiam oni uzas tre malrapidajn komunikajn kanalojn. La kodeko estis malfermita en frua aprilo, sed estis liverita lige kun proprieta matematika biblioteko. En versio 0.0.2, ĉi tiu malavantaĝo estis forigita kaj malfermita anstataŭaĵo estis kreita por la specifita biblioteko - sparse_matmul, kiu, kiel la kodeko mem, estas distribuita sub la licenco Apache 2.0. Aliaj plibonigoj inkluzivas la kapablon uzi la Bazel-konstruan sistemon kun la GCC-kompililo kaj la uzon de ĉi tiu pakaĵo defaŭlte en Linukso anstataŭ Bazel+Clang.

Ni rememoru, ke laŭ la kvalito de elsenditaj voĉaj datumoj je malaltaj rapidecoj, Lyra estas signife supera al tradiciaj kodekoj, kiuj uzas ciferecajn signalajn prilaborajn metodojn. Por atingi altkvalitan voĉan transdonon en kondiĉoj de limigita kvanto da transdonitaj informoj, krom konvenciaj metodoj de aŭdkunpremo kaj signala konvertiĝo, Lyra uzas parolmodelon bazitan sur maŝinlernado sistemo, kiu ebligas al vi rekrei la mankantajn informojn surbaze de tipaj paroltrajtoj. La modelo uzita por generi la sonon estis trejnita uzante plurmil horojn da voĉregistradoj en pli ol 70 lingvoj. La agado de la proponita efektivigo sufiĉas por realtempa parolkodado kaj malkodado sur mezprezaj saĝtelefonoj, kun prokrasto de transsendo de signalo de 90 milisekundoj.

fonto: opennet.ru

Aldoni komenton