Google hefur opnað heimildirnar sem vantar fyrir Lyra hljóðmerkjamálið

Google hefur gefið út uppfærslu á Lyra 0.0.2 hljóðmerkjamálinu, sem er fínstillt til að ná hámarks raddgæðum þegar mjög hægar samskiptarásir eru notaðar. Merkjamálið var opnað í byrjun apríl, en var afhent í tengslum við sérstakt stærðfræðisafn. Í útgáfu 0.0.2 hefur þessum galli verið eytt og búið að búa til opinn staðgengil fyrir tilgreint bókasafn - sparse_matmul, sem, eins og merkjamálið sjálft, er dreift undir Apache 2.0 leyfinu. Aðrar endurbætur fela í sér möguleikann á að nota Bazel byggingarkerfið með GCC þýðandanum og notkun þessa búnts sjálfgefið í Linux í stað Bazel+Clang.

Við skulum muna að hvað varðar gæði sendra raddgagna á lágum hraða er Lyra verulega betri en hefðbundin merkjamál sem nota stafrænar merkjavinnsluaðferðir. Til að ná hágæða raddsendingu við aðstæður með takmarkað magn sendra upplýsinga, auk hefðbundinna aðferða við hljóðþjöppun og merkjabreytingu, notar Lyra tallíkan sem byggir á vélanámskerfi, sem gerir þér kleift að endurskapa þær upplýsingar sem vantar út frá dæmigerður taleinkenni. Líkanið sem notað var til að búa til hljóðið var þjálfað með því að nota nokkur þúsund klukkustunda raddupptökur á meira en 70 tungumálum. Frammistaða fyrirhugaðrar útfærslu er nægjanleg fyrir rauntíma talkóðun og umskráningu á snjallsímum á meðalverði, með seinkun merkjasendingar upp á 90 millisekúndur.

Heimild: opennet.ru

Bæta við athugasemd