Google ti ṣe atẹjade kodẹki ohun ohun Lyra fun gbigbe ọrọ ni didara asopọ ti ko dara

Google ti ṣafihan kodẹki ohun titun kan, Lyra, iṣapeye lati ṣaṣeyọri didara ohun ti o pọ julọ paapaa nigba lilo awọn ikanni ibaraẹnisọrọ ti o lọra pupọ. Koodu imuse Lyra ni a kọ sinu C ++ ati ṣii labẹ iwe-aṣẹ Apache 2.0, ṣugbọn laarin awọn igbẹkẹle ti o nilo fun iṣiṣẹ ni ile-ikawe ohun-ini libsparse_inference.so pẹlu imuse ekuro fun awọn iṣiro mathematiki. O ṣe akiyesi pe ile-ikawe ohun-ini jẹ igba diẹ - ni ọjọ iwaju Google ṣe ileri lati ṣe agbekalẹ rirọpo ṣiṣi ati pese atilẹyin fun awọn iru ẹrọ lọpọlọpọ.

Ni awọn ofin ti didara data ohun ti a firanṣẹ ni awọn iyara kekere, Lyra ga ni pataki si awọn kodẹki ibile ti o lo awọn ọna ṣiṣe ifihan agbara oni-nọmba. Lati ṣaṣeyọri gbigbe ohun didara ga ni awọn ipo ti iye to lopin ti alaye gbigbe, ni afikun si awọn ọna mora ti funmorawon ohun ati iyipada ifihan agbara, Lyra nlo awoṣe ọrọ ti o da lori eto ẹkọ ẹrọ, eyiti o fun ọ laaye lati tun alaye ti o padanu ti o da lori aṣoju ọrọ abuda. Awoṣe ti a lo lati ṣe agbejade ohun naa ni ikẹkọ ni lilo ọpọlọpọ awọn wakati awọn gbigbasilẹ ohun ni diẹ sii ju awọn ede 70 lọ.

Google ti ṣe atẹjade kodẹki ohun ohun Lyra fun gbigbe ọrọ ni didara asopọ ti ko dara

Kodẹki naa pẹlu kooduopo ati oluyipada kan. Alugoridimu kooduopo naa ṣan silẹ lati yọkuro awọn aye data ohun ni gbogbo 40 milliseconds, funmorawon wọn, ati gbigbe wọn ranṣẹ si olugba lori nẹtiwọọki naa. Ikanni ibaraẹnisọrọ pẹlu iyara ti 3 kilobits fun iṣẹju kan to fun gbigbe data. Awọn paramita ohun afetigbọ ti a fa jade pẹlu awọn spectrograms logarithmic mel ti o ṣe akiyesi awọn abuda agbara ti ọrọ ni awọn sakani igbohunsafẹfẹ oriṣiriṣi ati ti murasilẹ ni akiyesi awoṣe ti iwoye igbọran eniyan.

Google ti ṣe atẹjade kodẹki ohun ohun Lyra fun gbigbe ọrọ ni didara asopọ ti ko dara

Oluyipada naa nlo awoṣe ipilẹṣẹ ti, da lori awọn aye ohun afetigbọ ti a tan kaakiri, tun ṣe ifihan agbara ọrọ. Lati dinku idiju ti awọn iṣiro, awoṣe iwuwo fẹẹrẹ kan ti o da lori nẹtiwọọki ti nẹtiwọọki loorekoore ni a lo, eyiti o jẹ iyatọ ti awoṣe synthesis Ọrọ WaveRNN, eyiti o nlo igbohunsafẹfẹ iṣapẹẹrẹ kekere, ṣugbọn n ṣe awọn ifihan agbara pupọ ni afiwe ni oriṣiriṣi awọn sakani igbohunsafẹfẹ. Awọn ifihan agbara ti o yọrisi lẹhinna ni a fi agbara mu lati ṣe agbejade ifihan iṣejade ẹyọkan ti o baamu si oṣuwọn iṣapẹẹrẹ pàtó kan.

Awọn ilana ero isise amọja ti o wa ni awọn ilana ARM 64-bit tun lo fun isare. Bi abajade, laibikita lilo ẹkọ ẹrọ, kodẹki Lyra le ṣee lo fun fifi koodu ọrọ si akoko gidi ati iyipada lori awọn fonutologbolori aarin-aarin, ti n ṣe afihan lairi gbigbe ifihan agbara ti 90 milliseconds.

orisun: opennet.ru

Fi ọrọìwòye kun