Mozilla Wọpọ Voice 7.0 Update

NVIDIA ati Mozilla ti ṣe idasilẹ imudojuiwọn kan si awọn iwe data ohun ti o wọpọ, eyiti o pẹlu awọn ayẹwo ọrọ eniyan 182, soke 25% lati oṣu mẹfa sẹyin. Awọn data ti wa ni atẹjade bi agbegbe gbogbo eniyan (CC6). Awọn eto ti a dabaa le ṣee lo ni awọn eto ikẹkọ ẹrọ lati kọ idanimọ ọrọ ati awọn awoṣe iṣelọpọ.

Ti a bawe si imudojuiwọn ti tẹlẹ, iwọn awọn ohun elo ọrọ ti o wa ninu akojọpọ ti pọ lati 9 si 13.9 ẹgbẹrun wakati ti ọrọ. Nọmba awọn ede atilẹyin ti pọ lati 60 si 76, pẹlu atilẹyin fun igba akọkọ fun Belarusian, Kazakh, Uzbek, Bulgarian, Armenian, Azerbaijan ati awọn ede Bashkir. Eto fun ede Russian ni wiwa awọn olukopa 2136 ati awọn wakati 173 ti ohun elo ọrọ (awọn olukopa 1412 ati awọn wakati 111 wa), ati fun ede Yukirenia - awọn olukopa 615 ati awọn wakati 66 (awọn olukopa 459 ati awọn wakati 30 wa).

Die e sii ju 75 ẹgbẹrun eniyan ṣe alabapin ninu igbaradi awọn ohun elo ni ede Gẹẹsi, ti n ṣalaye awọn wakati 2637 ti ọrọ ti a fọwọsi (awọn alabaṣepọ 66 ẹgbẹrun ati awọn wakati 1686 wa). O yanilenu, ede ti o wa ni ipo keji ni awọn ofin ti iye data ti a kojọpọ jẹ Rwanda, eyiti a ti gba awọn wakati 2260 fun. Eyi ni atẹle nipasẹ German (1040), Catalan (920) ati Esperanto (840). Lara pupọ julọ ti n pọ si iwọn data ohun ni ede Thai (ilosoke ilọpo 20 ni ipilẹ, lati awọn wakati 12 si 250), Luganda (lati awọn wakati 8 si 80), Esperanto (lati awọn wakati 100 si 840) ati Tamil ( lati 24 si 220 wakati).

Gẹgẹbi apakan ti ikopa rẹ ninu iṣẹ akanṣe Ohun Wọpọ, NVIDIA pese awọn awoṣe ikẹkọ ti o ti ṣetan fun awọn eto ikẹkọ ẹrọ ti o da lori data ti a gba (atilẹyin nipasẹ PyTorch). Awọn awoṣe ti pin bi apakan ti ọfẹ ati ṣiṣi ohun elo irinṣẹ NVIDIA NeMo, eyiti, fun apẹẹrẹ, ti lo tẹlẹ ninu awọn iṣẹ ohun adaṣe adaṣe ti MTS ati Sberbank. Awọn awoṣe jẹ ipinnu fun lilo ninu idanimọ ọrọ, sisọpọ ọrọ, ati awọn eto ṣiṣatunṣe ede adayeba, ati pe o le wulo fun awọn oniwadi kikọ awọn ọna ṣiṣe ifọrọwerọ ohun-ṣiṣẹ, awọn iru ẹrọ ikọsilẹ, ati awọn ile-iṣẹ ipe adaṣe. Ko dabi awọn iṣẹ akanṣe ti o wa tẹlẹ, awọn awoṣe ti a tẹjade ko ni opin si idanimọ ede Gẹẹsi ati bo ọpọlọpọ awọn ede, awọn asẹnti ati awọn fọọmu ọrọ.

Jẹ ki a leti pe iṣẹ akanṣe Ohun Wọpọ ni ifọkansi lati ṣeto iṣẹ apapọ lati ṣajọpọ data data ti awọn ilana ohun ti o ṣe akiyesi oniruuru ti awọn ohun ati awọn ọna ọrọ. A pe awọn olumulo si awọn gbolohun ọrọ ti o han loju iboju tabi ṣe iṣiro didara data ti a ṣafikun nipasẹ awọn olumulo miiran. Ibi ipamọ data ti a kojọpọ pẹlu awọn igbasilẹ ti ọpọlọpọ awọn pronunciations ti awọn gbolohun ọrọ aṣoju ti ọrọ eniyan le ṣee lo laisi awọn ihamọ ninu awọn eto ẹkọ ẹrọ ati ni awọn iṣẹ akanṣe iwadi.

Gẹgẹbi onkọwe ti ile-ikawe idanimọ ọrọ ti Vosk lemọlemọfún, awọn aila-nfani ti ṣeto ohun ti o wọpọ jẹ apa kan ti ohun elo ohun (ipo ti awọn ọkunrin ti o jẹ ọdun 20-30, ati aini ohun elo pẹlu awọn ohun ti awọn obinrin , awọn ọmọde ati awọn agbalagba), aisi iyipada ninu iwe-itumọ (atunṣe awọn gbolohun ọrọ kanna) ati pinpin awọn igbasilẹ ni ọna kika MP3 ti o ni iyipada.

orisun: opennet.ru

Fi ọrọìwòye kun