Koodhka aqoonsiga hadalka iyo nidaamka tarjumaada waa la furay

Mashruuca OpenAI, kaas oo horumariya mashaariicda dadweynaha ee dhinaca sirdoonka macmal ah, ayaa daabacay horumarka la xidhiidha nidaamka aqoonsiga hadalka Whisper. Waxaa lagu andacoonayaa in hadalka Ingiriisida nidaamku bixiyo heerarka isku halaynta iyo saxnaanta aqoonsiga tooska ah ee u dhow aqoonsiga aadanaha. Koodhka hirgelinta tixraaca ee ku salaysan qaabka PyTorch iyo noocyo hore loo tababaray, oo diyaar u ah in la isticmaalo, ayaa la furay. Koodhku wuxuu ku furan yahay shatiga MIT.

Si loo tababaro qaabka, 680 kun oo saacadood oo xog hadal ah ayaa la isticmaalay, oo laga soo ururiyay dhowr ururin oo daboolaya luqado kala duwan iyo mawduucyo kala duwan. Qiyaastii 1/3 ee xogta hadalka ee ku lug leh tababarka waxay ku qoran yihiin luqado aan Ingiriisi ahayn. Nidaamka la soo jeediyay wuxuu si sax ah u maareeyaa xaaladaha sida dhawaaqa dhawaaqa, dhawaaqa asalka ah, iyo isticmaalka ereyada farsamada. Marka laga soo tago in hadalka loo qoro qoraal, nidaamku waxa uu sidoo kale u tarjumi karaa hadalka luqad kasta oo Ingiriisi wuxuuna ogaan karaa muuqaalka hadalka ee qulqulka maqalka.

Moodooyinka waxaa loo sameeyay laba qaab oo kala ah: qaabka luqadda Ingiriisiga iyo qaabka luuqadaha badan, kaas oo sidoo kale taageera luqadaha Ruushka, Yukreeniyaan iyo Belarusiyaanka. Dhanka kale, matalaad kasta waxaa loo qaybiyaa 5 doorasho, oo ku kala duwan cabbirka iyo tirada cabbirrada lagu daboolay qaabka. Baaxadda weynaanta, way weyn tahay saxnaanta iyo tayada aqoonsiga, laakiin sidoo kale waxay sare u kacdaa shuruudaha cabbirka xusuusta fiidiyowga GPU iyo hoos u dhigista waxqabadka. Tusaale ahaan, ikhtiyaarka ugu yar waxaa ka mid ah 39 milyan oo cabbir wuxuuna u baahan yahay 1 GB oo xusuusta fiidiyowga ah, iyo ugu badnaan waxaa ku jira 1550 milyan oo cabbir waxayna u baahan tahay 10 GB oo xusuusta fiidiyowga ah. Doorashada ugu yar ayaa 32 jeer ka dhakhso badan inta ugu badan.

Koodhka aqoonsiga hadalka iyo nidaamka tarjumaada waa la furay

Nidaamku waxa uu adeegsadaa qaab dhismeedka shabakada neerfaha ee Transformer, kaas oo ay ku jiraan cod-bixiye iyo cod-bixiye is dhex gala midba midka kale. Codka waxaa loo kala qaybiyaa 30-ilbiriqsi, kuwaas oo loo beddelo spectrogram-log-Mel oo loo diro cod-bixiyaha. Soo saarida codeeyaha waxaa loo diraa codeeyaha, kaas oo saadaaliya matalaad qoraal ah oo lagu qasay calaamado gaar ah oo u oggolaanaya, hal nooc oo guud, si loo xalliyo dhibaatooyinka sida ogaanshaha luqadda, xisaabinta taariikhda sooyaalka dhawaaqa odhaahyada, qoraalka hadalka luqado kala duwan, iyo turjumaadda Ingiriisi.

Source: opennet.ru

Add a comment