D’fhoilsigh Amazon tacar sonraí chun caint a thuiscint i 51 teanga

D’fhoilsigh Amazon faoi cheadúnas CC BY 4.0 an tacar sonraí “MASSIVE” (Multilingual Amazon SLURP for Sliotán a Líonadh, Aicmiú Intinne, agus Measúnú Cúnta Fíorúil), samhlacha do chórais meaisínfhoghlama, agus uirlisí chun do mhúnlaí féin a oiliúint ar féidir iad a úsáid chun eolas ar theanga nádúrtha a thuiscint (NLU, Natural Language Understanding). Áiríonn an tacar níos mó ná milliún cainte téacs anótáilte agus rúnaicmithe a ullmhaíodh do 51 teanga.

Baineadh úsáid as an mbailiúchán SLURP, a bhí ar fáil don Bhéarla ar dtús, mar thagairt chun an tacar MASSIVE a thógáil, a logánaíodh i 50 teanga eile ag baint úsáide as aistritheoirí gairmiúla. Déanann teicneolaíocht tuiscint teanga nádúrtha Alexa (NLU) an chaint a thiontú ina théacs ar dtús, ansin cuireann sé samhlacha iomadúla NLU i bhfeidhm ar an téacs a dhéanann anailís ar láithreacht eochairfhocail chun bunbhrí cheist an úsáideora a chinneadh.

Is é ceann de na spriocanna a bhaineann leis an tacar a chruthú agus a fhoilsiú ná cúntóirí gutha a oiriúnú chun faisnéis a phróiseáil i dteangacha éagsúla ag an am céanna, chomh maith le forbróirí tríú páirtí a spreagadh chun feidhmchláir agus seirbhísí a chruthú a leathnaíonn cumais na gcúntóirí gutha. Chun aird na bhforbróirí a mhealladh, sheol Amazon comórtas chun an tsamhail cineálach is fearr a chruthú ag baint úsáide as tacar sonraí foilsithe.

Faoi láthair, ní thacaíonn cúntóirí gutha ach cúpla teanga agus úsáideann siad samhlacha meaisínfhoghlama atá ceangailte le teanga ar leith. Tá sé mar aidhm ag an tionscadal MASSIVE deireadh a chur leis an easnamh seo trí mhúnlaí uilíocha agus córais mheaisínfhoghlama a chruthú a bheidh in ann faisnéis a pharsáil agus a phróiseáil i dteangacha éagsúla.

Foinse: oscailtenet.ru

Add a comment