Amazon publiseer spraakbegripdatastel in 51 tale

Amazon het onder 'n CC BY 4.0-lisensie die "MASSIVE" (Multilingual Amazon SLURP for Slot Filling, Intent Classification, and Virtual-Assistant Evaluation) datastel, modelle vir masjienleerstelsels en gereedskap vir die opleiding van jou eie modelle gepubliseer wat gebruik kan word om inligting oor natuurlike taal (NLU, Natural Language Understanding) te verstaan. Die stel bevat meer as 'n miljoen geannoteerde en geklassifiseerde teksuitsprake wat vir 51 tale voorberei is.

Die SLURP-versameling, oorspronklik beskikbaar vir Engels, is gebruik as verwysing vir die bou van die MASSIVE-stel, wat in 50 ander tale gelokaliseer is met behulp van professionele vertalers. Alexa se natuurlike taalverstaan ​​(NLU)-tegnologie skakel eers spraak in teks om, en pas dan veelvuldige NLU-modelle toe op die teks wat die teenwoordigheid van sleutelwoorde ontleed om die essensie van die gebruiker se vraag te bepaal.

Een van die doelwitte van die skep en publisering van die stel is om stemassistente aan te pas om inligting in verskeie tale gelyktydig te verwerk, asook om derdeparty-ontwikkelaars aan te moedig om toepassings en dienste te skep wat die vermoΓ«ns van stemassistente uitbrei. Om die aandag van ontwikkelaars te trek, het Amazon 'n kompetisie geloods om die beste generiese model te skep deur 'n gepubliseerde datastel te gebruik.

Tans ondersteun stemassistente slegs 'n paar tale en gebruik masjienleermodelle wat aan 'n spesifieke taal gekoppel is. Die MASSIVE-projek het ten doel om hierdie tekortkoming uit te skakel deur universele modelle en masjienleerstelsels te skep wat in staat is om inligting in verskillende tale te ontleed en te verwerk.

Bron: opennet.ru

Voeg 'n opmerking