Amazon ippubblikat taħt liċenzja CC BY 4.0 is-sett tad-dejta "MASSIVE" (Multilingual Amazon SLURP għal Slot Filling, Intent Classification, and Virtual-assistant Evalwazzjoni), mudelli għal sistemi ta' tagħlim bil-magni, u għodod għat-taħriġ tal-mudelli tiegħek stess li jistgħu jintużaw biex tifhem informazzjoni dwar il-lingwa naturali (NLU, Natural Language Understanding). Is-sett jinkludi aktar minn miljun kelma ta' test annotata u klassifikata ppreparata għal 51 lingwa.
Il-kollezzjoni SLURP, oriġinarjament disponibbli għall-Ingliż, intużat bħala referenza għall-bini tas-sett MASSIV, li ġie lokalizzat f'50 lingwa oħra bl-użu ta' tradutturi professjonali. It-teknoloġija tal-fehim tal-lingwa naturali (NLU) ta 'Alexa l-ewwel tikkonverti d-diskors f'test, imbagħad tapplika mudelli multipli NLU għat-test li janalizza l-preżenza tal-kliem kjavi biex tiddetermina l-essenza tal-mistoqsija tal-utent.
Wieħed mill-għanijiet tal-ħolqien u l-pubblikazzjoni tas-sett huwa li jadattaw l-assistenti tal-vuċi biex jipproċessaw l-informazzjoni f'diversi lingwi f'daqqa, kif ukoll li jinkoraġġixxu lill-iżviluppaturi ta 'partijiet terzi biex joħolqu applikazzjonijiet u servizzi li jespandu l-kapaċitajiet tal-assistenti tal-vuċi. Biex tattira l-attenzjoni tal-iżviluppaturi, Amazon nediet kompetizzjoni biex toħloq l-aħjar mudell ġeneriku bl-użu ta 'dataset ippubblikat.
Bħalissa, l-assistenti tal-vuċi jappoġġjaw biss ftit lingwi u jużaw mudelli ta 'tagħlim tal-magni marbuta ma' lingwa speċifika. Il-proġett MASSIVE għandu l-għan li jelimina dan in-nuqqas billi joħloq mudelli universali u sistemi ta’ tagħlim bil-magni li kapaċi jparsjaw u jipproċessaw l-informazzjoni f’lingwi differenti.
Sors: opennet.ru
