Amazon huet en Dataset verëffentlecht fir Ried an 51 Sproochen ze verstoen

Amazon huet ënner enger CC BY 4.0 Lizenz de "MASSIVE" (Multilingual Amazon SLURP for Slot Filling, Intent Classification, and Virtual-Assistent Evaluation) Dataset, Modeller fir Maschinnléieresystemer, an Tools fir Är eege Modeller ze trainéieren, déi benotzt kënne ginn Informatioun iwwer natierlech Sprooch verstoen (NLU, Natural Language Understanding). De Set enthält méi wéi eng Millioun annotéiert a klasséiert Text Aussoe virbereet fir 51 Sproochen.

D'SLURP Sammlung, ursprénglech fir Englesch verfügbar, gouf als Referenz benotzt fir de MASSIVE Set ze bauen, deen a 50 anere Sprooche lokaliséiert gouf mat professionellen Iwwersetzer. Dem Alexa seng natierlech Sproochverständnis (NLU) Technologie konvertéiert éischt Ried an Text, applizéiert dann verschidde NLU Modeller op den Text, déi d'Präsenz vu Schlësselwieder analyséieren fir d'Essenz vun der Fro vum Benotzer ze bestëmmen.

Ee vun den Ziler fir de Set ze kreéieren an ze verëffentlechen ass d'Stëmmassistenten unzepassen fir Informatioun a verschiddene Sprooche gläichzäiteg ze veraarbechten, wéi och Drëtt-Partei Entwéckler ze encouragéieren Uwendungen a Servicer ze kreéieren déi d'Fäegkeete vu Stëmmassistenten ausbauen. Fir d'Opmierksamkeet vun den Entwéckler unzezéien, huet Amazon e Concours gestart fir dee beschten generesche Modell mat engem publizéierten Datesaz ze kreéieren.

De Moment ënnerstëtzen d'Stëmmassistenten nëmmen e puer Sproochen a benotzen Maschinnléiere Modeller verbonne mat enger spezifescher Sprooch. De MASSIVE Projet zielt dës Defizit z'eliminéieren andeems se universell Modeller a Maschinnléieresystemer kreéieren déi fäeg sinn Informatioun a verschiddene Sproochen ze analyséieren an ze veraarbecht.

Source: opennet.ru

Setzt e Commentaire