Amazon, CC BY 4.0 lisenziyası altında maşın öyrənmə sistemləri üçün modellər və təbii dil anlaşılması (NLU) üçün xüsusi modellərin öyrədilməsi üçün alətlər dəsti ilə birlikdə "MASSIVE" (Yer Doldurma, Niyyət Təsnifatı və Virtual Köməkçi Qiymətləndirmə üçün Çoxdilli Amazon SLURP) məlumat dəstini buraxdı. Məlumat dəstinə 51 dildə bir milyondan çox annotasiyalı və təsnif edilmiş mətn ifadələri daxildir.
Əvvəlcə ingilis dilində mövcud olan və peşəkar tərcüməçilərin köməyi ilə 50 başqa dilə lokallaşdırılmış SLURP kolleksiyası, MASSIVE məlumat dəstini qurmaq üçün etalon kimi istifadə edilmişdir. Alexa səs köməkçisində istifadə edilən təbii dil anlama (NLU) texnologiyası əvvəlcə nitqi mətnə çevirir və sonra istifadəçinin sualının mahiyyətini müəyyən etmək üçün açar sözlərin mövcudluğunu təhlil edərək mətnə bir neçə NLU modelini tətbiq edir.
Məlumat dəstini yaratmaq və dərc etmək məqsədlərindən biri səs köməkçilərini eyni vaxtda bir neçə dildə məlumatları emal etməyə uyğunlaşdırmaq, eləcə də üçüncü tərəf tərtibatçılarını səs köməkçilərinin imkanlarını genişləndirən tətbiqlər və xidmətlər yaratmağa təşviq etməkdir. Tərtibatçıların diqqətini cəlb etmək üçün Amazon dərc olunmuş məlumat dəstindən istifadə edərək ən yaxşı universal model yaratmaq üçün müsabiqə elan etdi.
Hazırda səs köməkçiləri yalnız bir neçə dili dəstəkləyir və dilə xas maşın öyrənmə modellərindən istifadə edir. MASSIVE layihəsi, birdən çox dildə məlumatı təhlil edə və emal edə bilən universal maşın öyrənmə modelləri və sistemləri yaratmaqla bu çatışmazlığı aradan qaldırmağı hədəfləyir.
Mənbə: opennet.ru
