Amazon 51 tilda nutqni tushunish uchun ma'lumotlar to'plamini nashr etdi

Amazon CC BY 4.0 litsenziyasi ostida "MASSIVE" (Slot to'ldirish, maqsadni tasniflash va virtual yordamchi baholash uchun ko'p tilli Amazon SLURP) ma'lumotlar to'plamini, mashinalarni o'rganish tizimlari uchun modellarni va o'z modellaringizni o'rgatish vositalarini nashr etdi. tabiiy til haqidagi ma'lumotlarni tushunish (NLU, Natural Language Understanding). To'plam 51 til uchun tayyorlangan milliondan ortiq izohli va tasniflangan matnlarni o'z ichiga oladi.

Dastlab ingliz tili uchun mavjud bo'lgan SLURP to'plami MASSIVE to'plamini yaratish uchun ma'lumotnoma sifatida ishlatilgan, u professional tarjimonlar yordamida boshqa 50 tilda mahalliylashtirilgan. Alexa’ning tabiiy tilni tushunish (NLU) texnologiyasi avvalo nutqni matnga aylantiradi, so‘ngra foydalanuvchi savolining mohiyatini aniqlash uchun kalit so‘zlar mavjudligini tahlil qiluvchi matnga bir nechta NLU modellarini qo‘llaydi.

To'plamni yaratish va nashr etishning maqsadlaridan biri ovozli yordamchilarni bir vaqtning o'zida bir nechta tillarda ma'lumotlarni qayta ishlashga moslashtirish, shuningdek, uchinchi tomon ishlab chiquvchilarini ovozli yordamchilarning imkoniyatlarini kengaytiradigan ilovalar va xizmatlarni yaratishga undashdir. Ishlab chiquvchilarning e'tiborini jalb qilish uchun Amazon nashr etilgan ma'lumotlar to'plamidan foydalangan holda eng yaxshi umumiy modelni yaratish uchun tanlovni boshladi.

Hozirgi vaqtda ovozli yordamchilar faqat bir nechta tillarni qo'llab-quvvatlaydi va ma'lum bir tilga bog'langan mashinani o'rganish modellaridan foydalanadi. MASSIVE loyihasi turli tillarda axborotni tahlil qilish va qayta ishlashga qodir bo‘lgan universal modellar va mashinani o‘rganish tizimlarini yaratish orqali ushbu kamchilikni bartaraf etishga qaratilgan.

Manba: opennet.ru

a Izoh qo'shish