Амазон 51 хэлээр яриаг ойлгох мэдээллийн багц нийтлэв

Амазон нь CC BY 4.0 лицензийн дагуу "MASSIVE" (Олон хэлтэй Amazon SLURP for Slot Filling, Intent Classification, Virtual Asistant Evaluation) өгөгдлийн багц, машин сургалтын системд зориулсан загварууд болон өөрийн загвараа сургах хэрэгслүүдийг нийтлэв. байгалийн хэлний талаархи мэдээллийг ойлгох (NLU, Байгалийн хэлний ойлголт). Энэхүү багцад 51 хэлээр бэлтгэсэн нэг сая гаруй тайлбартай, ангилсан текстийн үгс багтсан болно.

Англи хэл дээр анх худалдаанд гарсан SLURP цуглуулгыг MASSIVE багцыг бүтээхэд лавлагаа болгон ашигласан бөгөөд энэ нь мэргэжлийн орчуулагчид ашиглан өөр 50 хэл дээр орчуулагдсан. Alexa-ийн байгалийн хэлний ойлголт (NLU) технологи нь эхлээд яриаг текст болгон хувиргаж, дараа нь хэрэглэгчийн асуултын мөн чанарыг тодорхойлохын тулд түлхүүр үгс байгаа эсэхийг шинжилдэг олон NLU загварыг текстэд ашигладаг.

Энэхүү багцыг бий болгох, нийтлэх нэг зорилго бол дуут туслахуудыг нэг дор хэд хэдэн хэл дээр мэдээлэл боловсруулахад тохируулах, мөн гуравдагч талын хөгжүүлэгчдийг дуут туслахын чадавхийг өргөжүүлэх програм, үйлчилгээг бий болгоход урамшуулах явдал юм. Хөгжүүлэгчдийн анхаарлыг татахын тулд Амазон нийтлэгдсэн өгөгдлийн багцыг ашиглан шилдэг ерөнхий загварыг бүтээх уралдааныг эхлүүлсэн.

Одоогийн байдлаар дуут туслахууд хэдхэн хэлийг дэмждэг бөгөөд тодорхой хэлтэй холбоотой машин сургалтын загварыг ашигладаг. MASSIVE төсөл нь янз бүрийн хэл дээрх мэдээллийг задлан шинжлэх, боловсруулах чадвартай бүх нийтийн загвар, машин сургалтын системийг бий болгох замаар энэхүү дутагдлыг арилгах зорилготой юм.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх