Amazon хоча навучыць Alexa карэктна разумець займеннікі

Разуменне і апрацоўка маўленчых спасылак - гэта вялікі выклік для накіравання апрацоўкі натуральнай мовы ў кантэксце ІІ-памочнікаў, такіх як Amazon Alexa. Дадзеная праблема, як правіла, мае на ўвазе пад сабой карэктнае асацыяванне займеннікаў у запытах карыстальнікаў з пэўнымі паняццямі, напрыклад, супастаўленне займенніка "іх" у выказванні "ўключы іх апошні альбом" з нейкім музычным выканаўцам. Спецыялісты па ІІ з Amazon актыўна працуюць над тэхналогіяй, якая б магла дапамагчы ІІ з апрацоўкай падобных запытаў пры дапамозе аўтаматычнай перафармулёўкі і замены. Так, запыт "Прайграй іх апошні альбом" будзе аўтаматычна заменены на "Прайграй апошні альбом Imagine Dragons". Пры гэтым неабходнае для замены слова падбіраецца ў адпаведнасці з імавернасным падыходам, вылічаным пры дапамозе машыннага навучання.

Amazon хоча навучыць Alexa карэктна разумець займеннікі

Навукоўцы апублікавалі папярэдні вынік сваёй працы ў прэпрынце з даволі няпростай назвай - "Маштабаванне адсочвання стану шматдаменнага дыялогу з дапамогай перафармулявання запытаў". У бліжэйшы час плануецца прэзентаваць дадзенае даследаванне ў Паўночнаамерыканскім аддзяленні Асацыяцыі камп'ютарнай лінгвістыкі.

"Паколькі наш механізм перафармулявання запытаў выкарыстоўвае агульныя прынцыпы прымянення маўленчых спасылак, ён не залежыць ад якой-небудзь спецыфічнай інфармацыі аб дадатку, дзе ён будзе прымяняцца, таму ён не патрабуе перанавучання, калі мы з яго дапамогай пашыраем магчымасці Alexa", – растлумачыў Арыт Гупта. (Arit Gupta), эксперт па лінгвістыцы ў аддзеле Amazon Alexa AI. Ён адзначыў, што іх новая тэхналогія, якая атрымала назву CQR (contextual query rewriting), поўнасцю вызваляе ўнутраны код галасавога асістэнта ад якой-небудзь турботы наконт маўленчых спасылак у запытах.


Amazon хоча навучыць Alexa карэктна разумець займеннікі

Спачатку ІІ вызначае агульны кантэкст запыту: якую інфармацыю жадае атрымаць карыстач ці якое дзеянне выканаць. У працэсе дыялогу з карыстальнікам ІІ класіфікуе ключавыя словы, захоўваючы іх у спецыяльных зменных для далейшага выкарыстання. Калі чарговы запыт будзе ўтрымоўваць якую-небудзь спасылку, то ІІ паспрабуе замяніць яе найболей верагодным з захаваных і семантычна падыходных слоў, а калі такога не апынецца ў памяці, то звернецца да ўнутранага слоўніка найболей часта выкарыстоўваных значэнняў, а затым перазбярэ запыт з ужытай заменай, каб перадаць яго далей галасавому памагатаму для выканання.

Як паказвае Гупта і яго калегі, CQR выступае як пласт папярэдняй апрацоўкі галасавых каманд і засяроджаны толькі на сінтаксічных і семантычных значэннях слоў. У эксперыментах са спецыяльна падрыхтаваным наборам дадзеных, CQR палепшыў дакладнасць апрацоўкі запытаў на 22%, калі спасылка ў бягучым запыце адносіцца да слова, якое выкарыстоўвалася ў самым апошнім адказе, і на 25%, калі спасылка ў бягучым выказванні спасылаецца на слова з папярэдняга выказванні.



Крыніца: 3dnews.ru

Дадаць каментар