Amazon vill kenna Alexa að skilja fornöfn rétt

Að skilja og vinna úr talvísunum er stór áskorun fyrir stefnu náttúrulegrar málvinnslu í samhengi við gervigreind aðstoðarmenn eins og Amazon Alexa. Þetta vandamál felur venjulega í sér að tengja fornafn í notendafyrirspurnum rétt við óbein hugtök, til dæmis að bera saman fornafnið „þeim“ í yfirlýsingunni „spila nýjustu plötuna sína“ við einhvern tónlistarmann. Sérfræðingar í gervigreindum hjá Amazon eru virkir að vinna að tækni sem gæti hjálpað gervigreind að vinna úr slíkum beiðnum með sjálfvirkri umbreytingu og endurnýjun. Svo, beiðninni „Spilaðu nýjustu plötuna þeirra“ verður sjálfkrafa skipt út fyrir „Spiltu nýjustu Imagine Dragons plötuna“. Í þessu tilviki er orðið sem þarf til að skipta um valið í samræmi við líkindaaðferð sem er reiknuð með vélanámi.

Amazon vill kenna Alexa að skilja fornöfn rétt

Vísindamenn birt bráðabirgðaniðurstöður vinnu hans í forprentun með frekar erfiðum titli - "Skalað mælingar á ástandsmælingum fjöllénasamræðna með því að nota fyrirspurn umbreytingu." Á næstunni er fyrirhugað að kynna þessar rannsóknir í Norður-Ameríkudeild Samtaka um tölvumálvísindi.

„Vegna þess að fyrirspurnabreytingarvélin okkar notar almennar meginreglur til að nota taltengla, þá er hún ekki háð neinum sérstökum upplýsingum um forritið þar sem það verður notað, svo það þarf ekki endurmenntun þegar við notum það til að auka getu Alexa,“ útskýrði Arit Gupta (Arit Gupta), málvísindafræðingur hjá Amazon Alexa AI. Hann benti á að ný tækni þeirra, sem kallast CQR (samhengisspurningarendurskrifun), leysir innri raddaðstoðarkóðann algjörlega frá öllum áhyggjum af taltilvísunum í fyrirspurnum.


Amazon vill kenna Alexa að skilja fornöfn rétt

Í fyrsta lagi ákvarðar gervigreind almennt samhengi beiðninnar: hvaða upplýsingar notandinn vill fá eða hvaða aðgerð á að framkvæma. Í samræðum við notandann flokkar gervigreind leitarorð og geymir þau í sérstökum breytum til frekari notkunar. Ef næsta beiðni inniheldur einhverja tilvísun mun gervigreindin reyna að skipta henni út fyrir líklegast geymd og merkingarlega hentug orð, og ef þetta er ekki í minni mun það snúa sér í innri orðabókina með algengustu gildunum , og endurbyggðu síðan beiðnina með endurnýjuninni beitt, til að senda hana áfram til raddaðstoðarmannsins til framkvæmdar.

Eins og Gupta og félagar benda á, virkar CQR sem forvinnslulag fyrir raddskipanir og einblínir aðeins á setningafræðilega og merkingarlega merkingu orða. Í tilraunum með sérþjálfað gagnasafn bætti CQR nákvæmni fyrirspurnar um 22% þegar hlekkurinn í núverandi fyrirspurn vísar í orð sem var notað í nýjasta svarinu og um 25% þegar hlekkurinn í núverandi framburði vísar í orð úr fyrri framburði.



Heimild: 3dnews.ru

Bæta við athugasemd