Mae Amazon eisiau dysgu Alexa i ddeall rhagenwau yn gywir

Mae deall a phrosesu cyfeiriadau lleferydd yn her fawr i gyfeiriad prosesu iaith naturiol yng nghyd-destun cynorthwywyr AI fel Amazon Alexa. Mae’r broblem hon fel arfer yn golygu cysylltu rhagenwau yn gywir mewn ymholiadau defnyddwyr â chysyniadau ymhlyg, er enghraifft, cymharu’r rhagenw “nhw” yn y datganiad “chwarae eu halbwm diweddaraf” â rhai artist cerddorol. Mae arbenigwyr AI yn Amazon wrthi'n gweithio ar dechnoleg a allai helpu AI i brosesu ceisiadau o'r fath trwy ailfformiwleiddio ac amnewid awtomatig. Felly, bydd y cais “Chwarae eu halbwm diweddaraf” yn cael ei ddisodli’n awtomatig gan “Chwarae albwm diweddaraf Imagine Dragons.” Yn yr achos hwn, dewisir y gair sydd ei angen ar gyfer amnewid yn unol â dull tebygol a gyfrifir gan ddefnyddio dysgu peiriant.

Mae Amazon eisiau dysgu Alexa i ddeall rhagenwau yn gywir

Gwyddonwyr cyhoeddwyd canlyniad rhagarweiniol ei waith mewn rhagargraff gyda theitl eithaf anodd - “Scaling state track of multi-domain dialogue using query reformulation." Yn y dyfodol agos, bwriedir cyflwyno'r ymchwil hwn yng nghangen Gogledd America o'r Gymdeithas Ieithyddiaeth Gyfrifiadurol.

“Oherwydd bod ein peiriant ailfformiwleiddio ymholiad yn defnyddio egwyddorion cyffredinol ar gyfer cymhwyso cysylltiadau lleferydd, nid yw'n dibynnu ar unrhyw wybodaeth benodol am y cymhwysiad lle bydd yn cael ei ddefnyddio, felly nid oes angen ei ailhyfforddi pan fyddwn yn ei ddefnyddio i ymestyn galluoedd Alexa,” esboniodd Arit Gupta (Arit Gupta), arbenigwr ieithyddiaeth yn Amazon Alexa AI. Nododd fod eu technoleg newydd, o'r enw CQR (ailysgrifennu ymholiad cyd-destunol), yn rhyddhau'r cod cynorthwyydd llais mewnol yn llwyr rhag unrhyw bryder am gyfeiriadau lleferydd mewn ymholiadau.


Mae Amazon eisiau dysgu Alexa i ddeall rhagenwau yn gywir

Yn gyntaf, mae'r AI yn pennu cyd-destun cyffredinol y cais: pa wybodaeth y mae'r defnyddiwr am ei derbyn neu pa gamau i'w cymryd. Yn ystod y ddeialog gyda'r defnyddiwr, mae'r AI yn dosbarthu geiriau allweddol, gan eu storio mewn newidynnau arbennig i'w defnyddio ymhellach. Os yw'r cais nesaf yn cynnwys unrhyw gyfeiriad, bydd yr AI yn ceisio rhoi'r geiriau mwyaf tebygol o'r geiriau sydd wedi'u storio ac sy'n semantig addas yn ei le, ac os nad yw hyn yn y cof, bydd yn troi at eiriadur mewnol y gwerthoedd a ddefnyddir amlaf , ac yna ailadeiladu'r cais gyda'r un newydd wedi'i gymhwyso, i'w drosglwyddo i'r cynorthwyydd llais i'w ddienyddio.

Fel y mae Gupta a chydweithwyr yn nodi, mae CQR yn gweithredu fel haen rhagbrosesu ar gyfer gorchmynion llais ac yn canolbwyntio ar ystyron cystrawenyddol a semantig geiriau yn unig. Mewn arbrofion gyda set ddata sydd wedi'i hyfforddi'n arbennig, fe wnaeth CQR wella cywirdeb ymholiad 22% pan fo'r ddolen yn yr ymholiad cyfredol yn cyfeirio at air a ddefnyddiwyd yn yr ateb mwyaf diweddar, a 25% pan fo'r ddolen yn yr ymadrodd cyfredol yn cyfeirio at air o ymadrodd blaenorol.



Ffynhonnell: 3dnewyddion.ru

Ychwanegu sylw