Amazon inataka kufundisha Alexa kuelewa matamshi kwa usahihi

Kuelewa na kuchakata marejeleo ya hotuba ni changamoto kubwa kwa mwelekeo wa usindikaji wa lugha asilia katika muktadha wa wasaidizi wa AI kama vile Amazon Alexa. Tatizo hili kwa kawaida huhusisha kuhusisha kwa usahihi viwakilishi katika maswali ya watumiaji na dhana zilizodokezwa, kwa mfano, kulinganisha kiwakilishi "wao" katika taarifa "cheza albamu yao ya hivi punde" na msanii fulani wa muziki. Wataalam wa AI huko Amazon wanafanya kazi kwa bidii kwenye teknolojia ambayo inaweza kusaidia AI kushughulikia maombi kama haya kupitia urekebishaji otomatiki na uingizwaji. Kwa hivyo, ombi la "Cheza albamu yao ya hivi punde" litabadilishwa kiotomatiki na "Cheza albamu ya hivi punde zaidi ya Imagine Dragons." Katika kesi hii, neno linalohitajika kwa uingizwaji huchaguliwa kwa mujibu wa mbinu ya uwezekano iliyohesabiwa kwa kutumia kujifunza kwa mashine.

Amazon inataka kufundisha Alexa kuelewa matamshi kwa usahihi

Wanasayansi iliyochapishwa matokeo ya awali ya kazi yake katika nakala ya awali yenye kichwa kigumu - "Kuongeza ufuatiliaji wa hali ya mazungumzo ya vikoa vingi kwa kutumia urekebishaji wa hoja." Katika siku za usoni, imepangwa kuwasilisha utafiti huu katika tawi la Amerika Kaskazini la Chama cha Isimu Kokotozi.

"Kwa sababu injini yetu ya urekebishaji wa hoja hutumia kanuni za jumla za kutumia viungo vya usemi, haitegemei habari yoyote maalum kuhusu programu ambayo itatumika, kwa hivyo haihitaji mafunzo tena tunapoitumia kupanua uwezo wa Alexa," alielezea. Arit Gupta (Arit Gupta), mtaalam wa isimu katika Amazon Alexa AI. Alibainisha kuwa teknolojia yao mpya, inayoitwa CQR (kuandika upya hoja ya muktadha), huweka huru kabisa msimbo wa msaidizi wa sauti wa ndani kutokana na wasiwasi wowote kuhusu marejeleo ya hotuba katika hoja.


Amazon inataka kufundisha Alexa kuelewa matamshi kwa usahihi

Kwanza, AI huamua muktadha wa jumla wa ombi: ni habari gani mtumiaji anataka kupokea au ni hatua gani ya kufanya. Wakati wa mazungumzo na mtumiaji, AI huainisha maneno, kuyahifadhi katika vijiti maalum kwa matumizi zaidi. Ikiwa ombi linalofuata lina kumbukumbu yoyote, AI itajaribu kuibadilisha na uwezekano mkubwa wa maneno yaliyohifadhiwa na yanafaa kisemantiki, na ikiwa hii haiko kwenye kumbukumbu, itageukia kamusi ya ndani ya maadili yanayotumiwa mara kwa mara. , na kisha ujenge upya ombi na uingizwaji ukitumika, ili kuipitisha kwa msaidizi wa sauti kwa ajili ya utekelezaji.

Kama Gupta na wenzake wanavyoonyesha, CQR hufanya kama safu ya utayarishaji wa amri za sauti na inazingatia tu maana za kisintaksia na kisemantiki za maneno. Katika majaribio ya seti ya data iliyofunzwa maalum, CQR iliboresha usahihi wa hoja kwa 22% wakati kiungo katika swali la sasa kinarejelea neno ambalo lilitumika katika jibu la hivi majuzi zaidi, na kwa 25% wakati kiungo katika matamshi ya sasa kinarejelea neno. kutoka kwa kauli iliyotangulia.



Chanzo: 3dnews.ru

Kuongeza maoni