Az Amazon meg akarja tanítani Alexát a névmások helyes megértésére

A beszédreferenciák megértése és feldolgozása nagy kihívást jelent a természetes nyelvi feldolgozás irányában az AI-asszisztensek, például az Amazon Alexa kontextusában. Ez a probléma általában azzal jár, hogy a felhasználói lekérdezésekben szereplő névmásokat a hallgatólagos fogalmakkal kell helyesen társítani, például a „játsszák le a legújabb albumukat” utasításban szereplő „ők” névmást valamilyen zenei előadóval. Az Amazon mesterséges intelligencia-szakértői aktívan dolgoznak olyan technológián, amely segítheti az AI-t az ilyen kérések automatikus újrafogalmazása és cseréje révén. Így a „Lejátszani a legújabb albumukat” kérés automatikusan felváltja a „Játssz le a legújabb Imagine Dragons albumot” kifejezésre. Ebben az esetben a helyettesítéshez szükséges szó kiválasztása a gépi tanulással számított valószínűségi megközelítés szerint történik.

Az Amazon meg akarja tanítani Alexát a névmások helyes megértésére

Tudósok közzétett munkájának elõzetes eredménye egy elõnyomatban, meglehetősen nehéz címmel: „A több tartományos párbeszéd skálázási állapotának követése lekérdezés újraformulációjával”. A közeljövőben a tervek szerint ezt a kutatást bemutatják az Association for Computational Linguistics észak-amerikai részlegénél.

„Mivel a lekérdezés-újraformulációs motorunk általános elveket használ a beszédhivatkozások alkalmazására, nem függ semmilyen konkrét információtól az alkalmazásról, ahol használni fogják, így nem igényel átképzést, amikor az Alexa képességeinek bővítésére használjuk” – magyarázta. Arit Gupta (Arit Gupta), az Amazon Alexa AI nyelvészeti szakértője. Megjegyezte, hogy az új technológiájuk, az úgynevezett CQR (contextual query rewriting), teljesen megszabadítja a belső hangsegéd kódot a lekérdezések beszédreferenciáival kapcsolatos aggályoktól.


Az Amazon meg akarja tanítani Alexát a névmások helyes megértésére

Először is, az AI meghatározza a kérés általános kontextusát: milyen információkat szeretne kapni a felhasználó, vagy milyen műveletet kell végrehajtania. A felhasználóval folytatott párbeszéd során az AI osztályozza a kulcsszavakat, és speciális változókban tárolja azokat további felhasználás céljából. Ha a következő kérés bármilyen hivatkozást tartalmaz, az AI megpróbálja lecserélni a tárolt és szemantikailag megfelelő szavak közül a legvalószínűbbre, és ha ez nincs a memóriában, akkor a leggyakrabban használt értékek belső szótárához fordul. , majd állítsa újra a kérést az alkalmazott cserével, hogy továbbítsa azt a hangsegédnek végrehajtásra.

Amint Gupta és munkatársai rámutatnak, a CQR a hangutasítások előfeldolgozó rétegeként működik, és csak a szavak szintaktikai és szemantikai jelentésére összpontosít. A speciálisan kiképzett adatkészlettel végzett kísérletekben a CQR 22%-kal javította a lekérdezés pontosságát, ha az aktuális lekérdezésben a hivatkozás a legutóbbi válaszban használt szóra hivatkozik, és 25%-kal, ha az aktuális kijelentésben szereplő hivatkozás egy szóra hivatkozik. egy korábbi kijelentésből.



Forrás: 3dnews.ru

Hozzászólás