Amazon ต้องการสอน Alexa ให้เข้าใจสรรพนามอย่างถูกต้อง

การทำความเข้าใจและประมวลผลการอ้างอิงคำพูดถือเป็นความท้าทายครั้งใหญ่สำหรับทิศทางของการประมวลผลภาษาธรรมชาติในบริบทของผู้ช่วย AI เช่น Amazon Alexa ปัญหานี้มักเกี่ยวข้องกับการเชื่อมโยงคำสรรพนามในข้อความค้นหาของผู้ใช้กับแนวคิดโดยนัยอย่างถูกต้อง เช่น การเปรียบเทียบสรรพนาม "พวกเขา" ในข้อความ "เล่นอัลบั้มล่าสุด" กับศิลปินเพลงบางคน ผู้เชี่ยวชาญด้าน AI ที่ Amazon กำลังทำงานอย่างแข็งขันเกี่ยวกับเทคโนโลยีที่สามารถช่วย AI ประมวลผลคำขอดังกล่าวผ่านการจัดรูปแบบและการทดแทนอัตโนมัติ ดังนั้นคำขอ "เล่นอัลบั้มล่าสุดของพวกเขา" จะถูกแทนที่ด้วย "เล่นอัลบั้ม Imagine Dragons ล่าสุด" โดยอัตโนมัติ ในกรณีนี้ คำที่จำเป็นสำหรับการทดแทนจะถูกเลือกตามแนวทางความน่าจะเป็นที่คำนวณโดยใช้การเรียนรู้ของเครื่อง

Amazon ต้องการสอน Alexa ให้เข้าใจสรรพนามอย่างถูกต้อง

นักวิทยาศาสตร์ การตีพิมพ์ ผลลัพธ์เบื้องต้นของงานของเขาในการพิมพ์ล่วงหน้าด้วยชื่อที่ค่อนข้างยาก - "การติดตามสถานะของการสนทนาแบบหลายโดเมนโดยใช้การปรับรูปแบบแบบสอบถาม" ในอนาคตอันใกล้นี้ มีการวางแผนที่จะนำเสนองานวิจัยนี้ที่สาขาอเมริกาเหนือของสมาคมภาษาศาสตร์คอมพิวเตอร์

“เนื่องจากกลไกการปรับรูปแบบการสืบค้นของเราใช้หลักการทั่วไปในการใช้ลิงก์คำพูด จึงไม่ขึ้นอยู่กับข้อมูลเฉพาะใดๆ เกี่ยวกับแอปพลิเคชันที่จะใช้งาน ดังนั้นจึงไม่จำเป็นต้องมีการฝึกอบรมใหม่เมื่อเราใช้งานเพื่อขยายขีดความสามารถของ Alexa” อธิบาย Arit Gupta (Arit Gupta) ผู้เชี่ยวชาญด้านภาษาศาสตร์ที่ Amazon Alexa AI เขาตั้งข้อสังเกตว่าเทคโนโลยีใหม่ของพวกเขาที่เรียกว่า CQR (การเขียนแบบสอบถามตามบริบทใหม่) ช่วยให้โค้ดผู้ช่วยเสียงภายในปราศจากความกังวลเกี่ยวกับการอ้างอิงคำพูดในการสืบค้น


Amazon ต้องการสอน Alexa ให้เข้าใจสรรพนามอย่างถูกต้อง

ขั้นแรก AI จะกำหนดบริบททั่วไปของคำขอ: ข้อมูลใดที่ผู้ใช้ต้องการรับหรือดำเนินการใด ในระหว่างการสนทนากับผู้ใช้ AI จะจัดประเภทคำหลักและจัดเก็บไว้ในตัวแปรพิเศษเพื่อการใช้งานต่อไป หากคำขอถัดไปมีการอ้างอิงใด ๆ AI จะพยายามแทนที่ด้วยคำที่น่าจะจัดเก็บไว้และเหมาะสมที่สุดทางความหมาย และหากไม่อยู่ในหน่วยความจำก็จะเปลี่ยนเป็นพจนานุกรมภายในของค่าที่ใช้บ่อยที่สุด จากนั้นสร้างคำขอใหม่โดยใช้การแทนที่ เพื่อส่งต่อไปยังผู้ช่วยเสียงเพื่อดำเนินการ

ตามที่ Gupta และเพื่อนร่วมงานชี้ให้เห็น CQR ทำหน้าที่เป็นเลเยอร์การประมวลผลล่วงหน้าสำหรับคำสั่งเสียง และมุ่งเน้นไปที่ความหมายทางวากยสัมพันธ์และความหมายของคำเท่านั้น ในการทดลองกับชุดข้อมูลที่ได้รับการฝึกอบรมเป็นพิเศษ CQR ได้ปรับปรุงความแม่นยำในการสืบค้นขึ้น 22% เมื่อลิงก์ในการสืบค้นปัจจุบันอ้างถึงคำที่ใช้ในคำตอบล่าสุด และเพิ่มขึ้น 25% เมื่อลิงก์ในการเปล่งเสียงปัจจุบันอ้างถึงคำใดคำหนึ่ง จากคำพูดครั้งก่อน



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น