Amazon muốn dạy Alexa hiểu đại từ một cách chính xác

Việc hiểu và xử lý các tham chiếu giọng nói là một thách thức lớn đối với định hướng xử lý ngôn ngữ tự nhiên trong bối cảnh trợ lý AI như Amazon Alexa. Vấn đề này thường liên quan đến việc liên kết chính xác các đại từ trong truy vấn của người dùng với các khái niệm ngụ ý, chẳng hạn như so sánh đại từ “họ” trong câu “phát album mới nhất của họ” với một số nghệ sĩ âm nhạc. Các chuyên gia AI tại Amazon đang tích cực nghiên cứu công nghệ có thể giúp AI xử lý các yêu cầu như vậy thông qua việc tự động cải tiến và thay thế. Vì vậy, yêu cầu “Phát album mới nhất của họ” sẽ tự động được thay thế bằng “Phát album Imagine Dragons mới nhất”. Trong trường hợp này, từ cần thay thế được chọn theo phương pháp xác suất được tính toán bằng máy học.

Amazon muốn dạy Alexa hiểu đại từ một cách chính xác

Các nhà khoa học xuất bản kết quả sơ bộ của công việc của anh ấy trong một bản in trước có tiêu đề khá khó - “Theo dõi trạng thái mở rộng quy mô của đối thoại đa miền bằng cách sử dụng cấu trúc lại truy vấn.” Trong thời gian tới, dự kiến ​​sẽ trình bày nghiên cứu này tại chi nhánh Bắc Mỹ của Hiệp hội Ngôn ngữ học tính toán.

“Bởi vì công cụ cải cách truy vấn của chúng tôi sử dụng các nguyên tắc chung để áp dụng liên kết giọng nói nên nó không phụ thuộc vào bất kỳ thông tin cụ thể nào về ứng dụng mà nó sẽ được sử dụng, do đó, nó không yêu cầu đào tạo lại khi chúng tôi sử dụng nó để mở rộng khả năng của Alexa,” giải thích Arit Gupta (Arit Gupta), chuyên gia ngôn ngữ học tại Amazon Alexa AI. Ông lưu ý rằng công nghệ mới của họ, được gọi là CQR (viết lại truy vấn theo ngữ cảnh), giải phóng hoàn toàn mã trợ lý giọng nói nội bộ khỏi mọi lo ngại về tham chiếu giọng nói trong truy vấn.


Amazon muốn dạy Alexa hiểu đại từ một cách chính xác

Đầu tiên, AI xác định bối cảnh chung của yêu cầu: người dùng muốn nhận thông tin gì hoặc hành động nào cần thực hiện. Trong quá trình đối thoại với người dùng, AI sẽ phân loại từ khóa, lưu trữ chúng trong các biến đặc biệt để sử dụng tiếp. Nếu yêu cầu tiếp theo chứa bất kỳ tham chiếu nào, AI sẽ cố gắng thay thế nó bằng những từ có khả năng nhất trong số các từ được lưu trữ và phù hợp về mặt ngữ nghĩa, và nếu từ này không có trong bộ nhớ, nó sẽ chuyển sang từ điển nội bộ của các giá trị được sử dụng thường xuyên nhất , sau đó xây dựng lại yêu cầu có áp dụng thay thế để chuyển yêu cầu đó cho trợ lý giọng nói để thực hiện.

Như Gupta và các đồng nghiệp đã chỉ ra, CQR hoạt động như một lớp tiền xử lý cho lệnh thoại và chỉ tập trung vào ý nghĩa cú pháp và ngữ nghĩa của từ. Trong các thử nghiệm với tập dữ liệu được huấn luyện đặc biệt, CQR đã cải thiện độ chính xác của truy vấn lên 22% khi liên kết trong truy vấn hiện tại đề cập đến một từ được sử dụng trong câu trả lời gần đây nhất và 25% khi liên kết trong cách phát âm hiện tại đề cập đến một từ từ lời nói trước đó.



Nguồn: 3dnews.ru

Thêm một lời nhận xét