تريد أمازون تعليم Alexa كيفية فهم الضمائر بشكل صحيح

يمثل فهم مراجع الكلام ومعالجتها تحديًا كبيرًا لاتجاه معالجة اللغة الطبيعية في سياق مساعدي الذكاء الاصطناعي مثل Amazon Alexa. تتضمن هذه المشكلة عادةً ربط الضمائر بشكل صحيح في استعلامات المستخدم بالمفاهيم الضمنية، على سبيل المثال، مقارنة الضمير "هم" في عبارة "تشغيل ألبومهم الأخير" مع بعض الفنانين الموسيقيين. يعمل خبراء الذكاء الاصطناعي في أمازون بنشاط على التكنولوجيا التي يمكن أن تساعد الذكاء الاصطناعي في معالجة مثل هذه الطلبات من خلال إعادة الصياغة والاستبدال التلقائي. لذلك، سيتم استبدال الطلب "تشغيل أحدث ألبوماتهم" تلقائيًا بعبارة "تشغيل أحدث ألبوم لـ Imagine Dragons". في هذه الحالة، يتم تحديد الكلمة المطلوبة للاستبدال وفقًا للمنهج الاحتمالي المحسوب باستخدام التعلم الآلي.

تريد أمازون تعليم Alexa كيفية فهم الضمائر بشكل صحيح

العلماء نشرت النتيجة الأولية لعمله في نسخة أولية بعنوان صعب إلى حد ما - "قياس تتبع حالة الحوار متعدد المجالات باستخدام إعادة صياغة الاستعلام." ومن المقرر في المستقبل القريب تقديم هذا البحث في فرع أمريكا الشمالية لجمعية اللغويات الحاسوبية.

وأوضح: “نظرًا لأن محرك إعادة صياغة الاستعلام الخاص بنا يستخدم مبادئ عامة لتطبيق روابط الكلام، فهو لا يعتمد على أي معلومات محددة حول التطبيق الذي سيتم استخدامه فيه، لذلك لا يتطلب إعادة التدريب عندما نستخدمه لتوسيع قدرات Alexa”. أريت جوبتا (أريت جوبتا)، خبيرة لغوية في Amazon Alexa AI. وأشار إلى أن تقنيتهم ​​الجديدة، التي تسمى CQR (إعادة كتابة الاستعلام السياقي)، تحرر تمامًا كود المساعد الصوتي الداخلي من أي قلق بشأن مراجع الكلام في الاستعلامات.


تريد أمازون تعليم Alexa كيفية فهم الضمائر بشكل صحيح

أولاً، يحدد الذكاء الاصطناعي السياق العام للطلب: ما هي المعلومات التي يريد المستخدم تلقيها أو الإجراء الذي يجب القيام به. أثناء الحوار مع المستخدم، يقوم الذكاء الاصطناعي بتصنيف الكلمات الرئيسية وتخزينها في متغيرات خاصة لمزيد من الاستخدام. إذا كان الطلب التالي يحتوي على أي مرجع، فسيحاول الذكاء الاصطناعي استبداله بالكلمات الأكثر احتمالية المخزنة والمناسبة لغويا، وإذا لم يكن هذا في الذاكرة، فسوف يتحول إلى القاموس الداخلي للقيم الأكثر استخداما ، ثم قم بإعادة إنشاء الطلب مع تطبيق الاستبدال، لتمريره إلى المساعد الصوتي للتنفيذ.

وكما يشير غوبتا وزملاؤه، فإن CQR يعمل كطبقة معالجة مسبقة للأوامر الصوتية ويركز فقط على المعاني النحوية والدلالية للكلمات. في التجارب التي أجريت باستخدام مجموعة بيانات مدربة خصيصًا، أدى CQR إلى تحسين دقة الاستعلام بنسبة 22% عندما يشير الارتباط الموجود في الاستعلام الحالي إلى كلمة تم استخدامها في أحدث إجابة، وبنسبة 25% عندما يشير الارتباط الموجود في الكلام الحالي إلى كلمة. من كلام سابق .



المصدر: 3dnews.ru

إضافة تعليق