Amazon хоче навчити Alexa коректно розуміти займенники

Розуміння та обробка мовних посилань – це великий виклик для спрямування обробки природної мови у контексті ІІ-помічників, таких як Amazon Alexa. Ця проблема, як правило, має на увазі під собою коректне асоціювання займенників у запитах користувачів з поняттями, що розуміються, наприклад, зіставлення займенника «їх» у висловлюванні «включи їх останній альбом» з якимось музичним виконавцем. Фахівці з ІІ з Amazon активно працюють над технологією, яка могла б допомогти ІІ з обробкою подібних запитів за допомогою автоматичного переформулювання та заміни. Так, запит «Відтвори останній альбом» буде автоматично замінений на «Відтвори останній альбом Imagine Dragons». При цьому необхідне для заміни слово підбирається відповідно до ймовірнісного підходу, обчисленого за допомогою машинного навчання.

Amazon хоче навчити Alexa коректно розуміти займенники

вчені опублікували попередній результат своєї роботи в препринті з досить непростою назвою - Масштабування відстеження стану багатодоменного діалогу за допомогою переформулювання запитів. Найближчим часом планується презентувати це дослідження у Північноамериканському відділенні Асоціації комп'ютерної лінгвістики.

"Оскільки наш механізм переформулювання запитів використовує загальні принципи застосування мовних посилань, він не залежить від будь-якої специфічної інформації про додаток, де він буде застосовуватися, тому він не вимагає перенавчання, коли ми з його допомогою розширюємо можливості Alexa", - пояснив Аріт Гупта. (Arit Gupta), експерт з лінгвістики у відділі Amazon Alexa AI. Він зазначив, що їхня нова технологія, що отримала назву CQR (contextual query rewriting), повністю звільняє внутрішній код голосового асистента від будь-якого занепокоєння з приводу мовних посилань у запитах.


Amazon хоче навчити Alexa коректно розуміти займенники

Спочатку ІІ визначає загальний контекст запиту: яку інформацію хоче отримати користувач чи яку дію виконати. У процесі діалогу з користувачем ІІ класифікує ключові слова, зберігаючи їх у спеціальних змінних для подальшого використання. Якщо черговий запит буде містити будь-яке посилання, то ІІ спробує замінити її найбільш вірогідним зі збережених і семантично відповідних слів, а якщо такого не виявиться в пам'яті, то звернеться до внутрішнього словника значень, що найчастіше використовуються, а потім перезбере запит із застосованою заміною, щоб передати його голосовому помічнику для виконання.

Як вказує Гупта та його колеги, CQR виступає як шар попередньої обробки голосових команд і зосереджений лише на синтаксичних та семантичних значеннях слів. В експериментах зі спеціально підготовленим набором даних, CQR покращив точність обробки запитів на 22%, коли посилання в поточному запиті відноситься до слова, яке використовувалося в останній відповіді, і на 25%, коли посилання в поточному висловлюванні посилається на слово з попереднього висловлювання.



Джерело: 3dnews.ru

Додати коментар або відгук