Amazon quer ensinar Alexa a entender os pronomes corretamente

Compreender e processar referências de fala é um grande desafio para o direcionamento do processamento de linguagem natural no contexto de assistentes de IA como o Amazon Alexa. Esse problema geralmente envolve associar corretamente pronomes em consultas de usuários com conceitos implícitos, por exemplo, comparar o pronome “eles” na afirmação “tocar seu último álbum” com algum artista musical. Os especialistas em IA da Amazon estão trabalhando ativamente em tecnologias que possam ajudar a IA a processar tais solicitações por meio de reformulação e substituição automáticas. Assim, a solicitação “Tocar o álbum mais recente” será automaticamente substituída por “Tocar o álbum mais recente do Imagine Dragons”. Neste caso, a palavra necessária para substituição é selecionada de acordo com uma abordagem probabilística calculada por meio de aprendizado de máquina.

Amazon quer ensinar Alexa a entender os pronomes corretamente

Cientistas publicado resultado preliminar de seu trabalho em uma pré-impressão com um título bastante difícil - “Escalonamento do rastreamento de estado do diálogo multidomínio usando reformulação de consulta”. Num futuro próximo, está prevista a apresentação desta pesquisa na filial norte-americana da Association for Computational Linguistics.

“Como nosso mecanismo de reformulação de consultas utiliza princípios gerais para aplicação de links de fala, ele não depende de nenhuma informação específica sobre a aplicação onde será utilizado, portanto não requer retreinamento quando o utilizamos para ampliar as capacidades da Alexa”, explicou Arit Gupta (Arit Gupta), especialista em linguística da Amazon Alexa AI. Ele observou que sua nova tecnologia, chamada CQR (reescrita de consulta contextual), libera completamente o código interno do assistente de voz de qualquer preocupação com referências de fala em consultas.


Amazon quer ensinar Alexa a entender os pronomes corretamente

Primeiro, a IA determina o contexto geral da solicitação: quais informações o usuário deseja receber ou qual ação realizar. Durante o diálogo com o usuário, a IA classifica as palavras-chave, armazenando-as em variáveis ​​especiais para uso posterior. Se a próxima solicitação contiver alguma referência, a IA tentará substituí-la pela palavra mais provável armazenada e semanticamente adequada e, se não estiver na memória, recorrerá ao dicionário interno dos valores mais utilizados. e, em seguida, reconstrua a solicitação com a substituição aplicada, para repassá-la ao assistente de voz para execução.

Como apontam Gupta e colegas, o CQR atua como uma camada de pré-processamento para comandos de voz e concentra-se apenas nos significados sintáticos e semânticos das palavras. Em experimentos com um conjunto de dados especialmente treinado, o CQR melhorou a precisão da consulta em 22% quando o link na consulta atual se refere a uma palavra que foi usada na resposta mais recente e em 25% quando o link na expressão atual se refere a uma palavra de um enunciado anterior.



Fonte: 3dnews.ru

Adicionar um comentário