Lançamento do sistema de tradução automática OpenNMT 2.28.0

Foi publicado o lançamento do sistema de tradução automática OpenNMT 0.28.0 (Open Neural Machine Translation), que utiliza métodos de aprendizado de máquina. Para construir uma rede neural, o projeto usa os recursos da biblioteca de aprendizado de máquina profundo TensorFlow. O código dos módulos desenvolvidos pelo projeto OpenNMT é escrito em Python e distribuído sob licença MIT. Modelos prontos são preparados para os idiomas inglês, alemão e catalão; para outros idiomas, você pode criar de forma independente um modelo baseado em um conjunto de dados do projeto OPUS (para treinamento, dois arquivos são transferidos para o sistema - um com frases no idioma de origem, e o segundo com uma tradução de alta qualidade dessas frases para o idioma de destino).

O projeto está sendo desenvolvido com a participação da SYSTRAN, empresa especializada na criação de ferramentas de tradução automática, e de um grupo de pesquisadores de Harvard que desenvolve modelos de linguagem humana para sistemas de aprendizado de máquina. A interface do usuário é o mais simplificada possível e requer apenas a especificação de um arquivo de entrada com texto e um arquivo para salvar o resultado da tradução. O sistema de extensão permite implementar funcionalidades adicionais baseadas em OpenNMT, por exemplo, resumo automático, classificação de texto e geração de legendas.

O uso do TensorFlow permite utilizar os recursos da GPU (para agilizar o processo de treinamento de uma rede neural. Para simplificar a distribuição do produto, o projeto também está desenvolvendo uma versão autossuficiente do tradutor em C++ - CTranslate2 , que usa modelos pré-treinados sem referência a dependências adicionais.

A nova versão adiciona o parâmetro inicial_learning_rate e implementa vários novos argumentos (mha_bias e output_layer_bias) para configurar o gerador de modelo do Transformer. O resto é marcado por correções de bugs.

Fonte: opennet.ru

Adicionar um comentário