Lanzamento do sistema de tradución automática OpenNMT 2.28.0

Publicouse o lanzamento do sistema de tradución automática OpenNMT 0.28.0 (Open Neural Machine Translation), que utiliza métodos de aprendizaxe automática. Para construír unha rede neuronal, o proxecto utiliza as capacidades da biblioteca de aprendizaxe automática profunda TensorFlow. O código dos módulos desenvolvidos polo proxecto OpenNMT está escrito en Python e distribúese baixo a licenza MIT. Os modelos preparados están preparados para os idiomas inglés, alemán e catalán; para outros idiomas, pode crear de forma independente un modelo baseado nun conxunto de datos do proxecto OPUS (para a formación transfírense dous ficheiros ao sistema, un con frases no a lingua de orixe, e a segunda cunha tradución de alta calidade destas frases á lingua de destino).

O proxecto estase a desenvolver coa participación de SYSTRAN, empresa especializada na creación de ferramentas de tradución automática, e un grupo de investigadores de Harvard que desenvolven modelos de linguaxe humana para sistemas de aprendizaxe automática. A interface de usuario é o máis simplificada posible e só require especificar un ficheiro de entrada con texto e un ficheiro para gardar o resultado da tradución. O sistema de extensión permite implementar funcionalidades adicionais baseadas en OpenNMT, por exemplo, auto-resumo, clasificación de texto e xeración de subtítulos.

O uso de TensorFlow permítelle utilizar as capacidades da GPU (para acelerar o proceso de adestramento dunha rede neuronal. Para simplificar a distribución do produto, o proxecto tamén está a desenvolver unha versión autosuficiente do tradutor en C++ - CTranslate2 , que usa modelos adestrados previamente sen facer referencia a dependencias adicionais.

A nova versión engade o parámetro initial_learning_rate e implementa varios novos argumentos (mha_bias e output_layer_bias) para configurar o xerador de modelos Transformer. O resto está marcado por correccións de erros.

Fonte: opennet.ru

Engadir un comentario