Sortie du système de traduction automatique OpenNMT 2.28.0

La version du système de traduction automatique OpenNMT 0.28.0 (Open Neural Machine Translation), qui utilise des méthodes d'apprentissage automatique, a été publiée. Pour créer un réseau neuronal, le projet utilise les capacités de la bibliothèque d'apprentissage automatique profond TensorFlow. Le code des modules développés par le projet OpenNMT est écrit en Python et distribué sous licence MIT. Des modèles prêts à l'emploi sont préparés pour les langues anglaise, allemande et catalane ; pour les autres langues, vous pouvez créer indépendamment un modèle basé sur un ensemble de données du projet OPUS (pour la formation, deux fichiers sont transférés au système - un avec des phrases dans le langue source, et la seconde avec une traduction de haute qualité de ces phrases dans la langue cible).

Le projet est développé avec la participation de SYSTRAN, une société spécialisée dans la création d'outils de traduction automatique, et d'un groupe de chercheurs de Harvard développant des modèles de langage humain pour les systèmes d'apprentissage automatique. L'interface utilisateur est aussi simplifiée que possible et nécessite uniquement de spécifier un fichier d'entrée avec du texte et un fichier pour enregistrer le résultat de la traduction. Le système d'extension permet d'implémenter des fonctionnalités supplémentaires basées sur OpenNMT, par exemple le résumé automatique, la classification de texte et la génération de sous-titres.

L'utilisation de TensorFlow permet d'utiliser les capacités du GPU (pour accélérer le processus de formation d'un réseau de neurones. Pour simplifier la distribution du produit, le projet développe également une version autonome du traducteur en C++ - CTranslate2 , qui utilise des modèles pré-entraînés sans référence à des dépendances supplémentaires.

La nouvelle version ajoute le paramètre initial_learning_rate et implémente plusieurs nouveaux arguments (mha_bias et output_layer_bias) pour configurer le générateur de modèle Transformer. Le reste est marqué par des corrections de bugs.

Source: opennet.ru

Ajouter un commentaire