Mozilla a publié son propre système de traduction automatique

Mozilla a publié une boîte à outils pour la traduction automatique autonome d’une langue à une autre, fonctionnant sur le système local de l’utilisateur sans recourir à des services externes. Le projet est développé dans le cadre de l'initiative Bergamot en collaboration avec des chercheurs de plusieurs universités du Royaume-Uni, d'Estonie et de République tchèque, avec le soutien financier de l'Union européenne. Les développements sont distribués sous licence MPL 2.0.

Le projet comprend le moteur de traduction bergamote, des outils d'auto-formation du système d'apprentissage automatique et des modèles prêts à l'emploi pour 14 langues, y compris des modèles expérimentaux pour la traduction de l'anglais vers le russe et vice versa. Le niveau de traduction peut être évalué lors d’une démonstration en ligne.

Le moteur est écrit en C++ et constitue un wrapper au-dessus du cadre de traduction automatique Marian, qui utilise un réseau neuronal récurrent (RNN) et des modèles de langage basés sur des transformateurs. Le GPU peut être utilisé pour accélérer la formation et la traduction. Le framework Marian est également utilisé pour alimenter le service de traduction Microsoft Translator et est développé principalement par des ingénieurs de Microsoft en collaboration avec des chercheurs des universités d'Édimbourg et de Poznan.

Pour les utilisateurs de Firefox, un module complémentaire a été préparé pour traduire les pages Web, qui se traduit du côté du navigateur sans recourir aux services cloud. Auparavant, le module complémentaire ne pouvait être installé que dans les versions bêta et les versions nocturnes, mais il est désormais disponible pour les versions de Firefox. Dans le module complémentaire du navigateur, le moteur, initialement écrit en C++, est compilé en une représentation binaire WebAssembly intermédiaire à l'aide du compilateur Emscripten. Parmi les nouveautés du module complémentaire, on note la possibilité de traduire tout en remplissant des formulaires web (l'utilisateur saisit le texte dans sa langue maternelle et il est traduit à la volée dans la langue du site actuel) et l'évaluation de la qualité. de traduction avec marquage automatique des traductions douteuses pour informer l'utilisateur des erreurs potentielles.

Source: opennet.ru

Ajouter un commentaire