OpenNMT 2.28.0机器翻译系统发布

采用机器学习方法的OpenNMT 0.28.0(开放神经机器翻译)机器翻译系统已经发布。 为了构建神经网络,该项目使用 TensorFlow 深度机器学习库的功能。 OpenNMT 项目开发的模块代码是用 Python 编写的,并在 MIT 许可证下分发。 现成的模型适用于英语、德语和加泰罗尼亚语;对于其他语言,您可以根据 OPUS 项目的数据集独立创建模型(为了进行训练,将两个文件传输到系统 - 一个文件中包含句子)源语言,第二个将这些句子高质量翻译成目标语言)。

该项目是在 SYSTRAN(一家专门创建机器翻译工具的公司)和一群为机器学习系统开发人类语言模型的哈佛大学研究人员的参与下开发的。 用户界面尽可能简化,只需要指定一个包含文本的输入文件和一个保存翻译结果的文件。 扩展系统可以实现基于OpenNMT的附加功能,例如自动摘要、文本分类和字幕生成。

使用 TensorFlow 可以让您使用 GPU 的功能(以加快训练神经网络的过程)。为了简化产品的分发,该项目还在开发一个自给自足的 C++ 翻译器版本 - CTranslate2 ,它使用预先训练的模型,而不参考其他依赖项。

新版本添加了initial_learning_rate参数并实现了几个新参数(mha_bias和output_layer_bias)来配置Transformer模型生成器。 其余部分已修复错误。

来源: opennet.ru

添加评论