Mozilla 发布了自己的机器翻译系统

Mozilla 发布了一个工具包,用于从一种语言到另一种语言的自给自足的机器翻译,在用户的本地系统上运行,无需借助外部服务。 该项目是佛手柑计划的一部分,由来自英国、爱沙尼亚和捷克共和国几所大学的研究人员在欧盟的财政支持下共同开发。 这些开发成果根据 MPL 2.0 许可证进行分发。

该项目包括佛手柑翻译引擎、机器学习系统自训练工具以及 14 种语言的现成模型,包括英语与俄语翻译的实验模型,反之亦然。 翻译水平可以通过在线演示进行评估。

该引擎是用 C++ 编写的,是 Marian 机器翻译框架之上的包装器,该框架使用循环神经网络 (RNN) 和基于 Transformer 的语言模型。 GPU 可用于加速训练和翻译。 Marian 框架还用于为翻译服务 Microsoft Translator 提供支持,该框架主要由 Microsoft 的工程师与爱丁堡大学和波兹南大学的研究人员一起开发。

对于 Firefox 用户,已经准备了一个用于翻译网页的插件,该插件可以在浏览器端进行翻译,而无需求助于云服务。 此前,该附加组件只能安装在测试版和夜间版本中,但现在可用于 Firefox 版本。 在浏览器插件中,最初用 C++ 编写的引擎使用 Emscripten 编译器编译为中间 WebAssembly 二进制表示形式。 在该附加组件的新功能中,值得注意的是填写网络表单时进行翻译的能力(用户用其母语输入文本,然后将其即时翻译成当前网站的语言)和质量评估自动标记有问题的翻译,以通知用户潜在的错误。

来源: opennet.ru

添加评论