OpenNMT 0.28.0(開放神經機器翻譯)機器翻譯系統現已發布,該系統採用機器學習方法。此專案利用 TensorFlow 深度機器學習庫的功能建立神經網路。 OpenNMT 專案開發的模組程式碼以 Python 編寫,並遵循 MIT 許可證發布。系統已為英語、德語和加泰羅尼亞語準備了現成的模型;對於其他語言,您可以基於 OPUS 項目的數據集獨立創建模型(需要將兩個文件傳輸到系統進行訓練:一個文件包含源語言的句子,另一個文件包含這些句子到目標語言的高品質翻譯)。
該專案由專門從事機器翻譯工具開發的公司 SYSTRAN 和一組為機器學習系統開發人類語言模型的哈佛研究人員參與開發。使用者介面盡可能簡單,只需要指定包含文字的輸入檔和用於保存翻譯結果的檔案。擴展系統使得在OpenNMT的基礎上實現附加功能成為可能,例如自動引用、文字分類和字幕生成。
TensorFlow 的使用可利用 GPU 功能(以加速神經網路訓練過程)。為了簡化產品的分發,該專案還在用 C++ 語言開發一個自給自足的翻譯器版本 - CTranslate2,它使用預先訓練的模型,而不依賴額外的依賴項。
新版本增加了initial_learning_rate參數,並實作了幾個新的參數(mha_bias和output_layer_bias)用於配置Transformer模型產生器。否則,將以錯誤更正進行標記。
來源: opennet.ru
