機械学習手法を用いた機械翻訳システム OpenNMT 0.28.0 (Open Neural Machine Translation) のリリースが公開されました。 ニューラル ネットワークを構築するために、プロジェクトでは TensorFlow 深層機械学習ライブラリの機能を使用します。 OpenNMT プロジェクトによって開発されたモジュールのコードは Python で書かれており、MIT ライセンスに基づいて配布されます。 英語、ドイツ語、カタロニア語用に既製のモデルが用意されています。他の言語については、OPUS プロジェクトのデータセットに基づいてモデルを個別に作成できます (トレーニング用に、XNUMX つのファイルがシステムに転送されます。XNUMX つはテキスト内の文です) XNUMX つはソース言語、もう XNUMX つはこれらの文をターゲット言語に高品質に翻訳したものです)。
このプロジェクトは、機械翻訳ツールの作成を専門とする企業である SYSTRAN と、機械学習システム用の人間言語モデルを開発しているハーバード大学の研究者のグループの参加により開発されています。 ユーザー インターフェイスは可能な限り簡素化されており、テキストを含む入力ファイルと翻訳結果を保存するファイルを指定するだけです。 拡張システムにより、OpenNMT に基づく追加機能 (自動要約、テキスト分類、字幕生成など) を実装できます。
TensorFlow を使用すると、GPU の機能を使用できるようになります (ニューラル ネットワークのトレーニング プロセスを高速化するため)。製品の配布を簡素化するために、プロジェクトでは、C++ でのトランスレーターの自己完結型バージョン (CTranslate2) も開発しています。 、追加の依存関係を参照せずに、事前トレーニングされたモデルを使用します。
新しいバージョンでは、initial_learning_rate パラメーターが追加され、Transformer モデル ジェネレーターを構成するためのいくつかの新しい引数 (mha_bias および Output_layer_bias) が実装されています。 残りはバグ修正によってマークされています。
出所: オープンネット.ru