Lansarea sistemului de traducere automată OpenNMT 2.28.0

A fost publicată lansarea sistemului de traducere automată OpenNMT 0.28.0 (Open Neural Machine Translation), care utilizează metode de învățare automată. Pentru a construi o rețea neuronală, proiectul folosește capacitățile bibliotecii de învățare automată profundă TensorFlow. Codul modulelor dezvoltate de proiectul OpenNMT este scris în Python și distribuit sub licența MIT. Modelele gata sunt pregătite pentru limbile engleză, germană și catalană pentru alte limbi, puteți crea în mod independent un model bazat pe un set de date din proiectul OPUS (pentru instruire, două fișiere sunt transferate în sistem - unul cu propoziții în limba sursă, iar al doilea cu o traducere de înaltă calitate a acestor propoziții în limba țintă).

Proiectul este dezvoltat cu participarea SYSTRAN, o companie specializată în crearea de instrumente de traducere automată și a unui grup de cercetători de la Harvard care dezvoltă modele de limbaj uman pentru sistemele de învățare automată. Interfața cu utilizatorul este cât se poate de simplificată și necesită doar specificarea unui fișier de intrare cu text și a unui fișier pentru a salva rezultatul traducerii. Sistemul de extensie face posibilă implementarea de funcționalități suplimentare bazate pe OpenNMT, de exemplu, rezumarea automată, clasificarea textului și generarea de subtitrări.

Utilizarea TensorFlow vă permite să utilizați capacitățile GPU-ului (pentru a accelera procesul de antrenare a unei rețele neuronale. Pentru a simplifica distribuția produsului, proiectul dezvoltă și o versiune autosuficientă a traductorului în C++ - CTranslate2 , care utilizează modele pre-antrenate fără referire la dependențe suplimentare.

Noua versiune adaugă parametrul initial_learning_rate și implementează mai multe argumente noi (mha_bias și output_layer_bias) pentru a configura generatorul de modele Transformer. Restul este marcat de remedieri de erori.

Sursa: opennet.ru

Adauga un comentariu