Izdavanje OpenNMT 2.28.0 sistema mašinskog prevođenja

Objavljeno je izdanje OpenNMT 0.28.0 (Open Neural Machine Translation) sistema mašinskog prevođenja, koji koristi metode mašinskog učenja. Za izgradnju neuronske mreže, projekat koristi mogućnosti TensorFlow biblioteke dubokog mašinskog učenja. Kod modula razvijenih od strane OpenNMT projekta je napisan na Pythonu i distribuiran pod MIT licencom. Gotovi modeli su pripremljeni za engleski, njemački i katalonski jezik, a za ostale jezike možete samostalno kreirati model na osnovu skupa podataka iz OPUS projekta (za obuku se u sistem prenose dvije datoteke - jedna sa rečenicama u izvorni jezik, a drugi sa kvalitetnim prijevodom ovih rečenica na ciljni jezik).

Projekat se razvija uz učešće SYSTRAN, kompanije specijalizovane za kreiranje alata za mašinsko prevođenje, i grupe istraživača sa Harvarda koji razvijaju modele ljudskog jezika za sisteme mašinskog učenja. Korisnički interfejs je maksimalno pojednostavljen i zahteva samo navođenje ulazne datoteke sa tekstom i fajla da bi se sačuvao rezultat prevoda. Sistem proširenja omogućava implementaciju dodatnih funkcionalnosti zasnovanih na OpenNMT-u, na primjer, automatsko sažimanje, klasifikacija teksta i generiranje titlova.

Upotreba TensorFlow-a vam omogućava da koristite mogućnosti GPU-a (da biste ubrzali proces obuke neuronske mreže. Da bi se pojednostavila distribucija proizvoda, projekat takođe razvija samodovoljnu verziju prevodioca u C++ - CTranslate2 , koji koristi unaprijed obučene modele bez pozivanja na dodatne ovisnosti.

Nova verzija dodaje parametar initial_learning_rate i implementira nekoliko novih argumenata (mha_bias i output_layer_bias) za konfiguraciju generatora modela transformatora. Ostalo je obeleženo ispravkama grešaka.

izvor: opennet.ru

Dodajte komentar