Útgáfa af OpenNMT 2.28.0 vélþýðingarkerfi

Útgáfa OpenNMT 0.28.0 (Open Neural Machine Translation) vélþýðingakerfisins, sem notar vélanámsaðferðir, hefur verið gefin út. Til að byggja upp taugakerfi notar verkefnið möguleika TensorFlow djúpa vélanámsbókasafnsins. Kóðinn á einingunum sem þróaðar eru af OpenNMT verkefninu er skrifaður í Python og dreift undir MIT leyfinu. Tilbúin líkön eru útbúin fyrir ensku, þýsku og katalónsku; fyrir önnur tungumál geturðu sjálfstætt búið til líkan byggt á gagnasetti úr OPUS verkefninu (til þjálfunar eru tvær skrár fluttar í kerfið - önnur með setningum í frummál, og annað með vandaðri þýðingu þessara setninga yfir á markmálið ).

Verkefnið er þróað með þátttöku SYSTRAN, fyrirtækis sem sérhæfir sig í að búa til vélþýðingartæki, og hóps Harvard vísindamanna sem þróa mannamálslíkön fyrir vélanámskerfi. Notendaviðmótið er eins einfaldað og hægt er og þarf aðeins að tilgreina inntaksskrá með texta og skrá til að vista þýðingarniðurstöðuna. Viðbótarkerfið gerir það mögulegt að innleiða viðbótarvirkni sem byggir á OpenNMT, til dæmis sjálfvirka samantekt, textaflokkun og gerð texta.

Notkun TensorFlow gerir þér kleift að nota getu GPU (til að flýta fyrir ferli þjálfunar taugakerfis. Til að einfalda dreifingu vörunnar er verkefnið einnig að þróa sjálfbæra útgáfu af þýðandanum í C++ - CTranslate2 , sem notar fyrirfram þjálfuð líkön án þess að vísa til viðbótar ósjálfstæðis.

Nýja útgáfan bætir við initial_learning_rate færibreytunni og útfærir nokkur ný rök (mha_bias og output_layer_bias) til að stilla Transformer líkan rafallinn. Restin er merkt með villuleiðréttingum.

Heimild: opennet.ru

Bæta við athugasemd