OpenNMT 2.28.0 mašīntulkošanas sistēmas izlaišana

Publicēts OpenNMT 0.28.0 (Open Neural Machine Translation) mašīntulkošanas sistēmas laidiens, kurā tiek izmantotas mašīnmācīšanās metodes. Lai izveidotu neironu tīklu, projektā tiek izmantotas TensorFlow dziļās mašīnmācīšanās bibliotēkas iespējas. OpenNMT projekta izstrādāto moduļu kods ir rakstīts Python un tiek izplatīts saskaņā ar MIT licenci. Gatavie modeļi ir sagatavoti angļu, vācu un katalāņu valodām, citām valodām jūs varat patstāvīgi izveidot modeli, pamatojoties uz OPUS projekta datu kopu (apmācībai uz sistēmu tiek pārsūtīti divi faili - viens ar teikumiem avota valodā, bet otrā ar kvalitatīvu šo teikumu tulkojumu mērķa valodā ).

Projekts tiek izstrādāts, piedaloties uzņēmumam SYSTRAN, kas specializējas mašīntulkošanas rīku izveidē, un Hārvardas pētnieku grupai, kas izstrādā cilvēku valodas modeļus mašīnmācīšanās sistēmām. Lietotāja saskarne ir pēc iespējas vienkāršota, un tajā ir jānorāda tikai ievades fails ar tekstu un fails, lai saglabātu tulkošanas rezultātu. Paplašinājuma sistēma ļauj ieviest uz OpenNMT balstītas papildu funkcionalitātes, piemēram, automātisko apkopošanu, teksta klasifikāciju un subtitru ģenerēšanu.

TensorFlow izmantošana ļauj izmantot GPU iespējas (lai paātrinātu neironu tīkla apmācības procesu. Lai vienkāršotu produkta izplatīšanu, projektā tiek izstrādāta arī tulkotāja pašpietiekama versija C++ valodā - CTranslate2 , kurā tiek izmantoti iepriekš apmācīti modeļi, neatsaucoties uz papildu atkarībām.

Jaunajā versijā ir pievienots parametrs origin_learning_rate un ieviesti vairāki jauni argumenti (mha_bias un output_layer_bias), lai konfigurētu transformatora modeļa ģeneratoru. Pārējais ir atzīmēts ar kļūdu labojumiem.

Avots: opennet.ru

Pievieno komentāru