OpenNMT 2.28.0 masintõlkesüsteemi väljalase

Avaldatud on masinõppe meetodeid kasutava masintõlkesüsteemi OpenNMT 0.28.0 (Open Neural Machine Translation) väljalase. Neuraalvõrgu ehitamiseks kasutab projekt TensorFlow sügava masinõppe raamatukogu võimalusi. OpenNMT projektiga arendatud moodulite kood on kirjutatud Pythonis ja levitatakse MIT litsentsi all. Valmismudelid on ette valmistatud inglise, saksa ja katalaani keelte jaoks, teiste keelte jaoks saate iseseisvalt luua mudeli OPUS-projekti andmestiku põhjal (koolituse jaoks kantakse süsteemi kaks faili - ühes on laused lähtekeelde ja teine ​​nende lausete kvaliteetse tõlkega sihtkeelde ).

Projekti arendamisel osalevad masintõlketööriistade loomisele spetsialiseerunud ettevõte SYSTRAN ja rühm Harvardi teadlasi, kes arendavad masinõppesüsteemide inimkeele mudeleid. Kasutajaliides on võimalikult lihtsustatud ja nõuab vaid tekstiga sisendfaili ja faili määramist tõlketulemuse salvestamiseks. Laiendussüsteem võimaldab rakendada OpenNMT-l põhinevaid lisafunktsionaalsusi, näiteks automaatset kokkuvõtet, teksti liigitamist ja subtiitrite genereerimist.

TensorFlow kasutamine võimaldab kasutada GPU võimalusi (närvivõrgu treenimise protsessi kiirendamiseks. Toote levitamise lihtsustamiseks arendatakse projekti raames ka tõlkija isemajandavat versiooni C++ keeles - CTranslate2 , mis kasutab eelkoolitatud mudeleid ilma täiendavatele sõltuvustele viitamata.

Uus versioon lisab parameetri origin_learning_rate ja rakendab mitmeid uusi argumente (mha_bias ja output_layer_bias), et konfigureerida Transformeri mudeligeneraatorit. Ülejäänud on tähistatud veaparandustega.

Allikas: opennet.ru

Lisa kommentaar