Frigivelse af OpenNMT 2.28.0 maskinoversættelsessystem

Frigivelsen af ​​OpenNMT 0.28.0 (Open Neural Machine Translation) maskinoversættelsessystem, som bruger maskinlæringsmetoder, er blevet offentliggjort. For at bygge et neuralt netværk bruger projektet funktionerne i TensorFlows dybe maskinlæringsbibliotek. Koden til modulerne udviklet af OpenNMT-projektet er skrevet i Python og distribueret under MIT-licensen. Færdige modeller er forberedt til engelsk, tysk og catalansk sprog for andre sprog, du kan selvstændigt oprette en model baseret på et datasæt fra OPUS-projektet (til træning overføres to filer til systemet - en med sætninger i; kildesprog, og det andet med en oversættelse af høj kvalitet af disse sætninger til målsproget ).

Projektet udvikles med deltagelse af SYSTRAN, en virksomhed, der er specialiseret i at skabe maskinoversættelsesværktøjer, og en gruppe Harvard-forskere, der udvikler menneskelige sprogmodeller til maskinlæringssystemer. Brugergrænsefladen er så forenklet som muligt og kræver kun at angive en inputfil med tekst og en fil for at gemme oversættelsesresultatet. Udvidelsessystemet gør det muligt at implementere yderligere funktionalitet baseret på OpenNMT, for eksempel automatisk opsummering, tekstklassificering og generering af undertekster.

Brugen af ​​TensorFlow giver dig mulighed for at bruge GPU'ens muligheder (for at fremskynde processen med at træne et neuralt netværk. For at forenkle distributionen af ​​produktet udvikler projektet også en selvforsynende version af oversætteren i C++ - CTranslate2 , som bruger præ-trænede modeller uden henvisning til yderligere afhængigheder.

Den nye version tilføjer initial_learning_rate-parameteren og implementerer flere nye argumenter (mha_bias og output_layer_bias) for at konfigurere Transformer-modelgeneratoren. Resten er markeret med fejlrettelser.

Kilde: opennet.ru

Tilføj en kommentar