Utgivelse av OpenNMT 2.28.0 maskinoversettelsessystem

Utgivelsen av OpenNMT 0.28.0 (Open Neural Machine Translation) maskinoversettelsessystem, som bruker maskinlæringsmetoder, er publisert. For å bygge et nevralt nettverk bruker prosjektet egenskapene til TensorFlows dype maskinlæringsbibliotek. Koden til modulene utviklet av OpenNMT-prosjektet er skrevet i Python og distribuert under MIT-lisensen. Ferdige modeller er forberedt for engelsk, tysk og katalansk språk; for andre språk kan du uavhengig lage en modell basert på et datasett fra OPUS-prosjektet (for opplæring overføres to filer til systemet - en med setninger i kildespråk, og det andre med en oversettelse av høy kvalitet av disse setningene til målspråket ).

Prosjektet utvikles med deltakelse av SYSTRAN, et selskap som spesialiserer seg på å lage maskinoversettelsesverktøy, og en gruppe Harvard-forskere som utvikler menneskelige språkmodeller for maskinlæringssystemer. Brukergrensesnittet er så forenklet som mulig og krever kun å spesifisere en inndatafil med tekst og en fil for å lagre oversettelsesresultatet. Utvidelsessystemet gjør det mulig å implementere tilleggsfunksjonalitet basert på OpenNMT, for eksempel automatisk oppsummering, tekstklassifisering og undertekstgenerering.

Bruken av TensorFlow lar deg bruke egenskapene til GPU (for å fremskynde prosessen med å trene et nevralt nettverk. For å forenkle distribusjonen av produktet utvikler prosjektet også en selvforsynt versjon av oversetteren i C++ - CTranslate2 , som bruker ferdigtrente modeller uten referanse til ytterligere avhengigheter.

Den nye versjonen legger til initial_learning_rate-parameteren og implementerer flere nye argumenter (mha_bias og output_layer_bias) for å konfigurere transformatormodellgeneratoren. Resten er merket med feilrettinger.

Kilde: opennet.ru

Legg til en kommentar