Vrystelling van OpenNMT 2.28.0 masjienvertaalstelsel

Die vrystelling van die OpenNMT 0.28.0 (Open Neural Machine Translation) masjienvertalingstelsel, wat masjienleermetodes gebruik, is gepubliseer. Om 'n neurale netwerk te bou, gebruik die projek die vermoëns van die TensorFlow diep masjienleerbiblioteek. Die kode van die modules wat deur die OpenNMT-projek ontwikkel is, word in Python geskryf en onder die MIT-lisensie versprei. Klaargemaakte modelle word voorberei vir Engels, Duits en Katalaans tale; vir ander tale kan u onafhanklik 'n model skep gebaseer op 'n datastel van die OPUS-projek (vir opleiding word twee lêers na die stelsel oorgedra - een met sinne in die brontaal, en die tweede met 'n hoë kwaliteit vertaling van hierdie sinne in die doeltaal ).

Die projek word ontwikkel met die deelname van SYSTRAN, 'n maatskappy wat spesialiseer in die skep van masjienvertaalinstrumente, en 'n groep Harvard-navorsers wat menslike taalmodelle vir masjienleerstelsels ontwikkel. Die gebruikerskoppelvlak is so vereenvoudig as moontlik en vereis net dat 'n invoerlêer met teks en 'n lêer gespesifiseer word om die vertaalresultaat te stoor. Die uitbreidingstelsel maak dit moontlik om addisionele funksionaliteit gebaseer op OpenNMT te implementeer, byvoorbeeld outo-opsomming, teksklassifikasie en subtitelgenerering.

Die gebruik van TensorFlow laat jou toe om die vermoëns van die GPU te gebruik (om die proses van opleiding van 'n neurale netwerk te versnel. Om die verspreiding van die produk te vereenvoudig, ontwikkel die projek ook 'n selfversorgende weergawe van die vertaler in C++ - CTranslate2 , wat vooraf opgeleide modelle gebruik sonder verwysing na bykomende afhanklikhede.

Die nuwe weergawe voeg die initial_learning_rate-parameter by en implementeer verskeie nuwe argumente (mha_bias en output_layer_bias) om die Transformer-modelgenerator te konfigureer. Die res word gemerk deur foutoplossings.

Bron: opennet.ru

Voeg 'n opmerking