Rilis sistem terjemahan mesin OpenNMT-tf 2.30

Sistem terjemahan mesin OpenNMT-tf (Open Neural Machine Translation), versi 2.30.0, wis dirilis. Modul proyek OpenNMT-tf ditulis ing Python, nggunakake perpustakaan TensorFlow, lan disebarake ing lisensi MIT.

Versi OpenNMT berbasis PyTorch lagi dikembangake kanthi paralel, beda karo fitur sing didhukung. Salajengipun, OpenNMT berbasis PyTorch dipromosikan minangka luwih gampang digunakake lan multimodal, dene versi basis TensorFlow kacathet amarga modularitas, stabilitas, lan kemampuan kanggo nggunakake kemampuan GPU kanggo nyepetake latihan jaringan saraf. Kanggo nyederhanakake distribusi, proyek kasebut uga ngembangake penerjemah C ++, CTranslate2, sing nggunakake model sing wis dilatih tanpa mbutuhake dependensi tambahan.

Model wis disiapake kanggo Inggris, Jerman, lan Katalan. Kanggo basa liyane, sampeyan bisa nggawe model dhewe adhedhasar dataset saka proyek OPUS (kanggo latihan, sistem diwenehi rong file-siji karo ukara ing basa sumber, lan liyane karo terjemahan kualitas dhuwur saka ukara iki menyang basa target).

Proyèk iki dikembangaké kanthi partisipasi SYSTRAN, perusahaan khusus ing alat terjemahan mesin, lan klompok peneliti Harvard ngembangake model basa manungsa kanggo sistem pembelajaran mesin. Antarmuka pangguna gampang banget lan mung mbutuhake file teks input lan file sing diasilake kanggo disimpen. Sistem ekstensi ngidini implementasine fungsi tambahan ing ndhuwur OpenNMT, kayata ringkesan otomatis, klasifikasi teks, lan subtitling.

Ing versi anyar:

  • Dhukungan kanggo perpustakaan TensorFlow 2.11 wis ditambahake, nanging pangoptimal Keras anyar durung didhukung (mbutuhake nggunakake mode tf.keras.optimizers.legacy).
  • Dhukungan ditambahake kanggo cabang anyar mesin CTranslate2 3.x, dirancang kanggo eksekusi model sing efisien kanthi arsitektur "transformator".
  • Nambahake parameter latihan model pad_to_bucket_boundary kanggo ngaktifake padding tambahan sing nyelarasake ukuran ember menyang kelipatan length_bucket_width.
  • Dhukungan terpadu kanggo metrik chrf lan chrf ++ saka proyek SacreBLEU, sing mbandhingake terjemahan mesin karo referensi terjemahan manungsa.
  • Mbusak atribut model ctranslate2_spec, sing ora digunakake maneh ing CTranslate2.

Source: opennet.ru

Tuku hosting sing dipercaya kanggo situs kanthi proteksi DDoS, server VPS VDS 🔥 Tuku hosting situs web sing bisa dipercaya nganggo proteksi DDoS, server VPS VDS | ProHoster