OpenNMT 2.28.0 makine çeviri sisteminin piyasaya sürülmesi

Makine öğrenmesi yöntemlerini kullanan OpenNMT 0.28.0 (Açık Sinirsel Makine Çevirisi) makine çeviri sisteminin sürümü yayınlandı. Proje, bir sinir ağı oluşturmak için TensorFlow derin makine öğrenimi kütüphanesinin yeteneklerini kullanıyor. OpenNMT projesi tarafından geliştirilen modüllerin kodları Python dilinde yazılmakta ve MIT lisansı altında dağıtılmaktadır. İngilizce, Almanca ve Katalanca dilleri için hazır modeller hazırlanır; diğer diller için OPUS projesinden alınan bir veri setine dayalı olarak bağımsız olarak bir model oluşturabilirsiniz (eğitim için sisteme iki dosya aktarılır - biri cümle içinde) kaynak dil ve ikincisi bu cümlelerin hedef dile yüksek kalitede çevrilmesiyle).

Proje, makine çeviri araçları oluşturma konusunda uzmanlaşmış bir şirket olan SYSTRAN'ın ve makine öğrenimi sistemleri için insan dili modelleri geliştiren bir grup Harvard araştırmacısının katılımıyla geliştiriliyor. Kullanıcı arayüzü mümkün olduğu kadar basitleştirilmiştir ve yalnızca metin içeren bir giriş dosyası ve çeviri sonucunu kaydetmek için bir dosya belirtmeyi gerektirir. Uzatma sistemi, otomatik özetleme, metin sınıflandırma ve altyazı oluşturma gibi OpenNMT'ye dayalı ek işlevlerin uygulanmasını mümkün kılar.

TensorFlow'un kullanımı GPU'nun yeteneklerini kullanmanıza olanak tanır (sinir ağının eğitim sürecini hızlandırmak için. Proje, ürünün dağıtımını basitleştirmek için ayrıca C++ - CTranslate2 dilinde kendi kendine yeten bir çevirmen sürümü geliştiriyor) Ek bağımlılıklara atıfta bulunmadan önceden eğitilmiş modelleri kullanan.

Yeni sürüm, startup_learning_rate parametresini ekler ve Transformer model oluşturucusunu yapılandırmak için birkaç yeni argüman (mha_bias ve Output_layer_bias) uygular. Gerisi hata düzeltmeleriyle işaretlenmiştir.

Kaynak: opennet.ru

Yorum ekle