OpenNMT 2.28.0 машин орчуулгын системийн хувилбар

Машин сургалтын аргуудыг ашигладаг OpenNMT 0.28.0 (Нээлттэй мэдрэлийн машин орчуулга) системийн хувилбар хэвлэгдэн гарлаа. Мэдрэлийн сүлжээг бий болгохын тулд төсөл нь TensorFlow гүн машин сургалтын номын сангийн чадварыг ашигладаг. OpenNMT төслийн боловсруулсан модулиудын кодыг Python хэл дээр бичиж, MIT лицензийн дагуу түгээдэг. Бэлэн загваруудыг англи, герман, каталан хэлээр бэлтгэдэг; бусад хэл дээр та OPUS төслийн өгөгдлийн багц дээр үндэслэн бие даан загвар үүсгэж болно (сургахын тулд системд хоёр файлыг шилжүүлдэг - нэг нь өгүүлбэртэй эх хэл, хоёр дахь нь эдгээр өгүүлбэрүүдийг зорилтот хэл рүү өндөр чанартай орчуулгатай).

Машины орчуулгын хэрэгсэл бүтээх чиглэлээр мэргэшсэн SYSTRAN компани болон машин сургалтын системд хүний ​​хэлний загвар боловсруулж буй Харвардын хэсэг судлаачдын оролцоотойгоор уг төслийг боловсруулж байна. Хэрэглэгчийн интерфэйс нь аль болох хялбаршуулсан бөгөөд орчуулгын үр дүнг хадгалахын тулд зөвхөн текст болон файл бүхий оролтын файлыг зааж өгөх шаардлагатай. Өргөтгөлийн систем нь OpenNMT дээр суурилсан нэмэлт функцийг хэрэгжүүлэх боломжийг олгодог, жишээлбэл, автоматаар хураангуйлах, текст ангилах, хадмал орчуулга үүсгэх.

TensorFlow-ийг ашиглах нь GPU-ийн чадавхийг ашиглах боломжийг олгодог (мэдрэлийн сүлжээг сургах үйл явцыг хурдасгах. Бүтээгдэхүүний түгээлтийг хялбарчлахын тулд төсөл нь C++ хэл дээрх орчуулагчийн бие даасан хувилбарыг боловсруулж байна - CTranslate2 , энэ нь нэмэлт хамааралгүйгээр урьдчилан бэлтгэгдсэн загваруудыг ашигладаг.

Шинэ хувилбар нь Трансформаторын загвар үүсгэгчийг тохируулахын тулд initial_learning_rate параметрийг нэмж, хэд хэдэн шинэ аргументуудыг (mha_bias болон output_layer_bias) хэрэгжүүлдэг. Үлдсэн хэсэг нь алдааны засваруудаар тэмдэглэгдсэн байдаг.

Эх сурвалж: opennet.ru

сэтгэгдэл нэмэх