Нашри системаи тарҷумаи мошини OpenNMT 2.28.0

Нашри системаи тарҷумаи мошинии OpenNMT 0.28.0 (Open Neural Machine Translation), ки усулҳои омӯзиши мошинро истифода мебарад, нашр шуд. Барои сохтани шабакаи нейронӣ, лоиҳа аз имкониятҳои китобхонаи омӯзиши мошини амиқи TensorFlow истифода мебарад. Рамзи модулҳое, ки лоиҳаи OpenNMT таҳия кардааст, дар Python навишта шудааст ва таҳти иҷозатномаи MIT паҳн карда мешавад. Моделҳои тайёр барои забонҳои англисӣ, олмонӣ ва каталанӣ омода карда шудаанд; барои забонҳои дигар, шумо метавонед мустақилона дар асоси маҷмӯи маълумот аз лоиҳаи OPUS модел эҷод кунед (барои омӯзиш ду файл ба система интиқол дода мешавад - яке бо ҷумлаҳо дар забони сарчашма ва дуюм бо тарҷумаи баландсифати ин ҷумлаҳо ба забони мавриди ҳадаф ).

Лоиҳа бо иштироки SYSTRAN, як ширкати тахассуси эҷоди асбобҳои тарҷумаи мошинӣ ва як гурӯҳи муҳаққиқони Ҳарвард таҳия карда мешавад, ки моделҳои забони инсониро барои системаҳои омӯзиши мошинсозӣ таҳия мекунанд. Интерфейси корбар то ҳадди имкон содда карда шудааст ва барои захира кардани натиҷаи тарҷума танҳо нишон додани файли воридотӣ бо матн ва файлро талаб мекунад. Системаи васеъкунӣ имкон медиҳад, ки функсияҳои иловагӣ дар асоси OpenNMT амалӣ карда шаванд, масалан, ҷамъбасти худкор, таснифоти матн ва тавлиди субтитрҳо.

Истифодаи TensorFlow ба шумо имкон медиҳад, ки имкониятҳои GPU (барои тезонидани раванди омӯзиши шабакаи нейронӣ) истифода баред. Барои содда кардани тақсимоти маҳсулот, лоиҳа инчунин версияи худкифоии тарҷумонро дар C++ таҳия мекунад - CTranslate2 , ки моделҳои қаблан омӯзонидашударо бидуни истинод ба вобастагии иловагӣ истифода мебарад.

Версияи нав параметри initial_learning_rate илова мекунад ва якчанд далелҳои навро (mha_bias ва output_layer_bias) барои танзими генератори модели Трансформатор амалӣ мекунад. Қисми боқимонда бо ислоҳи хатогиҳо қайд карда мешавад.

Манбаъ: opennet.ru

Илова Эзоҳ