OpenNMT 2.28.0 մեքենա թարգմանության համակարգի թողարկում

Հրապարակվել է OpenNMT 0.28.0 (Open Neural Machine Translation) մեքենայական թարգմանության համակարգի թողարկումը, որն օգտագործում է մեքենայական ուսուցման մեթոդներ։ Նեյրոնային ցանց կառուցելու համար նախագիծն օգտագործում է TensorFlow խորը մեքենայական ուսուցման գրադարանի հնարավորությունները: OpenNMT նախագծի կողմից մշակված մոդուլների կոդը գրված է Python-ով և տարածվում MIT լիցենզիայի ներքո: Պատրաստի մոդելները պատրաստվում են անգլերեն, գերմաներեն և կատալոներեն լեզուների համար, դուք կարող եք ինքնուրույն ստեղծել մոդել՝ հիմնված OPUS նախագծի տվյալների վրա (ուսուցման համար երկու ֆայլ փոխանցվում է համակարգին, մեկը՝ նախադասություններով); սկզբնաղբյուր լեզուն, իսկ երկրորդը՝ այս նախադասությունների բարձրորակ թարգմանությամբ թիրախային լեզվով):

Նախագիծը մշակվում է SYSTRAN ընկերության՝ մեքենայական թարգմանության գործիքների ստեղծման մեջ մասնագիտացած ընկերության և Հարվարդի մի խումբ հետազոտողների մասնակցությամբ, որոնք մշակում են մարդկային լեզվի մոդելներ մեքենայական ուսուցման համակարգերի համար։ Օգտագործողի միջերեսը հնարավորինս պարզեցված է և պահանջում է միայն մուտքագրված ֆայլ նշել տեքստով և ֆայլ՝ թարգմանության արդյունքը պահպանելու համար: Ընդլայնման համակարգը հնարավորություն է տալիս OpenNMT-ի վրա հիմնված լրացուցիչ գործառույթներ իրականացնել, օրինակ՝ ավտոմատ ամփոփում, տեքստի դասակարգում և ենթագրերի ստեղծում:

TensorFlow-ի օգտագործումը թույլ է տալիս օգտագործել GPU-ի հնարավորությունները (նյարդային ցանցի վերապատրաստման գործընթացը արագացնելու համար: Արտադրանքի բաշխումը պարզեցնելու համար նախագիծը նաև մշակում է թարգմանչի ինքնաբավ տարբերակը C++-ում - CTranslate2: , որն օգտագործում է նախապես պատրաստված մոդելներ՝ առանց լրացուցիչ կախվածությունների հղումների։

Նոր տարբերակն ավելացնում է initial_learning_rate պարամետրը և իրականացնում մի քանի նոր արգումենտներ (mha_bias և output_layer_bias)՝ տրանսֆորմատորի մոդելի գեներատորը կարգավորելու համար։ Մնացածը նշվում է սխալների շտկմամբ:

Source: opennet.ru

Добавить комментарий