Rhyddhau system cyfieithu peirianyddol OpenNMT 2.28.0

Mae rhyddhau system cyfieithu peirianyddol OpenNMT 0.28.0 (Open Neural Machine Translation), sy'n defnyddio dulliau dysgu peirianyddol, wedi'i gyhoeddi. Er mwyn adeiladu rhwydwaith niwral, mae'r prosiect yn defnyddio galluoedd llyfrgell dysgu peiriannau dwfn TensorFlow. Mae cod y modiwlau a ddatblygwyd gan y prosiect OpenNMT wedi'i ysgrifennu yn Python a'i ddosbarthu o dan drwydded MIT. Paratoir modelau parod ar gyfer ieithoedd Saesneg, Almaeneg a Chatalaneg; ar gyfer ieithoedd eraill, gallwch greu model yn annibynnol yn seiliedig ar set ddata o'r prosiect OPUS (ar gyfer hyfforddiant, trosglwyddir dwy ffeil i'r system - un gyda brawddegau yn y iaith ffynhonnell, a'r ail gyda chyfieithiad o ansawdd uchel o'r brawddegau hyn i'r iaith darged ).

Mae'r prosiect yn cael ei ddatblygu gyda chyfranogiad SYSTRAN, cwmni sy'n arbenigo mewn creu offer cyfieithu peirianyddol, a grΕ΅p o ymchwilwyr Harvard sy'n datblygu modelau iaith ddynol ar gyfer systemau dysgu peirianyddol. Mae'r rhyngwyneb defnyddiwr mor syml Γ’ phosibl a dim ond angen nodi ffeil mewnbwn gyda thestun a ffeil i arbed canlyniad y cyfieithiad. Mae'r system estyn yn ei gwneud hi'n bosibl gweithredu swyddogaethau ychwanegol yn seiliedig ar OpenNMT, er enghraifft, awto-grynhoi, dosbarthu testun a chynhyrchu is-deitlau.

Mae defnyddio TensorFlow yn caniatΓ‘u ichi ddefnyddio galluoedd y GPU (i gyflymu'r broses o hyfforddi rhwydwaith niwral. Er mwyn symleiddio dosbarthiad y cynnyrch, mae'r prosiect hefyd yn datblygu fersiwn hunangynhaliol o'r cyfieithydd yn C++ - CTranslate2 , sy'n defnyddio modelau sydd wedi'u hyfforddi ymlaen llaw heb gyfeirio at ddibyniaethau ychwanegol.

Mae'r fersiwn newydd yn ychwanegu'r paramedr initial_learning_rate ac yn gweithredu sawl dadl newydd (mha_bias ac output_layer_bias) i ffurfweddu generadur model y Transformer. Mae'r gweddill yn cael ei nodi gan atgyweiriadau nam.

Ffynhonnell: opennet.ru

Ychwanegu sylw