Lëshimi i sistemit të përkthimit me makinë OpenNMT 2.28.0

Është publikuar lëshimi i sistemit të përkthimit të makinës OpenNMT 0.28.0 (Open Neural Machine Translation), i cili përdor metoda të mësimit të makinerive. Për të ndërtuar një rrjet nervor, projekti përdor aftësitë e bibliotekës së mësimit të makinës së thellë TensorFlow. Kodi i moduleve të zhvilluara nga projekti OpenNMT është shkruar në Python dhe shpërndahet nën licencën MIT. Modelet e gatshme janë përgatitur për gjuhët angleze, gjermane dhe katalanase; për gjuhë të tjera, ju mund të krijoni në mënyrë të pavarur një model bazuar në një grup të dhënash nga projekti OPUS (për trajnim, dy skedarë transferohen në sistem - njëra me fjali në gjuha burimore dhe e dyta me një përkthim cilësor të këtyre fjalive në gjuhën e synuar).

Projekti është duke u zhvilluar me pjesëmarrjen e SYSTRAN, një kompani e specializuar në krijimin e mjeteve të përkthimit të makinës, dhe një grup studiuesish të Harvardit që zhvillojnë modele të gjuhës njerëzore për sistemet e mësimit të makinerive. Ndërfaqja e përdoruesit është sa më e thjeshtuar të jetë e mundur dhe kërkon vetëm specifikimin e një skedari hyrës me tekst dhe një skedar për të ruajtur rezultatin e përkthimit. Sistemi i zgjerimit bën të mundur zbatimin e funksionalitetit shtesë bazuar në OpenNMT, për shembull, përmbledhjen automatike, klasifikimin e tekstit dhe gjenerimin e titrave.

Përdorimi i TensorFlow ju lejon të përdorni aftësitë e GPU (për të shpejtuar procesin e trajnimit të një rrjeti nervor. Për të thjeshtuar shpërndarjen e produktit, projekti po zhvillon gjithashtu një version të vetë-mjaftueshëm të përkthyesit në C++ - CTranslate2 , i cili përdor modele të trajnuara paraprakisht pa iu referuar varësive shtesë.

Versioni i ri shton parametrin fillestar_learning_rate dhe zbaton disa argumente të reja (mha_bias dhe output_layer_bias) për të konfiguruar gjeneratorin e modelit Transformer. Pjesa tjetër shënohet nga rregullime të gabimeve.

Burimi: opennet.ru

Shto një koment