Vydání OpenNMT 2.28.0 systému strojového překladu

Bylo zveřejněno vydání systému strojového překladu OpenNMT 0.28.0 (Open Neural Machine Translation), který využívá metody strojového učení. K vybudování neuronové sítě projekt využívá schopnosti knihovny hlubokého strojového učení TensorFlow. Kód modulů vyvinutých projektem OpenNMT je napsán v Pythonu a distribuován pod licencí MIT. Hotové modely jsou připraveny pro angličtinu, němčinu a katalánštinu, pro ostatní jazyky můžete samostatně vytvořit model na základě datové sady z projektu OPUS (pro školení se do systému přenesou dva soubory - jeden s větami v zdrojový jazyk a druhý s kvalitním překladem těchto vět do cílového jazyka).

Projekt je vyvíjen za účasti společnosti SYSTRAN, která se specializuje na vytváření nástrojů pro strojový překlad, a skupiny výzkumníků z Harvardu vyvíjejících modely lidského jazyka pro systémy strojového učení. Uživatelské rozhraní je maximálně zjednodušené a vyžaduje pouze zadání vstupního souboru s textem a souboru pro uložení výsledku překladu. Systém rozšíření umožňuje implementovat další funkce založené na OpenNMT, například automatické shrnutí, klasifikaci textu a generování titulků.

Využití TensorFlow umožňuje využít schopnosti GPU (pro urychlení procesu trénování neuronové sítě. Pro zjednodušení distribuce produktu se v projektu vyvíjí i soběstačná verze překladače v C++ - CTranslate2 , který používá předem trénované modely bez odkazu na další závislosti.

Nová verze přidává parametr initial_learning_rate a implementuje několik nových argumentů (mha_bias a output_layer_bias) pro konfiguraci generátoru modelu Transformer. Zbytek je označen opravami chyb.

Zdroj: opennet.ru

Přidat komentář