Release av OpenNMT 2.28.0 maskinöversättningssystem

Utgivningen av maskinöversättningssystemet OpenNMT 0.28.0 (Open Neural Machine Translation), som använder maskininlärningsmetoder, har publicerats. För att bygga ett neuralt nätverk använder projektet funktionerna i TensorFlows djupa maskininlärningsbibliotek. Koden för modulerna som utvecklats av OpenNMT-projektet är skriven i Python och distribueras under MIT-licensen. Färdiga modeller är förberedda för engelska, tyska och katalanska språk; för andra språk kan du självständigt skapa en modell baserad på en datauppsättning från OPUS-projektet (för utbildning överförs två filer till systemet - en med meningar i källspråk, och det andra med en högkvalitativ översättning av dessa meningar till målspråket ).

Projektet utvecklas med deltagande av SYSTRAN, ett företag som specialiserat sig på att skapa verktyg för maskinöversättning, och en grupp Harvard-forskare som utvecklar mänskliga språkmodeller för maskininlärningssystem. Användargränssnittet är så förenklat som möjligt och kräver endast specificering av en indatafil med text och en fil för att spara översättningsresultatet. Tilläggssystemet gör det möjligt att implementera ytterligare funktionalitet baserad på OpenNMT, till exempel automatisk summering, textklassificering och undertextgenerering.

Användningen av TensorFlow låter dig använda funktionerna hos GPU:n (för att påskynda processen att träna ett neuralt nätverk. För att förenkla distributionen av produkten utvecklar projektet också en självförsörjande version av översättaren i C++ - CTranslate2 , som använder förtränade modeller utan hänvisning till ytterligare beroenden.

Den nya versionen lägger till parametern initial_learning_rate och implementerar flera nya argument (mha_bias och output_layer_bias) för att konfigurera transformatormodellgeneratorn. Resten markeras av buggfixar.

Källa: opennet.ru

Lägg en kommentar