Rilascio del sistema di traduzione automatica OpenNMT 2.28.0

È stato pubblicato il rilascio del sistema di traduzione automatica OpenNMT 0.28.0 (Open Neural Machine Translation), che utilizza metodi di machine learning. Per costruire una rete neurale, il progetto utilizza le funzionalità della libreria di apprendimento automatico profondo TensorFlow. Il codice dei moduli sviluppati dal progetto OpenNMT è scritto in Python e distribuito sotto licenza MIT. Per le lingue inglese, tedesco e catalano vengono preparati modelli già pronti; per le altre lingue è possibile creare autonomamente un modello sulla base di un set di dati del progetto OPUS (per la formazione vengono trasferiti al sistema due file: uno con le frasi in formato lingua di partenza e il secondo con una traduzione di alta qualità di queste frasi nella lingua di destinazione).

Il progetto è stato sviluppato con la partecipazione di SYSTRAN, azienda specializzata nella creazione di strumenti di traduzione automatica, e di un gruppo di ricercatori di Harvard che sviluppano modelli del linguaggio umano per sistemi di apprendimento automatico. L'interfaccia utente è quanto più semplificata possibile e richiede solo di specificare un file di input con testo e un file per salvare il risultato della traduzione. Il sistema di estensione consente di implementare funzionalità aggiuntive basate su OpenNMT, ad esempio il riepilogo automatico, la classificazione del testo e la generazione di sottotitoli.

L'utilizzo di TensorFlow consente di utilizzare le funzionalità della GPU (per accelerare il processo di addestramento di una rete neurale. Per semplificare la distribuzione del prodotto, il progetto sta sviluppando anche una versione autosufficiente del traduttore in C++ - CTranslate2 , che utilizza modelli preaddestrati senza riferimento a dipendenze aggiuntive.

La nuova versione aggiunge il parametro partial_learning_rate e implementa diversi nuovi argomenti (mha_bias e output_layer_bias) per configurare il generatore di modelli Transformer. Il resto è contrassegnato da correzioni di bug.

Fonte: opennet.ru

Aggiungi un commento