Випуск системи машинного перекладу OpenNMT 2.28.0

Опубліковано випуск системи машинного перекладу OpenNMT 0.28.0 (Open Neural Machine Translation), яка використовує методи машинного навчання. Для створення нейронної мережі проект використовує можливості бібліотеки глибинного машинного навчання TensorFlow. Код модулів, що розвиваються проектом OpenNMT, написаний мовою Python і поширюється під ліцензією MIT. Готові моделі підготовлені для англійської, німецької та каталанської мов, для інших мов можна самостійно сформувати модель на основі набору даних від проекту OPUS (для навчання системі передається два файли — один із пропозиціями вихідною мовою, а другий з якісним перекладом цих пропозицій на цільову мову ).

Проект розвивається за участю компанії SYSTRAN, що спеціалізується на створенні засобів машинного перекладу, та групи дослідників Harvard, яка розробляє моделі людської мови для систем машинного навчання. Інтерфейс користувача максимально спрощений і вимагає лише вказівки вхідного файлу з текстом та файлу для збереження результату перекладу. Система розширень дає можливість реалізовувати з урахуванням OpenNMT додаткову функціональність, наприклад, автореферування, класифікацію текстів і генерацію субтитрів.

Застосування TensorFlow дозволяє використовувати можливості GPU (для прискорення процесу навчання нейронної мережі. Для спрощення поширення продукту проектом також розвивається самодостатній варіант транслятора мовою C++ — CTranslate2, який використовує попередньо натреновані моделі без прив'язки до додаткових залежностей.

У новій версії додано параметр initial_learning_rate та реалізовано кілька нових аргументів (mha_bias та output_layer_bias) для налаштування генератора моделей Transformer. В іншому відзначається виправленням помилок.

Джерело: opennet.ru

Додати коментар або відгук