Việc phát hành hệ thống dịch máy OpenNMT 0.28.0 (Dịch máy thần kinh mở), sử dụng các phương pháp học máy, đã được xuất bản. Để xây dựng mạng lưới thần kinh, dự án sử dụng các khả năng của thư viện máy học sâu TensorFlow. Mã của các mô-đun do dự án OpenNMT phát triển được viết bằng Python và được phân phối theo giấy phép MIT. Các mô hình tạo sẵn được chuẩn bị cho các ngôn ngữ tiếng Anh, tiếng Đức và tiếng Catalan; đối với các ngôn ngữ khác, bạn có thể tạo mô hình một cách độc lập dựa trên tập dữ liệu từ dự án OPUS (để đào tạo, hai tệp được chuyển vào hệ thống - một tệp có các câu trong ngôn ngữ nguồn và ngôn ngữ thứ hai có bản dịch chất lượng cao của các câu này sang ngôn ngữ đích ).
Dự án đang được phát triển với sự tham gia của SYSTRAN, một công ty chuyên tạo ra các công cụ dịch máy và nhóm các nhà nghiên cứu của Harvard đang phát triển mô hình ngôn ngữ con người cho hệ thống máy học. Giao diện người dùng được đơn giản hóa nhất có thể và chỉ yêu cầu chỉ định tệp đầu vào có văn bản và tệp để lưu kết quả dịch. Hệ thống mở rộng cho phép triển khai chức năng bổ sung dựa trên OpenNMT, ví dụ: tự động tóm tắt, phân loại văn bản và tạo phụ đề.
Việc sử dụng TensorFlow cho phép bạn sử dụng các khả năng của GPU (để tăng tốc quá trình đào tạo mạng lưới thần kinh. Để đơn giản hóa việc phân phối sản phẩm, dự án cũng đang phát triển một phiên bản dịch thuật tự cung cấp trong C++ - CTranslate2 , sử dụng các mô hình được đào tạo trước mà không tham chiếu đến các phần phụ thuộc bổ sung.
Phiên bản mới bổ sung tham số init_learning_rate và triển khai một số đối số mới (mha_bias và out_layer_bias) để định cấu hình trình tạo mô hình Transformer. Phần còn lại được đánh dấu bằng cách sửa lỗi.
Nguồn: opennet.ru
