Mozilla đã xuất bản hệ thống dịch máy của riêng mình

Mozilla đã phát hành bộ công cụ dịch máy tự động từ ngôn ngữ này sang ngôn ngữ khác, chạy trên hệ thống cục bộ của người dùng mà không cần dùng đến các dịch vụ bên ngoài. Dự án đang được phát triển như một phần của sáng kiến ​​Bergamot cùng với các nhà nghiên cứu từ một số trường đại học ở Anh, Estonia và Cộng hòa Séc với sự hỗ trợ tài chính từ Liên minh Châu Âu. Các phát triển được phân phối theo giấy phép MPL 2.0.

Dự án bao gồm công cụ dịch bergamot, các công cụ tự đào tạo hệ thống máy học và các mô hình tạo sẵn cho 14 ngôn ngữ, bao gồm các mô hình thử nghiệm để dịch từ tiếng Anh sang tiếng Nga và ngược lại. Mức độ dịch thuật có thể được đánh giá trong phần trình diễn trực tuyến.

Công cụ này được viết bằng C++ và là một trình bao bọc bên trên khung dịch máy Marian, sử dụng mạng thần kinh tái phát (RNN) và các mô hình ngôn ngữ dựa trên máy biến áp. GPU có thể được sử dụng để tăng tốc độ đào tạo và dịch thuật. Khung Marian cũng được sử dụng để hỗ trợ dịch vụ dịch thuật Microsoft Translator và được phát triển chủ yếu bởi các kỹ sư của Microsoft cùng với các nhà nghiên cứu từ Đại học Edinburgh và Poznan.

Đối với người dùng Firefox, một tiện ích bổ sung đã được chuẩn bị để dịch các trang web, dịch trên trình duyệt mà không cần dùng đến dịch vụ đám mây. Trước đây, tiện ích bổ sung này chỉ có thể được cài đặt trong các bản phát hành beta và bản dựng hàng đêm, nhưng giờ đây nó có sẵn cho các bản phát hành Firefox. Trong tiện ích bổ sung của trình duyệt, công cụ, ban đầu được viết bằng C++, được biên dịch thành biểu diễn nhị phân WebAssugging trung gian bằng trình biên dịch Emscripten. Trong số các tính năng mới của tiện ích bổ sung, có khả năng dịch trong khi điền vào biểu mẫu web (người dùng nhập văn bản bằng ngôn ngữ mẹ đẻ của họ và nó được dịch nhanh chóng sang ngôn ngữ của trang web hiện tại) và đánh giá chất lượng. dịch với tính năng tự động gắn cờ các bản dịch có vấn đề để thông báo cho người dùng về các lỗi tiềm ẩn.

Nguồn: opennet.ru

Thêm một lời nhận xét