Mozilla падрыхтавала для Firefox дадатак з сістэмай машыннага перакладу

Кампанія Mozilla апублікавала выпуск Firefox-дадаткі Firefox Translations 0.4 (раней развівалася пад імем Bergamot Translate) з рэалізацыяй самадастатковай сістэмы машыннага перакладу, якая працуе на боку браўзэра без звароту да вонкавых сэрвісаў. Для перакладу з адной мовы на іншую задзейнічаны рухавічок bergamot-translator, які развіваецца ў рамках ініцыятывы Bergamot распрацоўшчыкамі з Mozilla сумесна з даследчыкамі некалькіх універсітэтаў Вялікабрытаніі, Эстоніі і Чэхіі пры фінансавай падтрымцы Еўрасаюза. Код распаўсюджваецца пад ліцэнзіяй MPL-2.0.

Рухавічок напісаны на мове C++ і кампілюецца прамежкавае бінарнае ўяўленне WebAssembly пры дапамозе кампілятара Emscripten. Рухавічок уяўляе сабой абвязку над фрэймворком машыннага перакладу Marian, у якім прымяняецца рэкурэнтная нейронавая сетка (RNN) і моўныя мадэлі на аснове трансформераў. Для паскарэння навучання і пераводу можа выкарыстоўвацца GPU. Marian выкарыстоўваецца для забеспячэння працы сэрвісу перакладу Microsoft Translator і развіваецца ў асноўным інжынерамі з Microsoft сумесна з даследнікамі з Эдынбургскага і Познанскага ўніверсітэтаў.

У Firefox Translations рэалізавана падтрымка перакладу з эстонскай і іспанскай моў на англійскую і наадварот, а таксама з англійскай на нямецкую. Прадукцыйнасць перакладу складае 500-600 слоў у хвіліну. Маецца падтрымка прыярытызацыі перакладу тэксту, бачнага ў акне браўзэра. У новай версіі прадстаўлена магчымасць аўтаматычнай загрузкі файлаў з мадэлямі пры першай спробе перакладу. Файлы з мадэлямі займаюць прыкладна 15 МБ для кожнай мовы. Аўтаматычная загрузка прыводзіць да невялікай затрымкі перад пачаткам першага перакладу, але кардынальна скарачае памер самога дадатак (3.6 МБ замест 124 МБ).

У новай версіі таксама значна паскорана загрузка мадэляў у памяць - калі раней на загрузку мадэлі патрабавалася 10-30 секунд, то зараз мадэлі загружаюцца амаль імгненна. Калі перавод старонкі займае больш за 3 секунды ў інтэрфейсе забяспечана індыкацыя прагрэсу выканання аперацыі. Пераклад ажыццяўляецца паслядоўна зверху ўніз, пачынаючы з бачнай вобласці. Перакладзеныя часткі паказваюцца па меры гатоўнасці, а не перакладзеныя застаюцца на зыходнай мове.

Уключана адпраўка тэлеметрыі, якая ўключае дадзеныя аб узаемадзеянні карыстальніка з інтэрфейсам дапаўнення (напрыклад, аб націску кнопкі перакладу або забароне перакладаў для пэўных сайтаў), інфармацыю аб часе выканання аперацый і тэхнічныя звесткі аб сістэме (CPU, памяць).

Дадатак пакуль можа быць усталявана толькі ў начных зборках Firefox пры адключэнні праверкі дадаткаў па лічбавым подпісе ("xpinstall.signatures.dev-root=true" і "xpinstall.signatures.required=false" у about:config). Пасля ўсталёўкі дадатку Firefox пачне выводзіць панэль з прапановай выканаць пераклад для старонак, мова якіх адрозніваецца ад мовы браўзэра і падтрымліваецца ў дадатку. Прадастаўляецца магчымасць адключыць далейшую выснову панэлі для зададзенай мовы ці сайта.

Mozilla падрыхтавала для Firefox дадатак з сістэмай машыннага перакладу

Нагадаем, што ў Firefox ужо маецца ўбудаваны механізм для перакладу старонак, але ён завязаны на выкарыстанні вонкавых хмарных сэрвісаў (падтрымліваюцца Google, Yandex і Bing) і не актываваны па змаўчанні (для ўключэння ў about:config варта змяніць налады «browser.translation») . Механізм перакладу ў тым ліку падтрымлівае аўтаматычнае вызначэнне мовы пры адкрыцці старонкі на невядомай мове і выводзіць спецыяльны індыкатар з прапановай ажыццявіць пераклад старонкі. Новы дадатак выкарыстоўвае гэты ж інтэрфейс для ўзаемадзеяння з карыстальнікам, але замест звароту да знешніх сэрвісаў запускаецца ўбудаваны апрацоўшчык, які апрацоўвае дадзеныя на сістэме карыстальніка.



Крыніца: opennet.ru

Дадаць каментар