Nag-publish ang Mozilla ng sarili nitong machine translation system

Naglabas ang Mozilla ng toolkit para sa self-sufficient machine translation mula sa isang wika patungo sa isa pa, na tumatakbo sa lokal na sistema ng user nang hindi gumagamit ng mga panlabas na serbisyo. Ang proyekto ay binuo bilang bahagi ng inisyatiba ng Bergamot kasama ng mga mananaliksik mula sa ilang unibersidad sa UK, Estonia at Czech Republic na may suportang pinansyal mula sa European Union. Ang mga pagpapaunlad ay ipinamamahagi sa ilalim ng lisensya ng MPL 2.0.

Kasama sa proyekto ang bergamot-translator engine, mga tool para sa self-training ng machine learning system at mga ready-made na modelo para sa 14 na wika, kabilang ang mga pang-eksperimentong modelo para sa pagsasalin mula sa English patungo sa Russian at vice versa. Ang antas ng pagsasalin ay maaaring masuri sa isang online na demonstrasyon.

Ang makina ay nakasulat sa C++ at isang wrapper sa ibabaw ng Marian machine translation framework, na gumagamit ng paulit-ulit na neural network (RNN) at mga modelo ng wikang nakabatay sa transformer. Maaaring gamitin ang GPU para mapabilis ang pagsasanay at pagsasalin. Ang Marian framework ay ginagamit din upang paganahin ang serbisyo ng pagsasalin ng Microsoft Translator at pangunahing binuo ng mga inhinyero mula sa Microsoft kasama ng mga mananaliksik mula sa Unibersidad ng Edinburgh at Poznan.

Para sa mga gumagamit ng Firefox, isang add-on ang inihanda para sa pagsasalin ng mga web page, na nagsasalin sa gilid ng browser nang hindi gumagamit ng mga serbisyo sa ulap. Dati, ang add-on ay maaari lamang mai-install sa mga beta release at gabi-gabing build, ngunit ngayon ay available na ito para sa mga release ng Firefox. Sa browser add-on, ang engine, na orihinal na nakasulat sa C++, ay pinagsama-sama sa isang intermediate na WebAssembly binary na representasyon gamit ang Emscripten compiler. Kabilang sa mga bagong feature ng add-on, ang kakayahang magsalin habang pinupunan ang mga web form ay nabanggit (nagpasok ang user ng teksto sa kanilang sariling wika at agad itong isinalin sa wika ng kasalukuyang site) at pagsusuri ng kalidad ng pagsasalin na may awtomatikong pag-flag ng mga kaduda-dudang pagsasalin upang ipaalam sa user ang tungkol sa mga posibleng pagkakamali.

Pinagmulan: opennet.ru

Magdagdag ng komento