A Mozilla kiadta saját gépi fordítórendszerét

A Mozilla kiadott egy eszközkészletet az önellátó gépi fordításhoz egyik nyelvről a másikra, amely külső szolgáltatások igénybevétele nélkül fut a felhasználó helyi rendszerén. A projektet a Bergamot kezdeményezés részeként fejlesztik az Egyesült Királyság, Észtország és Csehország több egyetemének kutatóival közösen, az Európai Unió pénzügyi támogatásával. A fejlesztések az MPL 2.0 licenc alatt kerülnek terjesztésre.

A projekt magában foglalja a bergamot-fordító motort, a gépi tanulási rendszer önképzéséhez szükséges eszközöket és 14 nyelvre kész modelleket, köztük kísérleti modelleket angolról oroszra és fordítva. A fordítás színvonalát online bemutatón lehet felmérni.

A motor C++ nyelven íródott, és egy burkoló a Marian gépi fordítási keretrendszeren, amely ismétlődő neurális hálózatot (RNN) és transzformátor alapú nyelvi modelleket használ. A GPU segítségével felgyorsítható a képzés és a fordítás. A Marian keretrendszert a Microsoft Translator fordítószolgáltatás működtetésére is használják, és főként a Microsoft mérnökei, valamint az Edinburgh-i és a Poznani Egyetem kutatói fejlesztik.

A Firefox-felhasználók számára elkészült a weblapok fordítására szolgáló kiegészítő, amely a böngésző oldalon fordít felhőszolgáltatások igénybevétele nélkül. Korábban csak béta kiadásokba és éjszakai buildekbe lehetett telepíteni a kiegészítőt, most azonban már Firefox kiadásokhoz is elérhető. A böngészőbővítményben az eredetileg C++ nyelven írt motort egy közbenső WebAssembly bináris reprezentációvá fordítják az Emscripten fordító segítségével. A bővítmény újdonságai között említik a webes űrlapok kitöltése közbeni fordítási képességet (a felhasználó anyanyelvén írja be a szöveget, és azt menet közben fordítják le az aktuális oldal nyelvére), valamint a minőség értékelését. fordítások automatikus megjelölésével a megkérdőjelezhető fordítások, hogy tájékoztassa a felhasználót az esetleges hibákról.

Forrás: opennet.ru

Hozzászólás