Mozilla heeft zijn eigen automatische vertaalsysteem gepubliceerd

Mozilla heeft een toolkit uitgebracht voor zelfvoorzienende automatische vertaling van de ene taal naar de andere, die op het lokale systeem van de gebruiker draait zonder toevlucht te nemen tot externe diensten. Het project wordt ontwikkeld als onderdeel van het Bergamot-initiatief samen met onderzoekers van verschillende universiteiten in Groot-Brittannië, Estland en Tsjechië, met financiële steun van de Europese Unie. De ontwikkelingen worden gedistribueerd onder de MPL 2.0-licentie.

Het project omvat de bergamot-vertalermotor, tools voor zelftraining van het machine learning-systeem en kant-en-klare modellen voor 14 talen, inclusief experimentele modellen voor vertaling van Engels naar Russisch en vice versa. Het vertaalniveau kan worden beoordeeld in een online demonstratie.

De engine is geschreven in C++ en vormt een aanvulling op het Marian-framework voor machinevertaling, dat gebruik maakt van een recurrent neuraal netwerk (RNN) en op transformatoren gebaseerde taalmodellen. GPU kan worden gebruikt om training en vertaling te versnellen. Het Marian-framework wordt ook gebruikt om de vertaalservice Microsoft Translator aan te drijven en wordt voornamelijk ontwikkeld door ingenieurs van Microsoft samen met onderzoekers van de universiteiten van Edinburgh en Poznan.

Voor Firefox-gebruikers is een add-on voorbereid voor het vertalen van webpagina's, die zich aan de browserzijde vertaalt zonder toevlucht te nemen tot clouddiensten. Voorheen kon de add-on alleen worden geïnstalleerd in bètaversies en nachtelijke builds, maar nu is deze beschikbaar voor Firefox-versies. In de browser-add-on wordt de engine, oorspronkelijk geschreven in C++, gecompileerd tot een tussenliggende binaire WebAssembly-representatie met behulp van de Emscripten-compiler. Onder de nieuwe functies van de add-on wordt de mogelijkheid om te vertalen tijdens het invullen van webformulieren vermeld (de gebruiker voert tekst in zijn moedertaal in en deze wordt direct vertaald in de taal van de huidige site) en evaluatie van de kwaliteit van vertalingen met automatische markering van twijfelachtige vertalingen om de gebruiker te informeren over mogelijke fouten.

Bron: opennet.ru

Voeg een reactie