Utjefte fan OpenNMT 2.28.0 masine-oersetsysteem

De frijlitting fan it OpenNMT 0.28.0 (Open Neural Machine Translation) masine-oersetsysteem, dat masine-learenmetoaden brûkt, is publisearre. Om in neural netwurk te bouwen, brûkt it projekt de mooglikheden fan 'e TensorFlow-bibleteek foar djippe masine-learen. De koade fan 'e modules ûntwikkele troch it OpenNMT-projekt is skreaun yn Python en ferspraat ûnder de MIT-lisinsje. Ready-made modellen wurde taret foar Ingelske, Dútske en Katalaanske talen; foar oare talen kinne jo selsstannich in model meitsje op basis fan in gegevensset fan it OPUS-projekt (foar training wurde twa bestannen oerbrocht nei it systeem - ien mei sinnen yn 'e boarnetaal, en de twadde mei in heechweardige oersetting fan dizze sinnen yn de doeltaal).

It projekt wurdt ûntwikkele mei de dielname fan SYSTRAN, in bedriuw dat spesjalisearre is yn it meitsjen fan masine-oersetynstruminten, en in groep Harvard-ûndersikers dy't minsklike taalmodellen ûntwikkelje foar masinelearsystemen. De brûkersynterface is sa ferienfâldige mooglik en fereasket allinich it opjaan fan in ynfierbestân mei tekst en in bestân om it oersetresultaat op te slaan. De útwreiding systeem makket it mooglik om te fieren ekstra funksjonaliteit basearre op OpenNMT, Bygelyks, auto gearfetting, tekst klassifikaasje en ûndertitel generaasje.

It gebrûk fan TensorFlow lit jo de mooglikheden fan 'e GPU brûke (om it proses fan training fan in neural netwurk te fersnellen. Om de ferdieling fan it produkt te ferienfâldigjen, ûntwikkelet it projekt ek in selsstannige ferzje fan 'e oersetter yn C ++ - CTranslate2 , dy't pre-trained modellen brûkt sûnder ferwizing nei ekstra ôfhinklikens.

De nije ferzje foeget de initial_learning_rate-parameter ta en ymplementearret ferskate nije arguminten (mha_bias en output_layer_bias) om de Transformer-modelgenerator te konfigurearjen. De rest wurdt markearre troch bug fixes.

Boarne: opennet.ru

Add a comment