Kutolewa kwa mfumo wa utafsiri wa mashine wa OpenNMT 2.28.0

Kutolewa kwa mfumo wa utafsiri wa mashine wa OpenNMT 0.28.0 (Open Neural Machine Translation), unaotumia mbinu za kujifunza kwa mashine, kumechapishwa. Ili kuunda mtandao wa neva, mradi hutumia uwezo wa maktaba ya kina ya kujifunza mashine ya TensorFlow. Nambari ya moduli zilizotengenezwa na mradi wa OpenNMT zimeandikwa kwa Python na kusambazwa chini ya leseni ya MIT. Mitindo iliyotengenezwa tayari imetayarishwa kwa lugha za Kiingereza, Kijerumani na Kikatalani; kwa lugha zingine, unaweza kuunda kielelezo kwa kujitegemea kulingana na seti ya data kutoka kwa mradi wa OPUS (kwa mafunzo, faili mbili huhamishiwa kwenye mfumo - moja na sentensi katika lugha chanzi, na ya pili ikiwa na tafsiri ya hali ya juu ya sentensi hizi katika lugha lengwa ).

Mradi huu unaendelezwa kwa ushiriki wa SYSTRAN, kampuni inayobobea katika kuunda zana za kutafsiri kwa mashine, na kundi la watafiti wa Harvard wanaounda miundo ya lugha ya binadamu kwa mifumo ya kujifunza kwa mashine. Kiolesura cha mtumiaji hurahisishwa iwezekanavyo na kinahitaji tu kubainisha faili ya ingizo yenye maandishi na faili ili kuhifadhi matokeo ya tafsiri. Mfumo wa upanuzi hufanya iwezekanavyo kutekeleza utendakazi wa ziada kulingana na OpenNMT, kwa mfano, muhtasari wa kiotomatiki, uainishaji wa maandishi na utengenezaji wa manukuu.

Matumizi ya TensorFlow hukuruhusu kutumia uwezo wa GPU (ili kuharakisha mchakato wa kufundisha mtandao wa neva. Ili kurahisisha usambazaji wa bidhaa, mradi pia unatengeneza toleo la kujitosheleza la mfasiri katika C++ - CTranslate2 , ambayo hutumia mifano iliyofunzwa kabla bila kurejelea tegemezi za ziada.

Toleo jipya linaongeza parameta ya_learning_rate na kutekeleza hoja kadhaa mpya (mha_bias na output_layer_bias) ili kusanidi jenereta ya kielelezo cha Transformer. Zilizosalia zimetiwa alama na marekebisho ya hitilafu.

Chanzo: opennet.ru

Kuongeza maoni