Gipatik sa Mozilla ang kaugalingon nga sistema sa paghubad sa makina

Gipagawas sa Mozilla ang usa ka toolkit alang sa igo-sa-kaugalingon nga paghubad sa makina gikan sa usa ka lengguwahe ngadto sa lain, nga nagdagan sa lokal nga sistema sa tiggamit nga wala mogamit sa mga serbisyo sa gawas. Ang proyekto gipalambo isip bahin sa inisyatibo sa Bergamot kauban ang mga tigdukiduki gikan sa daghang mga unibersidad sa UK, Estonia ug Czech Republic nga adunay suporta pinansyal gikan sa European Union. Ang mga kalamboan giapod-apod ubos sa lisensya sa MPL 2.0.

Ang proyekto naglakip sa bergamot-translator engine, mga himan alang sa self-training sa machine learning system ug ready-made nga mga modelo alang sa 14 ka lengguwahe, lakip na ang experimental models para sa paghubad gikan sa English ngadto sa Russian ug vice versa. Ang lebel sa paghubad mahimong masusi sa usa ka online nga demonstrasyon.

Ang makina gisulat sa C ++ ug usa ka wrapper sa ibabaw sa Marian machine translation framework, nga naggamit sa usa ka balik-balik nga neural network (RNN) ug transformer-based nga mga modelo sa pinulongan. Mahimong gamiton ang GPU aron mapadali ang pagbansay ug paghubad. Ang Marian framework gigamit usab sa paggahum sa serbisyo sa paghubad nga Microsoft Translator ug gipalambo sa panguna sa mga inhenyero gikan sa Microsoft kauban ang mga tigdukiduki gikan sa Unibersidad sa Edinburgh ug Poznan.

Alang sa mga tiggamit sa Firefox, usa ka add-on ang giandam alang sa paghubad sa mga panid sa web, nga naghubad sa kilid sa browser nga wala mogamit sa mga serbisyo sa panganod. Kaniadto, ang add-on mahimo ra ma-install sa mga pagpagawas sa beta ug gabii nga pagtukod, apan karon magamit na kini alang sa mga pagpagawas sa Firefox. Sa browser add-on, ang makina, orihinal nga gisulat sa C++, gihugpong ngadto sa intermediate nga WebAssembly binary nga representasyon gamit ang Emscripten compiler. Lakip sa mga bag-ong bahin sa add-on, ang abilidad sa paghubad samtang nagpuno sa mga porma sa web namatikdan (ang user mosulod sa teksto sa ilang lumad nga pinulongan ug kini gihubad sa langaw ngadto sa pinulongan sa kasamtangan nga site) ug pagtimbang-timbang sa kalidad sa paghubad nga adunay awtomatik nga pag-flag sa mga kuwestiyonableng hubad aron ipahibalo sa tiggamit bahin sa mga posibleng sayop.

Source: opennet.ru

Idugang sa usa ka comment