การเปิดตัวระบบแปลภาษาด้วยเครื่อง OpenNMT 2.28.0

เปิดตัวระบบการแปลด้วยเครื่อง OpenNMT 0.28.0 (Open Neural Machine Translation) ซึ่งใช้วิธีการเรียนรู้ด้วยเครื่อง ได้รับการเผยแพร่แล้ว ในการสร้างโครงข่ายประสาทเทียม โปรเจ็กต์นี้ใช้ความสามารถของไลบรารีแมชชีนเลิร์นนิงเชิงลึกของ TensorFlow รหัสของโมดูลที่พัฒนาโดยโครงการ OpenNMT เขียนด้วยภาษา Python และเผยแพร่ภายใต้ใบอนุญาต MIT โมเดลสำเร็จรูปเตรียมไว้สำหรับภาษาอังกฤษ เยอรมัน และคาตาลัน สำหรับภาษาอื่น คุณสามารถสร้างโมเดลได้อย่างอิสระตามชุดข้อมูลจากโครงการ OPUS (สำหรับการฝึกอบรม ไฟล์สองไฟล์จะถูกโอนไปยังระบบ - หนึ่งไฟล์พร้อมประโยคใน ภาษาต้นฉบับและภาษาที่สองที่มีการแปลประโยคเหล่านี้เป็นภาษาเป้าหมายคุณภาพสูง )

โครงการนี้กำลังได้รับการพัฒนาโดยการมีส่วนร่วมของ SYSTRAN ซึ่งเป็นบริษัทที่เชี่ยวชาญด้านการสร้างเครื่องมือแปลภาษาด้วยเครื่อง และกลุ่มนักวิจัยของ Harvard ที่พัฒนาแบบจำลองภาษามนุษย์สำหรับระบบการเรียนรู้ของเครื่อง ส่วนต่อประสานกับผู้ใช้นั้นเรียบง่ายที่สุดเท่าที่จะเป็นไปได้และต้องการเพียงการระบุไฟล์อินพุตพร้อมข้อความและไฟล์เพื่อบันทึกผลการแปล ระบบส่วนขยายทำให้สามารถใช้ฟังก์ชันเพิ่มเติมตาม OpenNMT ได้ เช่น การสรุปอัตโนมัติ การจัดหมวดหมู่ข้อความ และการสร้างคำบรรยาย

การใช้ TensorFlow ช่วยให้คุณใช้ความสามารถของ GPU (เพื่อเร่งกระบวนการฝึกอบรมโครงข่ายประสาทเทียม เพื่อลดความซับซ้อนในการจำหน่ายผลิตภัณฑ์ โครงการนี้ยังกำลังพัฒนาตัวแปลเวอร์ชันแบบพอเพียงใน C ++ - CTranslate2 ซึ่งใช้โมเดลที่ได้รับการฝึกอบรมล่วงหน้าโดยไม่มีการอ้างอิงถึงการขึ้นต่อกันเพิ่มเติม

เวอร์ชันใหม่เพิ่มพารามิเตอร์ Initial_learning_rate และใช้อาร์กิวเมนต์ใหม่หลายข้อ (mha_bias และ output_layer_bias) เพื่อกำหนดค่าตัวสร้างโมเดล Transformer ส่วนที่เหลือจะถูกทำเครื่องหมายด้วยการแก้ไขข้อบกพร่อง

ที่มา: opennet.ru

เพิ่มความคิดเห็น