Google Translatotron เป็นเทคโนโลยีการแปลคำพูดพร้อมกันโดยเลียนแบบเสียงของผู้ใช้

นักพัฒนาจาก Google นำเสนอโครงการใหม่ที่พวกเขาสร้างเทคโนโลยีที่สามารถแปลประโยคพูดจากภาษาหนึ่งเป็นอีกภาษาหนึ่งได้ ข้อแตกต่างที่สำคัญระหว่างนักแปลใหม่ที่เรียกว่า Translatotron และแอนะล็อกก็คือ ใช้งานได้เฉพาะกับเสียง โดยไม่ต้องใช้ข้อความกลาง วิธีการนี้ช่วยให้งานของนักแปลเร็วขึ้นได้อย่างมาก จุดที่น่าสังเกตอีกประการหนึ่งคือระบบเลียนแบบความถี่และน้ำเสียงของลำโพงได้ค่อนข้างแม่นยำ

Translatotron ถูกสร้างขึ้นด้วยการทำงานอย่างต่อเนื่องซึ่งใช้เวลาหลายปี นักวิจัยของ Google ได้พิจารณาความเป็นไปได้ของการแปลงคำพูดโดยตรงมาเป็นเวลานาน แต่จนกระทั่งเมื่อไม่นานมานี้ พวกเขาไม่สามารถดำเนินการตามแผนได้

Google Translatotron เป็นเทคโนโลยีการแปลคำพูดพร้อมกันโดยเลียนแบบเสียงของผู้ใช้

ระบบการแปลพร้อมกันที่ใช้ในปัจจุบันส่วนใหญ่มักจะทำงานตามอัลกอริธึมเดียวกัน ในระยะเริ่มแรก คำพูดต้นฉบับจะถูกแปลงเป็นข้อความ ข้อความในภาษาหนึ่งจะเปลี่ยนเป็นข้อความในภาษาอื่น หลังจากนั้นข้อความผลลัพธ์จะถูกแปลงเป็นคำพูดในภาษาที่ต้องการ วิธีนี้ใช้ได้ผลดี แต่ก็ไม่ใช่ว่าไม่มีข้อเสีย ในแต่ละขั้นตอน อาจเกิดข้อผิดพลาดที่ทับซ้อนกันและทำให้คุณภาพการแปลลดลง

เพื่อให้บรรลุผลตามที่ต้องการ นักวิจัยได้ศึกษาสเปกตรัมเสียง พวกเขาพยายามทำให้สเปกโตรแกรมในภาษาหนึ่งกลายเป็นสเปกโตรแกรมในภาษาอื่น โดยข้ามขั้นตอนการแปลงเสียงเป็นข้อความ


Google Translatotron เป็นเทคโนโลยีการแปลคำพูดพร้อมกันโดยเลียนแบบเสียงของผู้ใช้

เป็นที่น่าสังเกตว่าแม้จะมีความซับซ้อนของการเปลี่ยนแปลง แต่การประมวลผลคำพูดเกิดขึ้นในขั้นตอนเดียวและไม่ใช่ในสามอย่างเช่นเคย ด้วยพลังการประมวลผลที่เพียงพอ Translatotron จะดำเนินการแปลพร้อมกันได้เร็วยิ่งขึ้นมาก จุดสำคัญอีกประการหนึ่งคือแนวทางนี้ช่วยให้คุณสามารถรักษาคุณลักษณะและน้ำเสียงของเสียงต้นฉบับได้

ในขั้นตอนนี้ Translatotron ไม่สามารถอวดอ้างความแม่นยำในการแปลสูงเช่นเดียวกับระบบมาตรฐานได้ อย่างไรก็ตาม นักวิจัยกล่าวว่างานแปลส่วนใหญ่มีคุณภาพเพียงพอ ในอนาคต งานเกี่ยวกับ Translatotron จะดำเนินต่อไป เนื่องจากนักวิจัยตั้งใจที่จะทำให้การแปลคำพูดพร้อมกันดีขึ้น



ที่มา: 3dnews.ru

เพิ่มความคิดเห็น