Google Translatotron یک فناوری ترجمه همزمان گفتار است که صدای کاربر را تقلید می کند

توسعه دهندگان گوگل پروژه جدیدی را ارائه کردند که در آن فناوری را ایجاد کردند که قادر به ترجمه جملات گفتاری از یک زبان به زبان دیگر است. تفاوت اصلی مترجم جدید به نام Translatotron و آنالوگ های آن این است که به طور انحصاری با صدا و بدون استفاده از متن میانی کار می کند. این رویکرد باعث شد تا سرعت کار مترجم به میزان قابل توجهی افزایش یابد. نکته قابل توجه دیگر این است که سیستم به طور کاملا دقیق فرکانس و تن صدای بلندگو را تقلید می کند.

Translatotron به لطف کار مداوم که چندین سال طول کشید ایجاد شد. محققان گوگل مدت‌هاست که امکان تبدیل گفتار مستقیم را بررسی می‌کنند، اما تا همین اواخر نتوانستند برنامه‌های خود را اجرا کنند.

Google Translatotron یک فناوری ترجمه همزمان گفتار است که صدای کاربر را تقلید می کند

سیستم‌های ترجمه همزمان که امروزه مورد استفاده قرار می‌گیرند اغلب بر اساس همان الگوریتم کار می‌کنند. در مرحله اولیه، گفتار اصلی به متن تبدیل می شود. سپس متن یک زبان به متن در زبان دیگر تبدیل می شود. پس از این، متن به دست آمده به گفتار به زبان مورد نظر تبدیل می شود. این روش به خوبی جواب می دهد، اما بدون اشکال نیست. در هر مرحله ممکن است خطاهایی رخ دهد که روی یکدیگر همپوشانی داشته باشند و منجر به کاهش کیفیت ترجمه شوند.

برای دستیابی به نتیجه مطلوب، محققان طیف نگارهای صوتی را مورد مطالعه قرار دادند. آنها تلاش کردند تا با نادیده گرفتن مراحل تبدیل صدا به متن، طیف نگاری در یک زبان را به طیف نگاری در زبان دیگر تبدیل کنند.


Google Translatotron یک فناوری ترجمه همزمان گفتار است که صدای کاربر را تقلید می کند

شایان ذکر است که علیرغم پیچیدگی چنین تحولی، پردازش گفتار در یک مرحله اتفاق می افتد و نه در سه مرحله، همانطور که قبلاً اتفاق افتاد. Translatotron با در اختیار داشتن مقدار کافی از قدرت محاسباتی، ترجمه همزمان را بسیار سریعتر انجام می دهد. نکته مهم دیگر این است که این رویکرد به شما امکان می دهد ویژگی ها و لحن صدای اصلی را حفظ کنید.

در این مرحله، Translatotron نمی تواند به همان دقت ترجمه بالا مانند سیستم های استاندارد ببالد. با وجود این، محققان می گویند که اکثر ترجمه های انجام شده از کیفیت کافی برخوردار هستند. در آینده، کار بر روی Translatotron ادامه خواهد یافت، زیرا محققان قصد دارند ترجمه همزمان گفتار را بهتر کنند.



منبع: 3dnews.ru

اضافه کردن نظر