توسعه دهندگان گوگل پروژه جدیدی را ارائه کردند که در آن فناوری را ایجاد کردند که قادر به ترجمه جملات گفتاری از یک زبان به زبان دیگر است. تفاوت اصلی مترجم جدید به نام Translatotron و آنالوگ های آن این است که به طور انحصاری با صدا و بدون استفاده از متن میانی کار می کند. این رویکرد باعث شد تا سرعت کار مترجم به میزان قابل توجهی افزایش یابد. نکته قابل توجه دیگر این است که سیستم به طور کاملا دقیق فرکانس و تن صدای بلندگو را تقلید می کند.
Translatotron به لطف کار مداوم که چندین سال طول کشید ایجاد شد. محققان گوگل مدتهاست که امکان تبدیل گفتار مستقیم را بررسی میکنند، اما تا همین اواخر نتوانستند برنامههای خود را اجرا کنند.
سیستمهای ترجمه همزمان که امروزه مورد استفاده قرار میگیرند اغلب بر اساس همان الگوریتم کار میکنند. در مرحله اولیه، گفتار اصلی به متن تبدیل می شود. سپس متن یک زبان به متن در زبان دیگر تبدیل می شود. پس از این، متن به دست آمده به گفتار به زبان مورد نظر تبدیل می شود. این روش به خوبی جواب می دهد، اما بدون اشکال نیست. در هر مرحله ممکن است خطاهایی رخ دهد که روی یکدیگر همپوشانی داشته باشند و منجر به کاهش کیفیت ترجمه شوند.
برای دستیابی به نتیجه مطلوب، محققان طیف نگارهای صوتی را مورد مطالعه قرار دادند. آنها تلاش کردند تا با نادیده گرفتن مراحل تبدیل صدا به متن، طیف نگاری در یک زبان را به طیف نگاری در زبان دیگر تبدیل کنند.
شایان ذکر است که علیرغم پیچیدگی چنین تحولی، پردازش گفتار در یک مرحله اتفاق می افتد و نه در سه مرحله، همانطور که قبلاً اتفاق افتاد. Translatotron با در اختیار داشتن مقدار کافی از قدرت محاسباتی، ترجمه همزمان را بسیار سریعتر انجام می دهد. نکته مهم دیگر این است که این رویکرد به شما امکان می دهد ویژگی ها و لحن صدای اصلی را حفظ کنید.
در این مرحله، Translatotron نمی تواند به همان دقت ترجمه بالا مانند سیستم های استاندارد ببالد. با وجود این، محققان می گویند که اکثر ترجمه های انجام شده از کیفیت کافی برخوردار هستند. در آینده، کار بر روی Translatotron ادامه خواهد یافت، زیرا محققان قصد دارند ترجمه همزمان گفتار را بهتر کنند.
منبع: 3dnews.ru