A Google Translatotron egy szimultán beszédfordítási technológia, amely utánozza a felhasználó hangját

A Google fejlesztői bemutattak egy új projektet, amelyben olyan technológiát hoztak létre, amely képes a kimondott mondatokat egyik nyelvről a másikra lefordítani. A fő különbség a Translatotron nevű új fordító és analógjai között az, hogy kizárólag hanggal működik, közbenső szöveg használata nélkül. Ez a megközelítés lehetővé tette a fordítói munka jelentős felgyorsítását. Egy másik figyelemre méltó szempont, hogy a rendszer meglehetősen pontosan utánozza a hangszóró frekvenciáját és hangszínét.

A Translatotron több évig tartó folyamatos munkának köszönhetően jött létre. A Google kutatói már régóta fontolgatták a közvetlen beszédkonverzió lehetőségét, de egészen a közelmúltig nem tudták megvalósítani terveiket.

A Google Translatotron egy szimultán beszédfordítási technológia, amely utánozza a felhasználó hangját

A ma használt szinkronfordító rendszerek legtöbbször ugyanazon algoritmus szerint működnek. A kezdeti szakaszban az eredeti beszéd szöveggé alakul. Az egyik nyelvű szöveg ezután a másik nyelvű szöveggé alakul. Ezt követően a kapott szöveget a kívánt nyelvű beszéddé alakítja. Ez a módszer jól működik, de nem mentes a hátrányaitól. Minden szakaszban előfordulhatnak olyan hibák, amelyek átfedik egymást, és a fordítás minőségének csökkenéséhez vezetnek.

A kívánt eredmény elérése érdekében a kutatók hangspektrogramokat tanulmányoztak. Megpróbáltak elérni, hogy az egyik nyelv spektrogramja egy másik nyelv spektrogramjává változzon, kihagyva a hang szöveggé alakításának lépéseit.


A Google Translatotron egy szimultán beszédfordítási technológia, amely utánozza a felhasználó hangját

Érdemes megjegyezni, hogy egy ilyen transzformáció bonyolultsága ellenére a beszédfeldolgozás egy lépésben történik, és nem három lépésben, mint korábban. A megfelelő mennyiségű számítási teljesítmény birtokában a Translatotron sokkal gyorsabban hajtja végre a szinkronfordítást. Egy másik fontos szempont, hogy ez a megközelítés lehetővé teszi az eredeti hang vonásainak és intonációjának megőrzését.

Ebben a szakaszban a Translatotron nem büszkélkedhet olyan nagy fordítási pontossággal, mint a szabványos rendszerek. Ennek ellenére a kutatók szerint az elvégzett fordítások többsége megfelelő minőségű. A jövőben a Translatotronnal kapcsolatos munka tovább folytatódik, mivel a kutatók a szinkronbeszéd-fordítást kívánják jobbá tenni.



Forrás: 3dnews.ru

Hozzászólás