Google Translatotron és una tecnologia de traducció de veu simultània que imita la veu de l'usuari

Els desenvolupadors de Google van presentar un nou projecte en què van crear una tecnologia capaç de traduir frases parlades d'un idioma a un altre. La principal diferència entre el nou traductor, anomenat Translatotron, i els seus anàlegs és que funciona exclusivament amb so, sense utilitzar text intermedi. Aquest enfocament va permetre accelerar significativament el treball del traductor. Un altre punt a destacar és que el sistema imita amb força precisió la freqüència i el to de l'altaveu.

Translatotron es va crear gràcies a un treball continu que va durar diversos anys. Els investigadors de Google han estat considerant la possibilitat de la conversió directa de la parla durant molt de temps, però fins fa poc no podien implementar els seus plans.

Google Translatotron és una tecnologia de traducció de veu simultània que imita la veu de l'usuari

Els sistemes de traducció simultània que s'utilitzen avui en dia funcionen amb més freqüència segons el mateix algorisme. En l'etapa inicial, el discurs original es transforma en text. A continuació, el text d'una llengua es converteix en text de l'altra llengua. Després d'això, el text resultant es converteix en veu en l'idioma desitjat. Aquest mètode funciona bé, però no està exempt dels seus inconvenients. En cada etapa, es poden produir errors que se superposen entre si i condueixen a una disminució de la qualitat de la traducció.

Per aconseguir el resultat desitjat, els investigadors van estudiar espectrogrames de so. Van intentar que un espectrograma en un idioma es convertís en un espectrograma en un altre idioma, saltant els passos de conversió d'àudio a text.


Google Translatotron és una tecnologia de traducció de veu simultània que imita la veu de l'usuari

Val la pena assenyalar que, malgrat la complexitat d'aquesta transformació, el processament de la parla es produeix en un pas, i no en tres, com passava abans. Tenint a la seva disposició una quantitat suficient de potència de càlcul, Translatotron durà a terme la traducció simultània molt més ràpid. Un altre punt important és que aquest enfocament us permet preservar les característiques i l'entonació de la veu original.

En aquesta fase, Translatotron no pot presumir de la mateixa precisió de traducció que els sistemes estàndard. Malgrat això, els investigadors asseguren que la majoria de traduccions realitzades són de suficient qualitat. En el futur, el treball sobre Translatotron continuarà, ja que els investigadors tenen la intenció de millorar la traducció de la parla simultània.



Font: 3dnews.ru

Afegeix comentari