Google Translatotron est une technologie de traduction vocale simultanée qui imite la voix de l'utilisateur

Les développeurs de Google ont présenté un nouveau projet dans lequel ils ont créé une technologie capable de traduire des phrases parlées d'une langue à une autre. La principale différence entre le nouveau traducteur appelé Translatotron et ses analogues est qu'il fonctionne exclusivement avec le son, sans utiliser de texte intermédiaire. Cette approche a permis d’accélérer considérablement le travail du traducteur. Un autre point remarquable est que le système imite assez précisément la fréquence et le ton du locuteur.

Translatotron a été créé grâce à un travail continu qui a duré plusieurs années. Les chercheurs de Google envisagent depuis longtemps la possibilité d'une conversion directe de la parole, mais jusqu'à récemment, ils n'ont pas pu mettre en œuvre leurs plans.

Google Translatotron est une technologie de traduction vocale simultanée qui imite la voix de l'utilisateur

Les systèmes de traduction simultanée utilisés aujourd’hui fonctionnent le plus souvent selon le même algorithme. Au stade initial, le discours original est transformé en texte. Le texte dans une langue est ensuite transformé en texte dans l’autre langue. Après cela, le texte résultant est converti en parole dans la langue souhaitée. Cette méthode fonctionne bien, mais elle n’est pas sans inconvénients. A chaque étape, des erreurs peuvent survenir qui se chevauchent et entraînent une diminution de la qualité de la traduction.

Pour obtenir le résultat souhaité, les chercheurs ont étudié des spectrogrammes sonores. Ils ont essayé de transformer un spectrogramme dans une langue en un spectrogramme dans une autre langue, en sautant les étapes de conversion de l'audio en texte.


Google Translatotron est une technologie de traduction vocale simultanée qui imite la voix de l'utilisateur

Il est à noter que malgré la complexité d'une telle transformation, le traitement de la parole s'effectue en une seule étape, et non en trois, comme c'était le cas auparavant. Disposant d'une puissance de calcul suffisante, Translatotron réalisera la traduction simultanée beaucoup plus rapidement. Un autre point important est que cette approche permet de conserver les caractéristiques et l'intonation de la voix originale.

À ce stade, Translatotron ne peut pas se vanter d’avoir la même précision de traduction élevée que les systèmes standards. Malgré cela, les chercheurs affirment que la plupart des traductions réalisées sont de qualité suffisante. À l’avenir, les travaux sur Translatotron se poursuivront, les chercheurs ayant l’intention d’améliorer la traduction simultanée de la parole.



Source: 3dnews.ru

Ajouter un commentaire