Google Translatotron to technologia symultanicznego tłumaczenia mowy, która imituje głos użytkownika

Programiści z Google zaprezentowali nowy projekt, w ramach którego stworzyli technologię zdolną do tłumaczenia wypowiadanych zdań z jednego języka na drugi. Główną różnicą między nowym tłumaczem o nazwie Translatotron a jego odpowiednikami jest to, że pracuje on wyłącznie z dźwiękiem, bez użycia tekstu pośredniego. Takie podejście pozwoliło znacznie przyspieszyć pracę tłumacza. Na uwagę zasługuje również to, że system dość dokładnie imituje częstotliwość i ton głośnika.

Translatotron powstał dzięki ciągłej, kilkuletniej pracy. Badacze Google już od dawna rozważali możliwość bezpośredniej konwersji mowy, ale do niedawna nie mogli zrealizować swoich planów.

Google Translatotron to technologia symultanicznego tłumaczenia mowy, która imituje głos użytkownika

Stosowane współcześnie systemy tłumaczeń symultanicznych najczęściej działają według tego samego algorytmu. Na początkowym etapie oryginalna mowa zostaje przekształcona w tekst. Tekst w jednym języku jest następnie zamieniany na tekst w drugim języku. Następnie powstały tekst jest konwertowany na mowę w żądanym języku. Metoda ta sprawdza się znakomicie, choć nie jest pozbawiona wad. Na każdym etapie mogą pojawić się błędy, które nakładają się na siebie i prowadzą do obniżenia jakości tłumaczenia.

Aby osiągnąć pożądany rezultat, naukowcy zbadali spektrogramy dźwięku. Próbowali przekształcić spektrogram w jednym języku w spektrogram w innym języku, pomijając etapy konwersji dźwięku na tekst.


Google Translatotron to technologia symultanicznego tłumaczenia mowy, która imituje głos użytkownika

Warto zaznaczyć, że pomimo złożoności takiej transformacji, przetwarzanie mowy odbywa się w jednym kroku, a nie w trzech, jak miało to miejsce wcześniej. Mając do dyspozycji odpowiednią moc obliczeniową, Translatotron zrealizuje tłumaczenie symultaniczne znacznie szybciej. Kolejną ważną kwestią jest to, że takie podejście pozwala zachować cechy i intonację oryginalnego głosu.

Na tym etapie Translatotron nie może pochwalić się tak wysoką dokładnością tłumaczenia, jak systemy standardowe. Mimo to badacze twierdzą, że większość wykonanych tłumaczeń jest na wystarczającym poziomie. W przyszłości prace nad Translatotronem będą kontynuowane, ponieważ badacze zamierzają ulepszyć symultaniczne tłumaczenie mowy.



Źródło: 3dnews.ru

Dodaj komentarz