Google Translatotron là công nghệ dịch giọng nói đồng thời bắt chước giọng nói của người dùng

Các nhà phát triển của Google đã trình bày một dự án mới trong đó họ tạo ra một công nghệ có khả năng dịch các câu nói từ ngôn ngữ này sang ngôn ngữ khác. Sự khác biệt chính giữa trình dịch mới, được gọi là Translatotron, và các phiên bản tương tự của nó là nó chỉ hoạt động với âm thanh mà không sử dụng văn bản trung gian. Cách tiếp cận này giúp tăng tốc đáng kể công việc của người dịch. Một điểm đáng chú ý nữa là hệ thống bắt chước khá chính xác tần số và âm sắc của loa.

Translatotron được tạo ra nhờ quá trình làm việc liên tục kéo dài vài năm. Các nhà nghiên cứu tại Google đã xem xét khả năng chuyển đổi giọng nói trực tiếp từ lâu nhưng cho đến gần đây họ vẫn chưa thể thực hiện được kế hoạch của mình.

Google Translatotron là công nghệ dịch giọng nói đồng thời bắt chước giọng nói của người dùng

Các hệ thống dịch đồng thời được sử dụng ngày nay thường hoạt động theo cùng một thuật toán. Ở giai đoạn đầu, lời nói gốc được chuyển thành văn bản. Sau đó, văn bản bằng một ngôn ngữ sẽ được chuyển thành văn bản bằng ngôn ngữ kia. Sau đó, văn bản kết quả sẽ được chuyển đổi thành lời nói bằng ngôn ngữ mong muốn. Phương pháp này hoạt động tốt, nhưng không phải không có nhược điểm. Ở mỗi giai đoạn, các lỗi có thể xảy ra chồng chéo lên nhau và dẫn đến chất lượng bản dịch giảm sút.

Để đạt được kết quả mong muốn, các nhà nghiên cứu đã nghiên cứu quang phổ âm thanh. Họ đã cố gắng biến biểu đồ phổ ở ngôn ngữ này thành biểu đồ phổ ở ngôn ngữ khác, bỏ qua các bước chuyển đổi âm thanh thành văn bản.


Google Translatotron là công nghệ dịch giọng nói đồng thời bắt chước giọng nói của người dùng

Điều đáng chú ý là mặc dù sự phức tạp của quá trình chuyển đổi như vậy, việc xử lý giọng nói diễn ra trong một bước chứ không phải ba bước như trường hợp trước đây. Có đủ sức mạnh tính toán, Translatotron sẽ thực hiện dịch đồng thời nhanh hơn nhiều. Một điểm quan trọng khác là cách tiếp cận này cho phép bạn giữ được các đặc điểm và ngữ điệu của giọng gốc.

Ở giai đoạn này, Translatotron không thể tự hào về độ chính xác dịch thuật cao như các hệ thống tiêu chuẩn. Mặc dù vậy, các nhà nghiên cứu nói rằng hầu hết các bản dịch được thực hiện đều có chất lượng tốt. Trong tương lai, công việc trên Translatotron sẽ tiếp tục vì các nhà nghiên cứu dự định sẽ cải thiện khả năng dịch lời nói đồng thời tốt hơn.



Nguồn: 3dnews.ru

Thêm một lời nhận xét