Google mở các nguồn còn thiếu cho Lyra Audio Codec

Google đã xuất bản bản cập nhật cho codec âm thanh Lyra 0.0.2, được tối ưu hóa để đạt được chất lượng giọng nói tối đa khi sử dụng các kênh liên lạc rất chậm. Codec này đã được mở vào đầu tháng 0.0.2 nhưng được cung cấp cùng với thư viện toán học độc quyền. Trong phiên bản 2.0, nhược điểm này đã được loại bỏ và một thư viện thay thế mở đã được tạo cho thư viện được chỉ định - spzzy_matmul, giống như chính codec, được phân phối theo giấy phép Apache XNUMX. Các cải tiến khác bao gồm khả năng sử dụng hệ thống xây dựng Bazel với trình biên dịch GCC và việc sử dụng gói này theo mặc định trong Linux thay vì Bazel+Clang.

Chúng ta hãy nhớ lại rằng về chất lượng dữ liệu giọng nói được truyền ở tốc độ thấp, Lyra vượt trội hơn đáng kể so với các codec truyền thống sử dụng phương pháp xử lý tín hiệu số. Để đạt được khả năng truyền giọng nói chất lượng cao trong điều kiện lượng thông tin truyền đi hạn chế, ngoài các phương pháp nén âm thanh và chuyển đổi tín hiệu thông thường, Lyra sử dụng mô hình giọng nói dựa trên hệ thống máy học, cho phép bạn tạo lại thông tin còn thiếu dựa trên đặc điểm lời nói điển hình. Mô hình được sử dụng để tạo ra âm thanh đã được đào tạo bằng cách sử dụng hàng nghìn giờ ghi âm giọng nói bằng hơn 70 ngôn ngữ. Hiệu suất triển khai được đề xuất là đủ để mã hóa và giải mã giọng nói theo thời gian thực trên điện thoại thông minh giá trung bình, với độ trễ truyền tín hiệu là 90 mili giây.

Nguồn: opennet.ru

Thêm một lời nhận xét