Cập nhật codec âm thanh mở Lyra 1.3

Google đã xuất bản bản phát hành codec âm thanh Lyra 1.3, nhằm đạt được khả năng truyền giọng nói chất lượng cao trong điều kiện lượng thông tin được truyền đi hạn chế. Chất lượng giọng nói ở tốc độ bit 3.2 kbps, 6 kbps và 9.2 kbps khi sử dụng codec Lyra gần tương đương với tốc độ bit 10 kbps, 13 kbps và 14 kbps khi sử dụng codec Opus. Để giải quyết vấn đề này, ngoài các phương pháp nén âm thanh và chuyển đổi tín hiệu thông thường, Lyra còn sử dụng mô hình giọng nói dựa trên hệ thống máy học, cho phép bạn tạo lại thông tin còn thiếu dựa trên các đặc điểm giọng nói điển hình. Việc triển khai mã tham chiếu được viết bằng C++ và được phân phối theo giấy phép Apache 2.0.

Không giống như bản phát hành Lyra 1.2 được thiết kế lại hoàn toàn được đề xuất vào tháng 1.3, được chuyển sang kiến ​​trúc mạng thần kinh mới, phiên bản 32 tối ưu hóa mô hình học máy mà không thay đổi kiến ​​trúc. Phiên bản mới sử dụng số nguyên 8 bit thay vì số dấu phẩy động 43 bit để lưu trữ trọng số và thực hiện các phép tính số học, giúp giảm 20% kích thước mô hình và tăng tốc 6% khi thử nghiệm trên điện thoại thông minh Pixel XNUMX Pro. Chất lượng giọng nói được duy trì ở mức tương tự nhưng định dạng của dữ liệu truyền đã thay đổi và không tương thích với các phiên bản trước.

Nguồn: opennet.ru

Thêm một lời nhận xét