Cập nhật Mozilla Common Voice 12.0

Mozilla đã cập nhật bộ dữ liệu Common Voice để bao gồm các mẫu phát âm từ hơn 200 người. Dữ liệu được xuất bản dưới dạng phạm vi công cộng (CC0). Các bộ được đề xuất có thể được sử dụng trong các hệ thống máy học để xây dựng các mô hình tổng hợp và nhận dạng giọng nói.

So với bản cập nhật trước, khối lượng tài liệu lời nói trong bộ sưu tập đã tăng từ 23.8 lên 25.8 nghìn giờ lời nói. Hơn 88 nghìn người đã tham gia chuẩn bị tài liệu bằng tiếng Anh, viết chính tả 3161 giờ phát biểu (có 84 nghìn người tham gia và 3098 giờ). Bộ dành cho ngôn ngữ Belarus bao gồm 7903 người tham gia và 1419 giờ tài liệu phát biểu (có 6965 người tham gia và 1217 giờ), tiếng Nga - 2815 người tham gia và 229 giờ (có 2731 người tham gia và 215 giờ), tiếng Uzbek - 2092 người tham gia và 262 giờ ( có 2025 người tham gia và 258 giờ), tiếng Ukraina - 780 người tham gia và 87 giờ (có 759 người tham gia và 87 giờ).

Dự án Common Voice nhằm mục đích tổ chức công việc chung để tích lũy cơ sở dữ liệu về các mẫu giọng nói có tính đến sự đa dạng của giọng nói và phong cách nói. Người dùng được mời nói các cụm từ hiển thị trên màn hình hoặc đánh giá chất lượng dữ liệu do người dùng khác thêm vào. Cơ sở dữ liệu tích lũy với các bản ghi cách phát âm khác nhau của các cụm từ điển hình trong giọng nói của con người có thể được sử dụng mà không bị hạn chế trong các hệ thống máy học và trong các dự án nghiên cứu.

Nguồn: opennet.ru

Thêm một lời nhận xét