Mozilla Common Voice 12.0 Yeniləmə

Mozilla 200-dən çox insanın tələffüz nümunələrini daxil etmək üçün Common Voice məlumat dəstlərini yenilədi. Məlumatlar ictimai domen kimi dərc olunur (CC0). Təklif olunan dəstlər nitqin tanınması və sintez modellərinin qurulması üçün maşın öyrənmə sistemlərində istifadə oluna bilər.

Əvvəlki yeniləmə ilə müqayisədə topluda nitq materialının həcmi 23.8 min nitq saatından 25.8 min saata qədər artıb. İngilis dilində materialların hazırlanmasında 88 saat nitq diktə edən 3161 mindən çox insan iştirak edib (84 min iştirakçı və 3098 saat). Belarus dili üzrə komplekt 7903 iştirakçı və 1419 saat nitq materialını (6965 iştirakçı və 1217 saat), rus dilini - 2815 iştirakçını və 229 saatı (2731 iştirakçı və 215 saat), özbək dilini - 2092 iştirakçını və 262 saatı əhatə edir. 2025 iştirakçı və 258 saat), Ukrayna dili - 780 iştirakçı və 87 saat (759 iştirakçı və 87 saat).

“Common Voice” layihəsi səslərin və nitq üslublarının müxtəlifliyini nəzərə alan səs nümunələri məlumat bazasının toplanması üçün birgə iş təşkil etmək məqsədi daşıyır. İstifadəçilər ekranda göstərilən səsli ifadələrə dəvət olunur və ya digər istifadəçilər tərəfindən əlavə edilmiş məlumatların keyfiyyətini qiymətləndirirlər. İnsan nitqinin tipik ifadələrinin müxtəlif tələffüzlərinin qeydləri ilə yığılmış məlumat bazası maşın öyrənmə sistemlərində və tədqiqat layihələrində məhdudiyyət olmadan istifadə edilə bilər.

Mənbə: opennet.ru

Добавить комментарий