Aktualizacja głosu Mozilla Common Voice 12.0

Mozilla zaktualizowała swoje zbiory danych Common Voice, aby uwzględnić próbki wymowy od ponad 200 0 osób. Dane są publikowane jako domena publiczna (CCXNUMX). Proponowane zestawy można wykorzystać w systemach uczenia maszynowego do budowy modeli rozpoznawania i syntezy mowy.

W porównaniu z poprzednią aktualizacją objętość materiału mowy w zbiorze wzrosła z 23.8 do 25.8 tys. godzin wystąpień. W przygotowaniu materiałów w języku angielskim wzięło udział ponad 88 tys. osób, dyktując 3161 godzin wystąpień (w sumie wzięło udział 84 tys. uczestników i 3098 godzin). Zestaw dla języka białoruskiego obejmuje 7903 uczestników i 1419 godzin materiału przemówień (było 6965 uczestników i 1217 godzin), rosyjskiego – 2815 uczestników i 229 godzin (było 2731 uczestników i 215 godzin), uzbecki – 2092 uczestników i 262 godziny ( wzięło udział 2025 uczestników i 258 godzin), język ukraiński – 780 uczestników i 87 godzin (było 759 uczestników i 87 godzin).

Projekt Common Voice ma na celu zorganizowanie wspólnej pracy w celu zgromadzenia bazy danych wzorców głosu, uwzględniającej różnorodność głosów i stylów mowy. Użytkownicy mogą wypowiadać frazy wyświetlane na ekranie lub oceniać jakość danych dodanych przez innych użytkowników. Zgromadzona baza danych zawierająca zapisy różnych wymów typowych zwrotów mowy ludzkiej może być bez ograniczeń wykorzystywana w systemach uczenia maszynowego oraz w projektach badawczych.

Źródło: opennet.ru

Dodaj komentarz