Aktualizacja głosu Mozilla Common Voice 9.0

Mozilla udostępniła aktualizację swoich zbiorów danych Common Voice, które obejmują próbki wymowy prawie 200 0 osób. Dane są publikowane jako domena publiczna (CCXNUMX). Proponowane zestawy można wykorzystać w systemach uczenia maszynowego do budowy modeli rozpoznawania i syntezy mowy.

W porównaniu z poprzednią aktualizacją objętość materiału mowy w zbiorze wzrosła o 10% - z 18.2 do 20.2 tys. godzin przemówień. Liczba obsługiwanych języków wzrosła z 87 do 93. 27 języków zgromadziło ponad 100 godzin danych mowy, a 9 zgromadziło ponad 500 godzin danych mowy. W przypadku 9 języków udało się również osiągnąć udział mowy żeńskiej na poziomie co najmniej 45%.

W przygotowaniu materiałów w języku angielskim wzięło udział ponad 81 tys. osób, dyktując 2953 godziny wystąpień (uczestniczyło 79 tys. uczestników i 2886 godzin). Zestaw dla języka białoruskiego obejmuje 6326 uczestników i 1054 godziny materiału przemówień (było 6160 uczestników i 987 godzin), rosyjskiego – 2585 uczestników i 201 godzin (było 2452 uczestników i 193 godziny), uzbecki – 1503 uczestników i 231 godzin ( wzięło w nim udział 1355 uczestników i 227 godzin), język ukraiński – 696 uczestników i 79 godzin (było 684 uczestników i 76 godzin).

Projekt Common Voice ma na celu zorganizowanie wspólnej pracy w celu zgromadzenia bazy danych wzorców głosu, uwzględniającej różnorodność głosów i stylów mowy. Użytkownicy mogą wypowiadać frazy wyświetlane na ekranie lub oceniać jakość danych dodanych przez innych użytkowników. Zgromadzona baza danych zawierająca zapisy różnych wymów typowych zwrotów mowy ludzkiej może być bez ograniczeń wykorzystywana w systemach uczenia maszynowego oraz w projektach badawczych.

Źródło: opennet.ru

Dodaj komentarz