Mozilla vydala aktualizáciu svojich datasetov Common Voice, ktoré obsahujú ukážky výslovnosti od takmer 200 0 ľudí. Údaje sú zverejnené ako verejné dielo (CCXNUMX). Navrhované sady môžu byť použité v systémoch strojového učenia na vytváranie modelov rozpoznávania reči a syntézy.
V porovnaní s predchádzajúcou aktualizáciou sa objem rečového materiálu v zbierke zvýšil o 10 % – z 18.2 na 20.2 tisíc hodín reči. Počet podporovaných jazykov sa zvýšil z 87 na 93. Pre 27 jazykov sa nazhromaždilo viac ako 100 hodín rečových dát a pre 9 - viac ako 500 hodín rečových dát. Pre 9 jazykov bolo možné dosiahnuť aj podiel ženskej reči aspoň 45 %.
Na príprave materiálov v angličtine sa podieľalo viac ako 81 tisíc ľudí, ktorí nadiktovali 2953 hodín prejavu (79 tisíc účastníkov a 2886 hodín). Súbor pre bieloruský jazyk pokrýva 6326 účastníkov a 1054 hodín rečníckeho materiálu (zúčastnilo sa 6160 účastníkov a 987 hodín), ruský jazyk - 2585 účastníkov a 201 hodín (2452 účastníkov a 193 hodín), uzbecký - 1503 účastníkov a 231 hodín ( bolo 1355 účastníkov a 227 hodín), ukrajinský jazyk - 696 účastníkov a 79 hodín (bolo 684 účastníkov a 76 hodín).
Cieľom projektu Common Voice je zorganizovať spoločnú prácu s cieľom zhromaždiť databázu hlasových vzorov, ktorá zohľadňuje rôznorodosť hlasov a štýlov reči. Používatelia sú pozývaní na hlasové frázy zobrazené na obrazovke alebo na vyhodnotenie kvality údajov pridaných inými používateľmi. Nahromadená databáza so záznamami rôznych výslovností typických fráz ľudskej reči môže byť bez obmedzení použitá v systémoch strojového učenia a vo výskumných projektoch.
Zdroj: opennet.ru
