Mozilla a lansat o actualizare a setului de date Common Voice, care include mostre de pronunție de la aproape 200 de persoane. Datele sunt publicate ca domeniu public (CC0). Seturile propuse pot fi utilizate în sistemele de învățare automată pentru a construi modele de recunoaștere și sinteză a vorbirii.
În comparație cu actualizarea anterioară, volumul materialului de vorbire din colecție a crescut cu 10% - de la 18.2 la 20.2 mii de ore de vorbire. Numărul de limbi acceptate a crescut de la 87 la 93. Pentru 27 de limbi, au fost acumulate peste 100 de ore de date despre vorbire, iar pentru 9 - mai mult de 500 de ore de date despre vorbire. Pentru 9 limbi a fost, de asemenea, posibil să se obțină o pondere a vorbirii feminine de cel puțin 45%.
La pregătirea materialelor în limba engleză au participat peste 81 de mii de persoane, dictand 2953 de ore de discurs (au fost 79 de mii de participanți și 2886 de ore). Setul pentru limba belarusă acoperă 6326 de participanți și 1054 de ore de material de vorbire (au fost 6160 de participanți și 987 de ore), rusă - 2585 de participanți și 201 de ore (au fost 2452 de participanți și 193 de ore), uzbec - 1503 de participanți și 231 de ore ( au fost 1355 de participanți și 227 de ore), limba ucraineană - 696 de participanți și 79 de ore (au fost 684 de participanți și 76 de ore).
Proiectul Common Voice își propune să organizeze o muncă comună pentru a acumula o bază de date de modele de voce care ține cont de diversitatea vocilor și a stilurilor de vorbire. Utilizatorii sunt invitați să afișeze fraze vocale pe ecran sau să evalueze calitatea datelor adăugate de alți utilizatori. Baza de date acumulată cu înregistrări ale diferitelor pronunții ale frazelor tipice ale vorbirii umane poate fi utilizată fără restricții în sistemele de învățare automată și în proiecte de cercetare.
Sursa: opennet.ru
