Навсозии Mozilla Common Voice 12.0

Mozilla маҷмӯи маълумотҳои Common Voice-и худро нав кард, то намунаҳои талаффузи беш аз 200 нафарро дар бар гирад. Маълумот ҳамчун домени ҷамъиятӣ (CC0) нашр карда мешавад. Маҷмӯаҳои пешниҳодшуда метавонанд дар системаҳои омӯзиши мошинсозӣ барои сохтани моделҳои шинохти нутқ ва синтез истифода шаванд.

Хачми материали нутки дар мачмуа аз 23.8 то 25.8 хазор соати нутк назар ба навсозии пештара афзуд. Дар тайёр кардани материалхо ба забони англией зиёда аз 88 хазор нафар одамон иштирок карда, диктант 3161 соати нуткро (84 хазор иштироккунанда ва 3098 соат) ташкил намуданд. Маҷмӯа барои забони белорус 7903 иштирокчӣ ва 1419 соат маводи нутқ (6965 иштирокчӣ ва 1217 соат), забони русӣ 2815 иштирокчӣ ва 229 соат (2731 иштирокчӣ ва 215 соат), ӯзбекӣ 2092 иштирокчӣ ва 262 соатро дар бар мегирад. 2025 нафар ва 258 соат), забони украинй — 780 нафар ва 87 соат (759 нафар ва 87 соат).

Ҳадафи лоиҳаи "Овози умумӣ" ташкили кори муштарак барои ҷамъоварӣ кардани махзани намунаҳои овоз, ки гуногунии овозҳо ва услубҳои нутқро ба инобат мегирад. Истифодабарандагон ба ибораҳои овозии дар экран нишондодашуда даъват карда мешаванд ё сифати маълумоти аз ҷониби корбарони дигар иловашударо арзёбӣ мекунанд. Махзани маълумотҳои ҷамъшуда бо сабти талаффузҳои гуногуни ибораҳои маъмулии нутқи инсон метавонад бидуни маҳдудият дар системаҳои омӯзиши мошинсозӣ ва лоиҳаҳои тадқиқотӣ истифода шавад.

Манбаъ: opennet.ru

Илова Эзоҳ