Выпуск Firefox 78.0.1 і абнаўленне галасавых дадзеных Mozilla Common Voice

Апублікаваны экстраны карэкціруючы выпуск Firefox 78.0.1, у якім ліквідавана ўсплылая ў Firefox 78 праблема, якая прыводзіла да знікнення ўсталяваных пошукавых рухавічкоў. Пасля абнаўлення браўзэра спіс хуткага доступу да пошукавых сістэм у некаторых карыстальнікаў аказаўся пустым, парушылася праца аўтадапаўнення ўводу ў адрасным радку і перасталі адпраўляцца запыты праз поле пошуку на стартавай старонцы. Прычынай збою аказалася уключэнне ў Firefox 78 функцыі сінхранізацыі налад пошукавых сістэм. У Firefox 78.0.1 выдаленае выманне налад адключана і вернуты лакальны метад захоўвання.

Таксама з затрымкай амаль на суткі раскрыты звесткі аб ухіленых у Firefox 78 уразлівасцях. У Firefox 78 ухілена 16 уразлівасцяў, з якіх 10 пазначаныя як небяспечныя. Чатыры ўразлівасці, сабраныя пад CVE-2020-12426, патэнцыйна здольныя прывесці да выканання кода зламысніка пры адкрыцці спецыяльна аформленых старонак. Нагадаем, што праблемы з памяццю, такія як перапаўненні буфераў і зварот да ўжо вызваленых абласцей памяці, з нядаўніх часоў адзначаюцца як небяспечныя, але не крытычныя.

Акрамя таго, анансавана абнаўленне набораў галасавых дадзеных, сабраных у выніку ініцыятывы Common Voice і які ўключае прыклады вымаўлення каля ста тысяч людзей. У суме было атрымана 7226 гадзін (праверана 5591 гадзіна) маўленчага матэрыялу на 54 мовах, 14 з якіх былі прапанаваны ўпершыню. У тым ліку апублікаваны набор для ўкраінскай мовы, падрыхтаваны дзякуючы працы 235 удзельнікаў, якія дыктавалі 22 гадзіны. Для рускай мовы колькасць удзельнікаў павялічылася да
928, а аб'ём маўленчага матэрыялу вырас да 105 гадзін. Для параўнання ў падрыхтоўцы матэрыялаў на англійскай мове прынялі ўдзел больш за 60 тысяч чалавек, якія дыктавалі 1452 гадзіны пацверджанай прамовы.

Прапанаваныя наборы можна выкарыстоўваць у сістэмах машыннага навучання для пабудовы мадэляў распазнання и сінтэзу прамовы. Дадзеныя апублікаваныя як грамадскі здабытак (CC0). Нагадаем, што праект Common Voice накіраваны на арганізацыю сумеснай працы па назапашванні базы галасавых шаблонаў, якая ўлічвае ўсю разнастайнасць галасоў і манер гаворкі. Карыстачам прапануецца агучыць фразы, якія выводзяцца на экран, або ацаніць якасць дадзеных, дададзеных іншымі карыстальнікамі. Назапашаную базу дадзеных з запісамі рознага вымаўлення тыпавых фраз чалавечай гаворкі без абмежаванняў можна выкарыстоўваць у сістэмах машыннага навучання і ў даследчых праектах.

Сярод недахопаў праекта Common Voice аўтар бібліятэкі распазнання злітнай гаворкі Vosk назваў аднабокасць галасавога матэрыялу (перавага людзей мужчынскага полу 20-30 гадоў, і недахоп матэрыялу з голасам жанчын, дзяцей і пажылых людзей), адсутнасць варыятыўнасці слоўніка (паўтарэнне адных і тых жа фраз), распаўсюджванне запісаў ва ўносячым скажэнні фармаце MP3, стварэнне новага праекту замест далучэння да існуючага VoxForge.

Крыніца: opennet.ru

Дадаць каментар