Випуск Firefox 78.0.1 та оновлення голосових даних Mozilla Common Voice

Опубліковано екстрений коригуючий випуск Firefox 78.0.1, в якому усунена спливла в Firefox 78 проблема, що приводила до зникнення встановлених пошукових движків. Після оновлення браузера список швидкого доступу до пошукових систем у деяких користувачів виявився порожнім, порушилася робота автодоповнення введення в адресному рядку і перестали надсилатися запити через поле пошуку на стартовій сторінці. Причиною збою опинився включення у Firefox 78 функції синхронізації налаштувань пошукових систем. У Firefox 78.0.1 видалене вилучення налаштувань відключено та повернуто локальний метод зберігання.

Також із затримкою майже на добу розкрито відомості про усунені в Firefox 78 вразливості. У Firefox 78 усунуто 16 уразливостей, з яких 10 позначені як небезпечні. Чотири вразливості, зібрані під CVE-2020-12426 потенційно здатні привести до виконання коду зловмисника при відкритті спеціально оформлених сторінок. Нагадаємо, що проблеми з пам'яттю, такі як переповнення буферів і звернення до звільнених областей пам'яті, з недавніх пір позначаються як небезпечні, але не критичні.

Крім того, анонсовано оновлення наборів голосових даних, зібраних внаслідок ініціативи Загальний голос і що включає приклади вимови близько ста тисяч людей. У сумі було отримано 7226 годин (перевірено 5591 годину) мовного матеріалу 54 мовами, 14 з яких були запропоновані вперше. У тому числі опубліковано набір для української мови, підготовлений завдяки роботі 235 учасників, які надиктували 22 години. Для російської мови кількість учасників збільшилася до
928, а обсяг мовного матеріалу зріс до 105 годин. Для порівняння у підготовці матеріалів англійською мовою взяли участь понад 60 тисяч осіб, які надиктували 1452 години підтвердженої мови.

Запропоновані набори можна використовувати в системах машинного навчання для побудови моделей розпізнавання и синтезу промови. Дані опубліковано як суспільне надбання (CC0). Нагадаємо, що проект Common Voice націлений на організацію спільної роботи з накопичення бази голосових шаблонів, що враховує всю різноманітність голосів та манер мови. Користувачам пропонується озвучити фрази, що виводяться на екран, або оцінити якість даних, доданих іншими користувачами. Накопичену базу даних із записами різної вимови типових фраз людської мови без обмежень можна використовувати в системах машинного навчання та в дослідницьких проектах.

Серед недоліків проекту Common Voice автор бібліотеки розпізнавання злитого мовлення Vosk назвав однобокість голосового матеріалу (переважання людей чоловічої статі 20-30 років, і недолік матеріла з голосом жінок, дітей і людей похилого віку), відсутність варіативності словника (повторення одних і тих же фраз), поширення записів у форматі MP3, що вносить спотворення, створення нового проекту замість приєднання до існуючого VoxForge.

Джерело: opennet.ru

Додати коментар або відгук