Η Mozilla ενημέρωσε τα σύνολα δεδομένων Common Voice, τα οποία περιλαμβάνουν δείγματα ομιλίας από περισσότερα από 200 άτομα. Τα δεδομένα δημοσιεύονται στο κοινό (CC0). Τα προτεινόμενα σύνολα μπορούν να χρησιμοποιηθούν σε συστήματα μηχανικής μάθησης για την κατασκευή μοντέλων αναγνώρισης και σύνθεσης ομιλίας.
Σε σύγκριση με την προηγούμενη ενημέρωση, ο όγκος του υλικού ομιλίας στη συλλογή έχει αυξηθεί από 23.8 σε 25.8 χιλιάδες ώρες ομιλίας. Περισσότεροι από 88 χιλιάδες άνθρωποι συμμετείχαν στην προετοιμασία του υλικού στα αγγλικά, υπαγορεύοντας 3161 ώρες ομιλίας (υπήρχαν 84 χιλιάδες συμμετέχοντες και 3098 ώρες). Το σετ για τη λευκορωσική γλώσσα καλύπτει 7903 συμμετέχοντες και 1419 ώρες υλικού ομιλίας (υπήρχαν 6965 συμμετέχοντες και 1217 ώρες), ρωσική γλώσσα - 2815 συμμετέχοντες και 229 ώρες (υπήρχαν 2731 συμμετέχοντες και 215 ώρες), ουζμπεκική γλώσσα - 2092 συμμετέχοντες και 262 ώρες (υπήρχαν 2025 συμμετέχοντες και 258 ώρες), ουκρανική γλώσσα - 780 συμμετέχοντες και 87 ώρες (υπήρχαν 759 συμμετέχοντες και 87 ώρες).
Το έργο Common Voice στοχεύει στην οργάνωση κοινής εργασίας για τη συγκέντρωση μιας βάσης δεδομένων φωνητικών προτύπων που λαμβάνει υπόψη την ποικιλομορφία των φωνών και των στυλ ομιλίας. Οι χρήστες καλούνται σε φωνητικές φράσεις που εμφανίζονται στην οθόνη ή αξιολογούν την ποιότητα των δεδομένων που προστίθενται από άλλους χρήστες. Η συσσωρευμένη βάση δεδομένων με αρχεία διαφόρων προφορών τυπικών φράσεων ανθρώπινης ομιλίας μπορεί να χρησιμοποιηθεί χωρίς περιορισμούς σε συστήματα μηχανικής μάθησης και σε ερευνητικά έργα.
Πηγή: opennet.ru
