Ενημέρωση φωνής Mozilla Common Voice 12.0

Η Mozilla έχει ενημερώσει τα σύνολα δεδομένων Common Voice για να περιλαμβάνει δείγματα προφοράς από περισσότερα από 200 άτομα. Τα δεδομένα δημοσιεύονται ως δημόσιο τομέα (CC0). Τα προτεινόμενα σύνολα μπορούν να χρησιμοποιηθούν σε συστήματα μηχανικής μάθησης για τη δημιουργία μοντέλων αναγνώρισης και σύνθεσης ομιλίας.

Σε σύγκριση με την προηγούμενη ενημέρωση, ο όγκος του υλικού ομιλίας στη συλλογή αυξήθηκε από 23.8 σε 25.8 χιλιάδες ώρες ομιλίας. Περισσότερα από 88 χιλιάδες άτομα συμμετείχαν στην προετοιμασία του υλικού στα αγγλικά, υπαγορεύοντας 3161 ώρες ομιλίας (υπήρχαν 84 χιλιάδες συμμετέχοντες και 3098 ώρες). Το σετ για τη Λευκορωσική γλώσσα καλύπτει 7903 συμμετέχοντες και 1419 ώρες υλικού ομιλίας (υπήρχαν 6965 συμμετέχοντες και 1217 ώρες), Ρωσικά - 2815 συμμετέχοντες και 229 ώρες (υπήρχαν 2731 συμμετέχοντες και 215 ώρες), Ουζμπεκιστάν - 2092 συμμετέχοντες και 262 ώρες ( υπήρξαν 2025 συμμετέχοντες και 258 ώρες), ουκρανική γλώσσα - 780 συμμετέχοντες και 87 ώρες (υπήρχαν 759 συμμετέχοντες και 87 ώρες).

Το έργο Common Voice στοχεύει στην οργάνωση κοινής εργασίας για τη συγκέντρωση μιας βάσης δεδομένων φωνητικών προτύπων που λαμβάνει υπόψη την ποικιλομορφία των φωνών και των στυλ ομιλίας. Οι χρήστες καλούνται σε φωνητικές φράσεις που εμφανίζονται στην οθόνη ή αξιολογούν την ποιότητα των δεδομένων που προστίθενται από άλλους χρήστες. Η συσσωρευμένη βάση δεδομένων με αρχεία διαφόρων προφορών τυπικών φράσεων ανθρώπινης ομιλίας μπορεί να χρησιμοποιηθεί χωρίς περιορισμούς σε συστήματα μηχανικής μάθησης και σε ερευνητικά έργα.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο