Ανοιχτή ενημέρωση κωδικοποιητή ήχου Lyra 1.3

Η Google δημοσίευσε την κυκλοφορία του κωδικοποιητή ήχου Lyra 1.3, με στόχο την επίτευξη υψηλής ποιότητας μετάδοσης φωνής σε συνθήκες περιορισμένου όγκου μεταδιδόμενων πληροφοριών. Η ποιότητα ομιλίας σε ρυθμούς bit 3.2 kbps, 6 kbps και 9.2 kbps κατά τη χρήση του κωδικοποιητή Lyra είναι περίπου ισοδύναμη με ρυθμούς bit 10 kbps, 13 kbps και 14 kbps όταν χρησιμοποιείται ο κωδικοποιητής Opus. Για την επίλυση αυτού του προβλήματος, εκτός από τις συμβατικές μεθόδους συμπίεσης ήχου και μετατροπής σήματος, η Lyra χρησιμοποιεί ένα μοντέλο ομιλίας που βασίζεται σε ένα σύστημα μηχανικής εκμάθησης, το οποίο σας επιτρέπει να αναδημιουργήσετε τις πληροφορίες που λείπουν με βάση τυπικά χαρακτηριστικά ομιλίας. Η υλοποίηση του κώδικα αναφοράς είναι γραμμένη σε C++ και διανέμεται με την άδεια Apache 2.0.

Σε αντίθεση με τη ριζικά επανασχεδιασμένη έκδοση του Lyra 1.2 που προτάθηκε τον Οκτώβριο, μεταφρασμένη σε μια νέα αρχιτεκτονική νευρωνικών δικτύων, η έκδοση 1.3 βελτιστοποιεί το μοντέλο μηχανικής εκμάθησης χωρίς αρχιτεκτονικές αλλαγές. Η νέα έκδοση χρησιμοποιεί ακέραιους αριθμούς 32-bit αντί για αριθμούς κινητής υποδιαστολής 8-bit για την αποθήκευση βαρών και την εκτέλεση αριθμητικών πράξεων, με αποτέλεσμα τη μείωση του μεγέθους του μοντέλου κατά 43% και την επιτάχυνση κατά 20% κατά τη δοκιμή σε smartphone Pixel 6 Pro. Η ποιότητα ομιλίας διατηρήθηκε στο ίδιο επίπεδο, αλλά η μορφή των μεταδιδόμενων δεδομένων έχει αλλάξει και δεν είναι συμβατή με προηγούμενες εκδόσεις.

Πηγή: opennet.ru

Προσθέστε ένα σχόλιο